Betűvel, számmal a spamrobotok ellen

Vágólapra másolva!
Néhány éve találkozni némelyik weboldalon olyan képekkel, amelyek nehezen olvasható betűket és számokat mutatnak: továbblépni csak akkor lehet, ha ezeket beírja a látogató a megfelelő rubrikába. Ez a captcha, a spammerek elleni védekezés legnépszerűbb megoldása.
Vágólapra másolva!

Ki ne látott volna olyan fórumot, ahol a hozzászólások helyén pornográf oldalakra mutató linkek vannak, vagy éppen ilyen-olyan honlapok kéretlen reklámjait írták be a fórumozók? Ez nem tilos - hacsak a fórum saját szabályzata nem tiltja -, tehát az e-mailben érkező spamekkel szemben ilyen esetekben nem kérhető hatósági segítség. Nem marad más, mint a fórum üzemeltetőjének, moderátorainak "kézi" beavatkozása, azaz egyenként törölgetni az oda nem illő hozzászólásokat.

Ez azonban nemcsak korszerűtlen "favágómunka", hanem néha sziszifuszi is: a bejegyzéseket ugyanis nem feltétlenül emberek, hanem robotok, azaz az oldalukat reklámozni akarók által írt, vagy íratott szkriptek viszik fel az oldalra. Mialatt a moderátor kitöröl egy ilyen hozzászólást, a robot beír öt másikat. De nem csak a fórumozókat bosszanthatják a spamrobotok, hanem azoknak az internetes adatbázisoknak az üzemeltetőit is, akik nem szeretnék, ha az összes adatot kilistáznák, és robotok szedegetnének le információkat. Ilyen lehet minden olyan adatbázis, amelyik nyilvános, és érzékeny adatokat - például e-mail címeket -tartalmaz.

Felbomolhatnak a közösségek

Míg a hazai fórumok, adatbázisok viszonylag biztonságban vannak a szűk nyelvi közeg és a kis piac miatt, az angol (vagy bármilyen világnyelvi) fórumok, blogfarmok potenciális áldozatai a kéretlen bejegyzéseknek. Persze, a spamrobotok gyakran nem válogatnak, mindegy milyen a honlap nacionáléja, a szexet mindenki szereti, érdemes tehát hirdetni. A jelenség azonban nem egyszerűen bosszantó, hiszen egy szájt körül nagy nehezen kialakított közösség könnyen felbomolhat, ha az általuk használt fórum, vagy egy blog hozzászólásai közé rendszeresen pornó- vagy kereskedelmi oldalak linkjei keverednek. A sok "szeméttől" ugyanis elmegy a kedve a látogatóknak szájt használatától, hiszen nem látja a többiek hozzászólásait, csak a selejtet. Mivel pedig nem tudják tartani egymással a kapcsolatot a látogatók, hamar felbomolhat a közösség.

Mint Nemes Dániel, a filter:max nevű, internetbiztonsági szoftvereket forgalmazó cég vezetője elmondta: a captcha névre hallgató biztonsági ötlet viszonylag új, két-három éve kezdtek tömegesen működni a spamrobotok, nagyjából azóta látni itt-ott felismerendő képeket. Az erre kidolgozott, és egyre több helyről visszaköszönő módszer, hogy egy olyan azonosításhoz kötik a regisztrációt, vagy a hozzászólást, amit a robot nem ismer fel, csak egy ember. Tipikusan ilyen az, amikor megjelenik egy kép, amin betűk- és számok olvashatók, az üzenet (vagy regisztráció, adatlap) elküldésekor ezt be kell írni.

Az ember is rosszul olvassa

Ezek a betűk-számok többnyire igen rosszul olvashatók, de nem véletlenül. Az azonosítást egy képfelismerő robot is el tudja ugyanis végezni, ha szabványos az írás. Ám ha tele van a kép pöttyökkel, vagy hullámosak, recések a betűk, akkor jó esély van arra, hogy tényleg csak egy ember tudja elolvasni és beírni a kódot, a robot már nem. Persze, itt örök versenyfutás kezdődik: a képfelismerőket egyre újabb trükkök kijátszására tanítják meg, a szolgáltatók pedig egyre randább, olvashatatlanabb betűkkel és számokkal próbálják meg távoltartani a szkripteket.


Nehezen olvasható betűk: ez a captcha

Ez persze előbb-utóbb az emberi értékelés rovására megy: a domain.hu oldalon, vagy az elektronikus kormányzat cégkeresőjében már ma is olyan nehezen felismerhetők a jelek, hogy néha már-már kitalálhatatlan, milyen betű vagy szám szerepel a képen. Ezekben az esetekben nem a közösséget, hanem az adatok nagytömegű lekérdezésétől óvja meg a képes azonosítás az üzemeltetőt - és persze néha bosszantja a látogatókat a nehézkesen felismerhető kép.

Nemes szerint a spammerek a képfelismerő szoftverekkel egyre magasabbra teszik a lécet, valószínű tehát, hogy a szövegek is egyre felismerhetetlenebbek lesznek. A szakember szerint egyre inkább az a tendencia érvényesül, hogy egyetlen regisztrációval számos szolgáltatáshoz egyszerre férnek hozzá a látogatók. Ilyen például a Freemail, az [origo] fóruma és a Klip, de az Index fóruma, és az Indavideó, Indafotó oldalak is, ahol egyetlen regisztrációval lehet hozzáférni többféle szolgáltatáshoz. A regisztráció központosításával ugyan kevesebb erőfeszítéssel lehet több oldalról kiszűrni a robotokat, de persze ha majd odáig jut a szkriptek fejlettsége, hogy kijátssza ezeket a technikákat, akkor egyszerre több helyen okozhatnak bajt az erőszakos hirdetők.

A captchán túl

A captchán kívül van néhány jópofa megoldás még, amivel találkoztunk. Ezek ugyanarra az elvre épülnek: mindenképpen kell hozzá az ember közreműködése: vagy a feladat értelmezésében, vagy a teljesítésben, vagy mindkettőben. Egy, a Unix rendszerekkel foglalkozó szakportál, a hup.hu fórumához például csak e-mailben lehet regisztrálni, a levél feladójának címe nem lehet a legismertebb - és a spammerek által is előszeretettel használt - ingyenes postafiók szolgáltatásnál gondozott cím, a levélbe pedig - betűvel - le kell írni egy egyszerű matematikai feladat végeredményét is. A szigorú szintaktikához kötött regisztráció körülményességére (vagy saját ügyetlenségünkre) jellemző, hogy rovatunk munkatársai kétszer buktak bele a procedúrába, tehát alátámaszthatjuk: robot nemigen jutna át a szűrőn.

Egy magyar informatikus, Lénárd Gábor pofonegyszerű ötlete - ami ráadásul ingyen bocsátott a honlapgazdák rendelkezésére - azon alapul, hogy az az egyszerű, magyarul elhangzó kérdés, hogy milyen nap van ma, túl bonyolult válaszlehetőségeket nem ad, egy robot viszont nem valószínű, hogy ilyesmit "észben tart". A Milyen nap van ma? nevű plugin a WordPress blogszoftverhez készült és azok használhatják, akik a kommentelési lehetőséget nem akarják regisztrációhoz kötni, de a kéretlen üzenetekből sem kérnek (és persze kicsit értenek a honlapok kódolásának rejtelmeihez).

Szinte bájosnak nevezhető a Hálózsák nevű képregényes oldal üzemeltetőinek védekezése. Itt nem a robotoktól féltik az oldalt, hanem azt akarják megelőzni, hogy az erotikus, vagy durva jeleneteket tartalmazó képregényekhez 18 évnél fiatalabbak is hozzáférjenek. Annyira komolyan gondolták - az egyébként gyakran csak a 18. év betöltését számonkérő, ám a választ senki által nem ellenőrzött - közismert belépőoldali funkciót, hogy egy olyan kérdést tesznek fel, amire a választ valóban csak a 18 évnél idősebbek tudhatják (elméletben persze bárki). Egy nyolcvanas évekbeli sláger előadójára, illetve egy ugyanabban az időben sugárzott gyermekműsor hősére rákérdező űrlap csak azt engedi túl, aki helyesen válaszol. Ez a védelem messze van ugyan a tökéletestől - egy egyszerű Google-ös kereséssel felkutatható a válasz -, de a tétje sem túl nagy.