Egyre több a magyar Google-mutáció

2006.12.13. 11:15

Egyre szaporodik azoknak a Google-mutációknak a száma, amelyek a magyar nyelv sajátosságait szem előtt tartva teszik lehetővé a keresést.

Egyre több magyar nyelvi sajátosságokat figyelembe vevő előkereső, és saját adatbázisból dolgozó más kutakodószolgáltatás működik a weben. Az igény érthető: a magyar úgynevezett ragasztó nyelv, azaz a ragokat a szavak végére illesztik, ráadásul a magas és mély vagy éppen a hosszú-rövid magánhangzók váltakozása befolyásolhatja a szótövet is. Nincs tehát egyszerű helyzetben az, akit például - mint azt a kutat.hu oldal példája mutatja - az alma, almák, almákat szavak mindegyike érdekli, de az almárium már nem, hiszen egész hosszú keresőkifejezést kell a Google-ba beírnia.

Forrás: [origo]



Sokan ugyanis nem tudják, de nem mindegy, hogyan írjuk be a keresőkifejezéseket. Ha például a Zrínyi szót írjuk be, találatként megkapjuk a Zrínyi Miklós Nemzetvédelmi Egyetemet éppúgy, mint a Zrínyi Ilonát említő weboldalakat - és természetesen számos iskolát, egyesületet, közterületet, hogy a történelmi tematikájú oldalakról ne is szóljunk. A Google felismeri az olyan jelöléseket, mint az idézőjel (például "Zrínyi Miklós Nemzetvédelmi Egyetem"), melynek használatakor csak a két idézőjel közt szereplő kifejezést tartalmazó weboldalakat mutatja. Ismeri az összeadásjelet, azaz ha a "+alma +körte" kifejezésre keresünk, minden olyan weboldalt kiad találatként, melyeken az alma és a körte szó egyaránt megtalálható - még akkor is, ha nem is egymás mellett van a két szó. És persze a minusz (-) jelet is "tudja", tehát ha egy szó elé beírjuk ("-barack"), akkor az almát, körtét tartalmazó oldalakat megmutatja, de a barackosokat akkor sem, ha amúgy az alma és a körte említve van.

A kis módszertani útmutató után jogos a kérdés: minek a magyar szavakra, ragozott alakokra külön keresőt indítani? Hiszen a fentiek értelmében az +alma +almák +almákat -almárium keresőkifejezésre magunk is megkapjuk a találatokat. Mint Bőszin Gyula, a kutat.hu megalkotója elmondta: a fentieknél több jelet is ismer a Google, de egyfelől nehéz ezeket pontosan beírni, könnyen elvéti az ember - például a "+"magyaros ételek" +magyar +konyha|étterem +Debrecen" kifejezés beírásánál könnyű hibázni (a | jel a vagylagosságra utal). Másrészt nem mindig jut az ember eszébe valamennyi ragozott, képzett alak, a kutat.hu mögötti - saját gyűjtésű - adatbázis azonban ebben is segítséget nyújt.

Forrás: [origo]

Hejesírás

Kicsit más a nevében a céljához képest ellentétes trendet tükröző hejes.szerver.org oldal funkciója. Aki használta már a Google-t egy-egy szó helyesírásának ellenőrzésére, azonnal tudja, miről van szó: beírjuk, hogy muszáj vagy muszály (egyébként pontos jé), és az oldal máris tájékoztat, melyik fordul elő gyakrabban. Vigyázat! Az egyébként ötletes szolgáltatás nem azt mutatja, melyik a pontos helyesírású kifejezés, hanem azt, hogy milyen az internetezők helyesírása. Így például megtudható, hogy a helyesen krikszkraksznak írt firkákat az internetes oldalak 97 százaléka x-szel írja - helytelenül.

A kutat.hu-hoz hasonló a keresőháló szolgáltatása is. Itt is egy, a Google-étól független adatbázis állítja össze a lehetséges szókapcsolatok, szinonimák listáját, amelyekből a keresést végzőnek kell összeválogatnia - többszintű keresgélést követően - a Google-hoz küldendő szavak listáját. A többjelentésű szavakra, magyar nyelvi különlegességekre is felkészült kereső használata azonban nem egyszerű: érdemes elolvasni a részletes leírást az első keresés előtt.

Pontosabb, de bonyolultabb

Hogy ezek a magyar nyelvi sajátosságokra specializálódott keresők széles körben népszerűvé válnak-e, az még kérdéses. Hiszen a Google épp az egyszerűségével vívta ki az internetezők szimpátiáját, a kifejezések pontosítása pedig néha bizony időigényes - igaz, a találatok relevánsabbak, mintha csak úgy beleirkálná az ember a Google-ba a szavakat. Az is tény, hogy az internetezők zöme nem használja azokat a legegyszerűbb jelöléseket sem, amelyek pedig pontosabb találatokat eredményeznének (az összeadás- és kivonás, valamint az idézőjelet). Ennél pedig a kutat.hu és a keresőháló még összetettebb.

Ugyanakkor ezek azok a szolgáltatások, amelyek olyan lehetőséget kínálnak, amelyek túlmutatnak az egyszerű betű- vagy karaktersorokkal azonos, színtiszta technikai jellegű kereséseken. Itt már a kereső szándékát próbálja megfejteni - bizonyos nyelvi szabályosságok, hagyományok figyelembevételével - a kiegészítő kereső, azaz értelmi kereséshez ad muníciót.

S hogy mi a véleménye minderről a Google-nak? Érdeklődésünkre Bagó Dániel, a Google hazai képviseletének sajtósa csak annyit nyilatkozott: egyelőre nincs hivatalos álláspont, de - és innen talányos a szándék - köszönik, hogy lapunk munkatársa felhívta figyelmüket a Google-előkeresőkre.

KAPCSOLÓDÓ CIKKEK