Az AltaVizsla már több mint két éve járja szorgalmasan a magyar webet, összegyűjt minden weboldalt, feljegyzi az oldalakon szereplő kulcsszavakat - ezt hívják a szakemberek indexelésnek. Az adatbázis éjjel-nappal épül, napról napra frissül, vagyis a szó szoros értelmében naprakész. Ám a magyar internetet böngészők százezrei - közülük is elsősorban azok, akik a nagy külföldi keresőket is használják - jól tudják, hogy ez csak egy lehetőség a sokféle keresési mód közül.
A fejlesztés irányai
Az AltaVizsla továbbfejlesztése két irányban indult el több mint egy évvel ezelőtt. Az egyik egy jól ismert eszköz: az, amit webkatalógusnak szokás nevezni. A másik egyedülállóan új: ez a tezaurusz. Mindkét szolgáltatás más-más fajta segítséget ad, vagyis az új AltaVizslában - ha a régi, indexelt adatbázis alapján végzett keresést is ide számítjuk - mostantól három önállóan is, illetve együtt is használható "részegység" együttműködése támogatja a minél hatékonyabb keresést.
A fejlesztést komoly kutató- és tervezőmunka előzte meg: ki kellett dolgozni és fel kellett építeni a katalógus elméleti hátterét adó, jelenleg mintegy 1800 osztályt tartalmazó osztályozási rendszert, ugyanakkor - ezzel párhuzamosan és a lépéseket összehangolva - létre kellett hozni a körülbelül 15 ezer kifejezést tartalmazó tezauruszt is. (Bizonyára sokan nem ismerik a tezaurusz fogalmát: lejjebb, illetve az új AltaVizsla súgóban lehet olvasni rövid ismertetőt, ám a legjobb, ha mindenki maga próbálja ki.)
A fejlesztési munka harmadik irányát a magyar weblapok tematikus gyűjtése jelentette. Ebben is támaszkodni lehetett a tezauruszra, de éppen emiatt a vállalkozás szinte lehetetlennek tűnt: a kulcsszavak alapján automatizált gyűjtés eredményeként létrejött egymilliós adatállományt kellett "megtisztítani" és katalógusba rendezni. (A most nyilvánosságra kerülő katalógus bizony még sok helyen őrzi ennek nyomait, a tisztogatás nem ért véget, a tesztváltozatban előfordulnak olyan adatok is, amelyekről nehezen érthető, hogy miért éppen abba az osztályba kerültek.)
A katalógus
Az új AltaVizsla webkatalógusa hasonlít ahhoz, amit a Yahoo-használók már jól ismernek. Az új katalógusban a weblapokat és weboldalakat a szerkesztők tematikus szempontok szerint osztályokba sorolják, egy-egy weblap több osztályba is bekerülhet.
Találatok a katalógusban |
A tematikus osztályokban történő lépegető-barangoló keresést elsősorban azok szeretik, akik nem egy-egy konkrét szó előfordulására kíváncsiak - hiszen ezt a legpontosabban és leggyorsabban a "hagyományos" AltaVizsla tudja úgyis megmondani -, hanem akik egy-egy konkrét témakörre kíváncsiak.
Ha például az új AltaVizslában valaki azt akarja megnézni, hogy vannak-e tájékozódási futással foglalkozó magyar weblapok, akkor az egyik lehetőség, hogy belép a katalógusba, és a Szórakozás, pihenés, sport főosztályból elindulva, néhány kattintás után - Sport - Atlétika - eljuthat a Tájékozódási futás osztályba, ahol talál is néhány weblapot. A tájfutók ma még természetesen azonnal látni fogják, hogy bár már most is van jó néhány találat az osztályban, de sok még hiányzik. Ilyenkor érdemes regisztráltatni a még nem szereplő, de az adott osztályba illő weblapokat.
A katalógus azoknak is segíthet, akiknek eddig problémát jelentett, hogy a beírt keresésre sok-sok hasonló, gyakran kevéssé értékes találattal válaszol a kereső. Ilyenkor is érdemes a katalógusban körülnézni.
A katalógus olyan, mint egy élő szervezet: állandóan bővül, változik, finomodik - nemcsak a tartalma, hanem a szerkezete is. Vannak témák, melyek a lehető legnagyobb részletességgel lettek feldolgozva, és vannak olyanok, amelyek még jócskán finomíthatók, újabb osztályok, alosztályok létrehozását igénylik. Az AltaVizsla fejlesztői és szerkesztői itt is számítanak a webes közönség ötleteire, javaslataira. Jó katalógust csak közösen lehet építeni, példa erre a Netscape Search, melynek folyamatos építésén egyszerre több ezren dolgoznak együtt a netscape-es csapattal.
Az AltaVizsla Tezaurusz
A tezaurusz speciális szótár, amely jelenleg körülbelül tizenötezer szóra tartalmaz egy sor kapcsolódó kifejezést: szinonimát vagy általánosabb fogalmat, speciálisabbat, illetve olyanokat is, amelyek valamilyen más módon kapcsolatba hozhatók a keresőszóval.
Az AltaVizsla Tezaurusz |
Ha például a légisport szóval keresünk, akkor az AltaVizsla - mivel ezt a szót megtalálta a tezauruszban - az alábbi javaslatokkal próbálja meg javítani, még pontosabbá tenni a keresést: ajánl a légisport szóhoz kapcsolódó további rokon értelmű kifejezéseket (légiforgalom, repülés), javasol általánosabb, átfogóbb (sport) és speciálisabb, szűkebb (ejtőernyősport, műrepülés, sárkányrepülés, vitorlázó repülés) keresőkifejezést. Ezeken kívül ajánl olyan szavakat is, amelyek a légisporttal más módon, például feltételként függnek össze, vagy valamilyen egyéb, távolabbi értelemben rokonságban állnak: repülőgép, repülőnap, sétarepülés. (Bővebb tájékoztatást ad az új AltaVizsla súgó megfelelő fejezete.)
A tezaurusz persze csak akkor tud ajánlani valamit, ha megtalálja azt, amit keresőkérdésként megadtunk. Ha nem talál semmit, akkor sem hallgat, hanem kiírja szólistájának azt a részét, amelyik az ábécé szerint a keresőszóhoz legközelebb áll. Ha pedig a katalógusban barangolunk, akkor a tezaurusz azt írja ki, hogy saját bejegyzései közül melyek azok, amelyek jelentése a legközelebb áll az adott katalógusosztály tartalmához.
A tezauruszhoz hasonló szolgáltatása a nagy külföldi keresőknek is van, például az AltaVista úgynevezett Related Searches listája hasonló, de más a belső logikája - vagyis ha bővebb is, mint a magyar AltaVizsla tezaurusza, mégis másképp gondolkozik, mondhatjuk, hogy a "fantáziája" szegényebb, ötletei valamivel egysíkúbbak, mint az AltaVizsla tezauruszáé.
Keresési módok az új AltaVizslában
Természetesen nem kell előre eldönteni azt sem, hogy a "régi" keresőt akarjuk-e használni vagy az új katalógust. Elég, ha beírjuk a keresőkérdést, és erre az új AltaVizsla egyszerre fogja feltálalni mindazt, amit talált.
A megszokott találatok az új Vizslában |
Ha szerencsénk van, három fogást is letesz az asztalra: az indexből nyert találatokat, a katalógusban talált osztályokat és a tezaurusz javaslatait. Sőt: átjárást kínál az [origo]-ba és a FókuszOnline könyváruházba is, hátha ott (is) van találat ugyanezzel a keresőszóval.
Ezen a közös találati oldalon dönthetjük el, merre tovább. Ha a régóta megszokott találatokra vagyunk kíváncsiak, ott a lista, ugyanúgy, mint eddig, lehet továbblapozni. Fölötte látható, hogy talált-e az AltaVizsla olyan osztályt vagy osztályokat a katalógusban, amelyek megfelelnek a beírt keresőkérdésnek. Az osztályokat a hozzájuk vezető "utakkal" együtt jeleníti meg, akár a Yahoo, vagyis ha valaki inkább az eggyel "feljebb" lévő osztály tartalmára kíváncsi, erre is kattinthat.
Katalógusosztály a hozzá vezető úttal |
A fejlesztők számára a legnagyobb kihívást az jelentette, hogy tudták: egy keresőszolgáltatás annál jobb lesz, minél inkább sikerül kitalálni az ügyfél gondolatát, minél több módon tudják segíteni az egyre gigantikusabbá váló webes információözönben az eligazodást.
Ezek csak az első lépések, sok múlik azon, hogy a közönség mennyire fogja elfogadni az új keresési módokat és mennyire érzi hasznosnak a felkínált új szolgáltatásokat. Szerencsére azok se járnak rosszul, akik ragaszkodnak a régihez, mert ez továbbra is mindenkinek a rendelkezésére áll, lényegében változatlan formában. A fejlesztő-szerkesztő csapat érdeklődéssel várja a tesztidőszak alatt az észrevételeket.
A MATÁVnet Kft. a nyilvános tesztidőszak után indítja el az [origo] keresőszolgáltatását, az új AltaVizslát.
(Kárpáti András)
Ajánló:
A talán legbővebb tartalmú katalógus
Korábban:
Nyilvános tesztváltozat