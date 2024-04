De ha idehoznának ezer könyvet a sporttörténészek, másik ezret a színháztörténészek, az azért lenne más, mert akkor egy-egy témakör mentén lehetne elkezdeni ezt a munkát.

De annak, hogy minden ponyvaregényt, minden tudományos könyvet, minden verseskötetet találomra digitalizálunk, annak nem látom értelmét.

Melyek azok a tartalmak, amelyeket a legtöbben keresnek az Arcanumon?

Az első helyen a sport áll, imádják az emberek. Hegedűs Csaba olimpiai aranyérme anno engem arra inspirált, hogy 1972-ben mindent összeszedjek a magyar olimpiai bajnokokról – Hajós Alfrédtól kezdve. De ott van a dobogóm a Színházi Élet is. Aztán rengetegen keresnek fotókat, hiszen ezekben is remek dolog elmerülni. Ha valaki kint volt 1974-ben a Vasas-Pécs NB I-es meccsen és most rábukkan ennek a meccsnek a képeire, biztosan talál magának olyat, amit szívesen megnéz.

Ugyanakkor – ki hinné – a hetvenes-nyolcvanas évek divatbemutatóinak résztvevői is keresik magukat.

Ki gondolta volna ezt? Ezzel együtt mi nagyon kicsik vagyunk, ha megnézi a newspapers.com oldalt, ott lassan közelednek az 1 milliárd feldolgozott oldalhoz. Ami lényeges: a legkeresettebb tartalmak között ott is mindig megtalálható a sport tartalom. Ez mindenképp jelzésértékű.

Az Arcanumnak van egy arcfelismerő rendszere. A GDPR-tilalomfák árnyékában nem kockázatos ennek a használata?

Két dologtól tarthatunk. Az egyik, hogy a képek egykori tulajdonosa felbukkan. A másik, hogy azok jelentkeznek, akik a képeken vannak. Erre volt pár vicces példa. A Tolna Megyei Népújságban 1975-ben egy járási távolugró versenyről közöltek képes riportot. Az egyik kép alatt azt írták: „íme, a duci távolugrónő.” Képzelje el, mit éreztem, amikor évtizedekkel később csengett a telefon és a vonal végén az egykori hölgy.

Digitalizálásra váró újságok az Arcanumban

Fotó: Csudai Sándor - Origo

Elmondta, hogy ő mér 1975-ben is reklamált a népújságnál, hogy tüntessék el a képet. Akkor nem járt sikerrel, mos igen. Egy másik: 1982-ben eladó ingatlant hirdettek a Népszabadságban.

Évtizedekkel később jelentkeznek, hogy már eladták. 40 évvel ezelőtt eltűnt egy 11 éves kislány. E-mailt ír, hogy már megkerült.

Egyszóval, nem árt nagyon óvatosnak lenni. Ilyenkor leveszem a képeket – főleg akkor, ha úgy érzem, hogy többet ártok, ha mégis fent hagyom őket. Úgy is mondhatnám, hogy eddig csak a Dörmögő Dömötör tudott bennünket megállítani.

Mai eszével újra belevágna ebbe a munkába?

Sokkal hamarabb elkezdeném. 1983-ban a Richter gyógyszergyár könyvtárában indult a pályafutásom. Akkoriban csomagkapcsolt hálózatnak nevezték azt, amit ma internetnek hívunk. Egy tekerős telefonon felhívtam a partnert, így teremtettünk egymással kapcsolatot. Én nagyon későn léptem be az internet világába és az előfizetői piacra is – ez utóbbi dátuma 2014 volt. Visszanézve fantasztikus volt az a számítástechnikai fejlődés, amit átéltem. De bevallom: mi mindenben 4-5 évet késtünk. Ám ennek mi nem mindig érezzük a hátrányát. Az amerikaiak az ötvenes években rossz minőségű mikrofilmekkel kezdték – most szenvednek a digitalizációval. Ebben mi tudunk nekik segíteni. Olykor a későn jövőknek is jut azért valami.

Az Arcanum 1989-ben indult, de mára ez alaposan kinőtte magát. Éppen ezért érdekes a kérdés, hogy nem érzi-e azt, hogy mára ez az egész lassan meghaladja a Biszak-család erejét? Mintha egy megáradt folyót néznénk, ami egyre inkább kilép a medréből.

Idén megyek nyugdíjba, 65 éves leszek, van 5 gyermekem. Előd fiam tette az egész vállalkozást világszínvonalúvá. Európában néhány ország van, ahol ez hasonlóan megy, de 1000 kilométeres körzetben nincs ilyen, mint az Arcanum. A mi mostani nagy találmányunk a lapok szegmentálása, a „Newspaper Segmentation”.

Ha ezt valaki beírja a Google-be, bennünket dob ki elsőnek.

Ez alapján kaptunk egy megkeresést az Egyesült Államokból, Utah államból. Néhány héttel később itt ültek a mormon befektetők – magunk sem hittük el. Amerikában nagyméretű A2-es újságok vannak. A szövegfelismerést nem tudták elvégezni, mert nem tudták az oldalakat szegmentálni. Mi igen. Mi a technológiánkat átadtuk nekik, de a mormonoknak 300 millió feldolgozott oldaluk van, ami a mi segítségünkkel újra feldolgoznak. Ha így nézem, a folyó tényleg kilépett a medréből. A mormonoknak amúgy egészen különleges kéréseik is voltak.

Mik?

Hogy szűrjük ki az ő 300 millió újságoldalukból az anyakönyvi híreket. Mert a mormonok a világ összes anyakönyvét gyűjtik. Náluk mindenki mormon lesz, aki bekerül az ő anyakönyvükbe. Hinné, hogy 1962-ben itt voltak Budapesten, hogy begyűjtik az összes magyar anyakönyvet, miközben ők mikrofilm olvasókat és egyéb gépeket ajándékoztak hazánknak. Számos magyar anyakönyv azért van ma meg, mert a mormonok megtalálták és megőrizték őket mikrofilmeken. Aztán most digitalizálják. Elhagyott falusi parókiákról, templomokból kerültek elő anyakönyvek, amelyek minden bizonnyal az ebek harmincadjára jutnak, ha nem mentik meg ezeket. Ez egészen döbbenetes sztori.

A mesterséges intelligencia megjelenése hogyan érinti a munkájukat?

Itt lép be a legújabb fejlesztésünk, amely arról szól, hogy a Chat GPT-vel hogyan lehet összekapcsolni a mi adatbázisunkat. A Chat GPT-ről sok minden rosszat elmondanak, a legnagyobb hibája, hogy hazudik, azaz tudományosan megfogalmazva, hallucinál. Mi azt mondjuk, hogy meg lehet neki mutatni a forrást. A Chat GPT még soha nem mondja meg a forrását – titkolja. Olyan ez, mint a Coca-cola receptje.

Biszak Sándor, az Arcanum alapítója

Fotó: Csudai Sándor - Origo

Nem fedik fel a titkaikat, mert nem áll érdekükben. Az lenne az üdvös, ha megmutatná a forrást – ebben segítünk neki, hogy megadjuk a számára a forrásokat. Magam is kíváncsi leszek arra, mi jön ki ebből. Nekünk most a legnagyobb probléma az anyagok beszerzése. Ezzel kell dolgozzunk a legtöbbet, hiszen fizikailag ide kell hozni az újságokat. Több száz kilométerről is.

Mi 30 éve folyamatos fejlődésben vagyunk.

Jelenleg mintegy 13 ezer magánelőfizetőnk van, ami az intézményeket illeti, ott 250-300 előfizetőnk van. Hogy hol van ennek a vége? Nem tudom. A határ a csillagos ég – jó lenne eljutni oda. De néha meg azt érzem, hogy már régen a csillagok között utazunk.