Ott következik az Arcanum, ahol a világ legnagyobb keresőmotorjának véget ér a tudása

Arcanum Adatbázis Kiadó
Vágólapra másolva!
Biszak Sándor alapító és cégvezető mesélt a családi vállalkozásként működő, és az elsősorban a több száz évre visszamenőleg fellelhető dokumentumok digitalizálásával foglalkozó, mesterséges intelligenciát is felhasználó Arcanum csodabirodalmáról, amely lassan kinövi a többemeletes családi ház munkahelyi és raktározási kereteit.
Vágólapra másolva!

Ez lehetne a mottója az Arcanum Adatbázis vállalatnak. Biszak Sándor ügyvezető igazgató segítségével bemutatjuk a már három évtizede változatlan lelkesedéssel, ám folyamatos fejlődéssel, családi vállalkozásban működő adatbázis-birodalmat.

Az Arcanum Adatbázis Kiadó székháza: nagyszerű dolgok történnek az épületben Fotó: Csudai Sándor - Origo

Magyarországon a lapkiadás 1780-ban indult, az Arcanum ebbe a korba képzeletben visszatérve archiválja a beszerzett dokumentumokat.

A cél, hogy egészen napjainkig feltölthessenek minden papíralapú dokumentumot (folyóiratot, térképet, lexikont) hazánkról.

Ez egyébként komoly hozzájárulásnak tekinthető a környezetvédelmi törekvésekhez, és így a bolygónk megmentéséhez is.

Jelenleg már több mint 35 millió oldalnyi dokumentumot vittek fel az online térbe. Nemcsak Magyarországról, hanem a Kárpát-medencéből is nagyon sok magyar nyelvű lapot őriz és tesz elérhetővé a vállalat digitálisan, elsősorban Erdélyből, a Felvidékről és a Délvidékről. De máshonnan is: például

az Egyesült Államokban a legnagyobb magyar nyelvű dokumentumokat őrző könyvtár New Brunswick városában található.

Innen is hazakerült a teljes folyóirat-állomány, annak érdekében, hogy digitalizálják.

A Szabad Sajtó egyik száma Fotó: Csudai Sándor - Origo

Érdekességként megemlítendő, hogy az adatbázisban szakdolgozatok is megtalálhatóak. De vannak a cég adattárában Magyarországon megjelent idegen nyelvű lapok is, mint például a XIX. század közepétől Pesten megjelenő Pester Llyod, vagy a magyarországi németek lapja, a Neue Zeitung.

Biszak Sándor, az Arcanum Adatbázis Kiadó igazgatója Fotó: Csudai Sándor - Origo

Az Arcanum bevétele folyamatosan növekszik, és a jövedelmezőség is lehetővé teszi, hogy egyre nagyobb projekteket tudjon menedzselni.

Elképesztően nagy a kereslet a régi korok dokumentumai, térképei iránt

– ekkora sikerre az alapító álmában sem számított. A cég fontos ügyfelei a legnagyobb magyar hírportálok, de a teljes magyar felsőoktatói, kutatói és közgyűjteményi szféra is előfizet az adatbázisra, ahogy igen jelentős számú magánszemély is. Jelenleg 25-30 embert foglalkoztatnak, segítségükkel havonta mintegy másfél millió oldalt, évente pedig ötvenezer kötetet archiválnak a családi ház falai között.

A digitalizálás menete

– ez a gondolat a cég nem hivatalos ars poeticája.

A vállalat bemutatása a raktárban vette kezdetét, hiszen minden dokumentum itt landol a feldolgozás előtt. Ezeket egyetemi-megyei könyvtáraktól, levéltáraktól, gyűjtőktől vagy selejtezés során szerzi be a cég. A kincset érő, nehezen fellelhető, csak rövid ideig kiadott szórványlapokat gyakran előfizetőktől, magánszemélyektől kapják.

Az Arcanum raktára Fotó: Csudai Sándor - Origo

Az Arcanum kétfajta nagy rendszert épít, az egyik a digitális tudománytár, a másik a Hungaricana.

Az előbbi jelöli az összes archivált folyóiratot, könyvet, hírlapot, magazint, lexikont. A Hungaricana egy nagyon speciális rendszer, ennek bemutatására később térünk át.

A digitalizálás többlépcsős folyamat. A beérkezett, kötött dokumentumokat a hozzáférhetővé tétel során lapokra bontják a cég munkatársai.

A beérkezett folyóirat lapokra bontása Fotó: Csudai Sándor - Origo

Látogatásunk során a bemutatott hatalmas régi dokumentumot vastag szögekkel tartották egyben, ezeket úgy kellett eltávolítani, hogy maga a könyv ne sérüljön. Ez nagyon érzékeny feladat. Ez az úgynevezett állagmegóvási munka.

Az állagmegóvás folyamata Fotó: Csudai Sándor - Origo

Ezután következik a dokumentumok szkennelése a megfelelő munkagéppel. A dokumentum mérete szerint háromféle szkennerrel dolgozik a vállalat.

A nagyméretű folyóiratok szkennelése Fotó: Csudai Sándor - Origo

Mivel a szkennelés során csupán kép formátumban kerülnek a digitális térbe a különféle dokumentumok, így

a következő lépés, hogy ezeket szövegként ismerje fel a rendszer.

Ez teszi majd lehetővé a szókeresést, de a szöveg átvételét is az előfizető, kutató számára.

Pici könyvek szkennelése Fotó: Csudai Sándor - Origo

Vannak olyan programok, amik a képből szöveget generálnak. Kétrétegű pdf-állomány készül, felül van a kép, alatta pedig a szöveg.

Cikkünk további izgalmas részlettel a következő oldalon folytatódik. Kérjük, lapozzon!