Biszak Sándor alapító és cégvezető mesélt a családi vállalkozásként működő, és az elsősorban a több száz évre visszamenőleg fellelhető dokumentumok digitalizálásával foglalkozó, mesterséges intelligenciát is felhasználó Arcanum csodabirodalmáról, amely lassan kinövi a többemeletes családi ház munkahelyi és raktározási kereteit.

Vigyázat, függőséget okoz!" Ez lehetne a mottója az Arcanum Adatbázis vállalatnak. Biszak Sándor ügyvezető igazgató segítségével bemutatjuk a már három évtizede változatlan lelkesedéssel, ám folyamatos fejlődéssel, családi vállalkozásban működő adatbázis-birodalmat.

Az Arcanum Adatbázis Kiadó székháza: nagyszerű dolgok történnek az épületbenFotó: Csudai Sándor - Origo

Magyarországon a lapkiadás 1780-ban indult, az Arcanum ebbe a korba képzeletben visszatérve archiválja a beszerzett dokumentumokat. A cél, hogy egészen napjainkig feltölthessenek minden papíralapú dokumentumot (folyóiratot, térképet, lexikont) hazánkról.  Ez egyébként komoly hozzájárulásnak tekinthető a környezetvédelmi törekvésekhez, és így a bolygónk megmentéséhez is.

Jelenleg már több mint 35 millió oldalnyi dokumentumot vittek fel az online térbe. Nemcsak Magyarországról, hanem a Kárpát-medencéből is nagyon sok magyar nyelvű lapot őriz és tesz elérhetővé a vállalat digitálisan, elsősorban Erdélyből, a Felvidékről és a Délvidékről. De máshonnan is: például az Egyesült Államokban a legnagyobb magyar nyelvű dokumentumokat őrző könyvtár New Brunswick városában található. Innen is hazakerült a teljes folyóirat-állomány, annak érdekében, hogy digitalizálják.

A Szabad Sajtó egyik számaFotó: Csudai Sándor - Origo

Érdekességként megemlítendő, hogy az adatbázisban szakdolgozatok is megtalálhatóak. De vannak a cég adattárában Magyarországon megjelent idegen nyelvű lapok is, mint például a XIX. század közepétől Pesten megjelenő Pester Llyod, vagy a magyarországi németek lapja, a Neue Zeitung.

Biszak Sándor, az Arcanum Adatbázis Kiadó igazgatójaFotó: Csudai Sándor - Origo

Az Arcanum bevétele folyamatosan növekszik, és a jövedelmezőség is lehetővé teszi, hogy egyre nagyobb projekteket tudjon menedzselni. Elképesztően nagy a kereslet a régi korok dokumentumai, térképei iránt – ekkora sikerre az alapító álmában sem számított. A cég fontos ügyfelei a legnagyobb magyar hírportálok, de a teljes magyar felsőoktatói, kutatói és közgyűjteményi szféra is előfizet az adatbázisra, ahogy igen jelentős számú magánszemély is. Jelenleg 25-30 embert foglalkoztatnak, segítségükkel havonta mintegy másfél millió oldalt, évente pedig ötvenezer kötetet archiválnak a családi ház falai között.

A digitalizálás menete

A kultúránk akkor fejlődhet, ha a múltunkat, közös tudásunkat és identitásunkat hordozó emlékeinkből minél többet tudunk eljuttatni a lehető legtöbb emberhez; s mindezt úgy, hogy a befogadókban a továbbgondolkozás igényét is elősegítjük"  – ez a gondolat a cég nem hivatalos ars poeticája.

A vállalat bemutatása a raktárban vette kezdetét, hiszen minden dokumentum itt landol a feldolgozás előtt. Ezeket egyetemi-megyei könyvtáraktól, levéltáraktól, gyűjtőktől vagy selejtezés során szerzi be a cég. A kincset érő, nehezen fellelhető, csak rövid ideig kiadott szórványlapokat gyakran előfizetőktől, magánszemélyektől kapják.

Az Arcanum raktáraFotó: Csudai Sándor - Origo

Az Arcanum kétfajta nagy rendszert épít, az egyik a digitális tudománytár, a másik a Hungaricana.  Az előbbi jelöli az összes archivált folyóiratot, könyvet, hírlapot, magazint, lexikont. A Hungaricana egy nagyon speciális rendszer, ennek bemutatására később térünk át.

A digitalizálás többlépcsős folyamat. A beérkezett, kötött dokumentumokat a hozzáférhetővé tétel során lapokra bontják a cég munkatársai.

A beérkezett folyóirat lapokra bontásaFotó: Csudai Sándor - Origo

Látogatásunk során a bemutatott hatalmas régi dokumentumot vastag szögekkel tartották egyben, ezeket úgy kellett eltávolítani, hogy maga a könyv ne sérüljön. Ez nagyon érzékeny feladat. Ez az úgynevezett állagmegóvási munka.

Az állagmegóvás folyamataFotó: Csudai Sándor - Origo

Ezután következik a dokumentumok szkennelése a megfelelő munkagéppel. A dokumentum mérete szerint háromféle szkennerrel dolgozik a vállalat.

A nagyméretű folyóiratok szkenneléseFotó: Csudai Sándor - Origo

Mivel a szkennelés során csupán kép formátumban kerülnek a digitális térbe a különféle dokumentumok, így a következő lépés, hogy ezeket szövegként ismerje fel a rendszer. Ez teszi majd lehetővé a szókeresést, de a szöveg átvételét is az előfizető, kutató számára.

Pici könyvek szkenneléseFotó: Csudai Sándor - Origo

Vannak olyan programok, amik a képből szöveget generálnak. Kétrétegű pdf-állomány készül, felül van a kép, alatta pedig a szöveg.

Cikkünk további izgalmas részlettel a következő oldalon folytatódik. Kérjük, lapozzon!