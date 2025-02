A generatív mesterséges intelligenciás chatbotok köztudatba való berobbanását követően gyorsan közismertté vált, hogy a mögöttük álló nyelvi modelleket készített vállalkozások kérés és kérdés nélkül szinte mindent elloptak az internetről. A működésre bírásukhoz a cégeknek először be kell tanítaniuk a modelleket, gigantikus mennyiségű írott anyagra van szükségük, így szerzői jog által védett cikkektől és könyvektől kezdve a közösségi médiás kommentekig mindent lemásoltak, amihez hozzáfértek.

Azzal érvelnek a generatív MI-s cégek az internet lekalózkodásának ügyében, hogy a modelljeik nem képesek az eredeti formájukban visszaadni a betanításra használt, jogvédett műveket

Fotó: Mateusz Dach / Pexels

Ebből természetesen számos szerzői jogi per kerekedett, most éppen egy könyvszerzők által a Meta ellen indított per iratai kerültek részlegesen nyilvánosságra. A Meta által leadott dokumentumok és belsős kommunikációk alapján a Llama betanításához a cég kalóz internetes archívumokból több tízmillió kötetre való, bő 81 terabájtnyi könyvet torrentezett le.

A belsős kommunikációk alapján a helyzettel nem mindegyik dolgozó volt kibékülve. Egyesek elvi alapon kifogásolták a kalózkodást, míg mások felhívták rá a figyelmet, hogy a kalózkodás közismerten a Metához tartozó, nyilvános IP-címekről történik. Volt aki azt írta a menedzserének, hogy a tartalmak letöltése jogi értelemben talán még belefér, de a tartalmak más letöltőknek való továbbosztása (kalóz nyelven seedelése) már biztosan illegális.

A belső e-mailekben a dolgozók több alkalommal is egyértelműen jelét adták annak, hogy tudatában voltak a kalózkodásnak, a per során ezeknek a nyilvánvaló beismeréseknek bizonyító szerepük lesz.

A dokumentumok alapján könyvek torrentezése 2024 áprilisában még folyamatban volt. Az nem derült ki a dokumentumokból, hogy Mark Zuckerberg vajon tudott-e a Metán belül folyó, ipari méretű kalózkodásról.

