Mi történik, ha a gépek rosszul emlékeznek ránk?
Honnan és mit tud rólunk a mesterséges intelligencia? Miért lehet óriási tétje annak, hogy a magyar történelemről, kultúráról és társadalomról milyen tudással rendelkezik?
Mit tekintünk hiteles információforrásnak? Húsz évvel ezelőtt még könyvtári cédulákat lapozva válogattam, mi lehet a kutatási témám szempontjából releváns ismeret, majd otthonról is elérhetővé vált egyre több fontos mű digitalizált változata, és az új kutatási eredmények azonnal hozzáférhetők lettek, bár eleinte súlytalannak hatott, ha valamit csak online publikáltak. Képtelen vagyok felidézni, mikor változott ez meg – nem a kiadói gyakorlatban, hanem a saját gondolkodásomban. Ugyanígy nehezen tudnám tetten érni, hogy a közösségi média az ismerősi hálózat jópofa összekapcsolódásából mikor vált számomra valóban médiává, és a tájékozódás egyik legfontosabb terepévé.
Nem emlékszem, hogyan történt – valószínűleg jó ideig fel sem tűnt –, hogy algoritmusok igazítják az érdeklődési körömhöz azt, hogy milyen hírek, fotók, emberek, reklámok kerülnek a szemem elé a képernyőn.
Mára sokak számára a mesterséges intelligencia lett az elsődleges információforrás, hiszen rengeteg időt spórol a közérthető, leegyszerűsített összegzésekkel. Ez az aprónak tűnő szemléletváltás felülírhatja azt, ahogyan eddig a médiát használtuk. Egyre közelebb sodródhatunk ahhoz, hogy ne olvasóknak írjunk, hanem nyelvi modellek „ízlése” szerint építsük fel a mondanivalónkat. De hogy éppen mit tart relevánsnak egy nyelvi modell, a mesterséges intelligencia jobban tudja, tehát kézenfekvő vele megíratni azt, amit majd jó eséllyel összegzésre méltónak ítél egy másik nyelvi modell, amelyik rövid kivonatot ír erről egy embernek. Hova vezet ez? Valószínűleg szeméthegyekhez, amelyek idővel beborítanak és elfednek mindent, amit korábban szellemi otthonunknak tartottunk vagy valóságként ismertünk.
A nyelvi modell által kreált „praktikus” tartalom olyan a kommunikációban és a kreatív iparágban, mint a műanyag a valós világunkban. Olcsó, gyorsan gyártható, nehezen eltakarítható szemét, amely mikroműanyagként befészkeli magát akár az agysejtjeink közé is.
Ahogy ma már szinte luxus a tiszta és megfelelő tápanyagtartalmú élelem, mert csak sok pénzért vagy rengeteg és következetesen elvégzett munka árán lehet hozzájutni, úgy válhat hamarosan luxussá a tiszta és összetett gondolat.
Irdatlan sok adat van még, amelyhez nem fér hozzá a mesterséges intelligencia, hiszen az emberi tudás összessége nem lelhető fel a világhálón, sem a digitális térben. Az MI csupán valószínűségeket és mintázatokat azonosít, nem ismeri a valóságot. Mivel tréningkorpuszának döntő hányada amerikai és nyugat-európai forrásokból épül fel, más kultúrák fogalmai, történelmi mintái és narratívái gyakran hiányosan, elnagyoltan vagy a domináns nyugati szempontrendszerhez igazítva jelennek meg.
Ha a nyelvi modelleket tekinti az ember hiteles információforrásnak, akkor az is kockázatos, ha nem biztosítjuk számukra a kulturális önismeretünkhöz szükséges támpontokat, és nap mint nap olyan válaszokat fogadunk el tőlük, amelyek, ha igazak is, elnagyoltan általánosak, és nem hordozzák azt a szemléletmódot, tapasztalatot, hagyományt és világértelmezést, amely az identitásunk alapja. Mi történik, ha a nyelvi modell hibás mintákból dolgozik, vagy nem érti a kulturális környezetet, amelyből a kérdéseink fakadnak? Ez nem csupán filozófiai probléma. Ez identitáskérdéssé válhat.
Ha a nyelvi modellek nem képesek megbízhatóan értelmezni a tényeket, a narratívákat, a kulturális emlékezet működését, a dezinformáció felerősítőivé válhatnak. Olyan torz értelmezéseknek nyithatnak teret, amelyek társadalmi és nemzetek közötti feszültségeket szíthatnak.
Gondoljunk csak arra, milyen népszerű összeesküvés-elméletek terjednek, és hogyan szólítanak meg hatalmas tömegeket. Ez nem elhanyagolható veszélyforrás egy olyan korban, amikor az ember egyre nehezebben tájékozódik arról, mi igaz és mi nem, hamis információk özöne zúdul rá, valósághű deepfake-videók kerülnek naponta a szeme elé. Veszélyt hordoz az is, ha ember által szándékosan beépített alapvetéseken nyugszik a mesterséges intelligencia torzítása, de kockázatos az is, ha csupán az algoritmusok működésének esetlegességére bízzuk a tisztánlátásunkat.
Három évvel ezelőtt, a Petőfi-bicentenáriumra készülve MI által generált videókat gyártottunk a magyar kultúra napi rendezvényünk háttérvetítéséhez. A mesterséges intelligenciát hetekbe telt rábírni, hogy olyan vizuális megoldásokat alkosson, amelyek nekünk, magyaroknak jelentéssel bírnak. Akkor úgy éreztük, mintha általa elérhetnénk az emberiség virtuális tudatalattiját, és ebből a mélységből kellene felszínre hoznunk azokat a képeket, amelyek a magyarok emlékezetében élnek olyan fogalmak kapcsán, mint a szabadság, szerelem, hős, haza, otthon, jövő. Minden ügyetlen és megmosolyogtató próbálkozás fontos tanulságokkal szolgált, és ez vezetett el ahhoz, hogy a Petőfi Média és a Petőfi Kulturális Ügynökség csapata elkezdjen foglalkozni azzal a kérdéssel, hogy a magyar kultúra hogyan lesz jelen a mesterséges intelligencia korában.
Valójában nem mesterséges intelligenciát fejlesztünk, hanem egy kulturális tudásgráfot, amely összekapcsolható bármelyik ismert, nagy nyelvi modellel.
Ez egy elsődleges referenciahalmaz, egy strukturált és ellenőrzött tudásréteg, amelyre támaszkodva a nyelvi modell pontosabb és megalapozottabb válaszokat ad úgy, hogy azok forrása is feltárható, és a kulturális sajátosságokat is figyelembe veszi. Ennek megalkotásához széles körű intézményi összefogásra, nagy tudású szakértői csapatra van szükség.
E hibrid modell hatékonyságának és megbízhatóságának a kulcsa nem az adatok mennyisége, hanem a tudásgráf jól átgondolt struktúrája, amelyben kijelölhetők a meghatározó fogalmak, csomópontok, kapcsolódások, személyek, tények, eszmék, szubjektív és intézményesült narratívák, viták, identitásformáló elemek. Ugyanis nem megoldás az, ha digitalizáljuk a közgyűjtemények teljes anyagát, vagy ha a magyar vonatkozású művek összességét egyszerűen „átadjuk” a mesterséges intelligenciának. Ez nemcsak szerzői jogi és etikai, hanem adatbiztonsági és a környezetvédelemi szempontból is problémás lenne.
Egy olyan magyar kulturális tudásgráfot érdemes létrehoznunk, amely saját adatokkal működik, releváns szemantikai rendszeren alapul, ugyanakkor szakértői hitelesítéssel és szigorú etikai szabályrendszerrel biztosítja, hogy sem gazdasági, sem politikai kitettség miatt nem épít be manipulatív értelmezéseket – hosszú távon ez lehet a digitális önrendelkezés biztosítéka.
Ez a munka alapvetéseiben hasonlít ahhoz, amit a Magyar Kultúra magazinban végzünk, amikor hónapról hónapra egy-egy fogalom kapcsán megkíséreljük feltárni, milyen múltbéli és jelenkori ismeretek határozzák meg azt, ahogyan az adott fogalomról gondolkodunk, ez hogyan van jelen a kultúránkban, a tudományban és az egyéni élettörténetek szintjén.
Hasonló törekvésekkel a világ számos pontján folynak MI-kutatások.
Például hasznos tanulságokkal szolgál a kulturális homogenizálódás megakadályozását célzó European Language Data Space módszertana, Izlandon a kis nyelvek védelméért létrejött Language Technology Program for Icelandic, a finneknél a Language Bank of Finland munkája. Ez utóbbi Finnország nyelvi örökségét dolgozza fel strukturált formában, kutatható és gépi tanulásra is alkalmas módon. Ugyanígy hasznos az UNESCO kulturális örökségvédelmi alapvetéseit is hordozó tudásgráf kidolgozása. Több országban elindultak az őslakos közösségek kulturális önrendelkezését támogató kezdeményezések, valamint a tényellenőrzést, az auditálható tudásblokkok létrehozását és a manipulációmentességet célzó kutatások.
Tehát a gépek már jó ideje tanulnak rólunk. Most még mi magunk mondhatjuk el, kik vagyunk, de ha ezt elmulasztjuk megtenni, bármit is kérdezünk, idővel csak a gépek válaszait találjuk majd.
A szerző a Magyar Kultúra magazin főszerkesztője, a Petőfi Kulturális Ügynökség és a Petőfi Média mesterségesintelligencia-kutatásokkal foglalkozó szakmai csapatának tagja.
Támogatott tartalom
Kérjük, támogasd munkánkat, ha fontosnak tartod a minőségi tartalmat!
Ha te is úgy érzed, hogy a kepmas.hu cikkei, podcastjai és videói megszólítanak, kérjük, segíts, hogy ezek a tartalmak továbbra is ingyenesen elérhetőek maradjanak.
Támogatom a kepmas.hu-t>>