TOKYO - Umelá inteligencia dnes udivuje svet svojimi schopnosťami generovať text, písať eseje a odpovedať na komplikované otázky. No kým jej odpovede často znejú presvedčivo, v skutočnosti môžu byť zavádzajúce alebo úplne chybné. Vedci túto zvláštnosť čoraz častejšie prirovnávajú k neurologickému ochoreniu – afázii.
V každodennom živote sa čoraz častejšie používajú agenti, chatboti a iné nástroje založené na umelej inteligencii (AI). Takzvaní agenti na báze veľkého jazykového modelu (LLM), ako napríklad ChatGPT a Llama, sú síce v odpovediach pôsobivo plynulé, lenže pomerne často poskytujú presvedčivé, ale nesprávne informácie. Vedci z Tokijskej univerzity preto poukazujú na paralely medzi týmto problémom a rečovou poruchou, známou ako afázia, uviedol portál Science Daily. Tí, ktorí ňou trpia, hovoria plynulo, ale vydávajú nezmyselné alebo ťažko zrozumiteľné vyhlásenia. Táto podobnosť by mohla poukázať na lepšie formy diagnostiky a dokonca poskytnúť poznatky inžinierom umelej inteligencie, ktorí sa snažia zlepšiť agentov založených na LLM.
Tento článok napísal človek, ale používanie AI na generovanie textu narastá v mnohých oblastiach. Keďže čoraz viac ľudí túto funkciu používa a spolieha sa na ňu, je čím ďalej, tým viac potrebné zabezpečiť, aby tieto nástroje poskytovali používateľom správne a ucelené odpovede a informácie. Tak ChatGPT, ako aj mnohé iné, sa javia ako veľmi plynulé odpovediach, ktoré poskytujú. Na ich výroky sa však nemožno vždy spoľahnúť vzhľadom na množstvo v podstate vymysleného obsahu, ktorý vytvárajú. Ak používateľ nemá dostatočné vedomosti z danej oblasti, môže ľahko upadnúť do omylu a považovať tieto informácie za správne, najmä vzhľadom na vysokú mieru dôvery, ktorú ChatGPT a iné nástroje prejavujú.
„Nemôžete si nevšimnúť, že niektoré systémy AI sa javia ako výstižné, a pritom často produkujú značné chyby,“ povedal profesor Takamitsu Watanabe z Medzinárodného výskumného centra pre neurointeligenciu (WPI-IRCN) na Tokijskej univerzite. „Čo však mňa a môj tím zaujalo, bola podobnosť medzi týmto správaním a správaním ľudí s Wernickeho afáziou, ktorí plynulo rozprávajú, ale nie vždy to dáva zmysel. Toto nás podnietilo zamyslieť sa nad tým, či by vnútorné mechanizmy týchto systémov AI mohli byť podobné mechanizmom ľudského mozgu postihnutého afáziou a pokiaľ áno, aké by to mohlo mať dôsledky.“ Na preskúmanie tejto teórie použil profesorov tím metódu známu ako analýza energetickej krajiny. Pôvodne bola vyvinutá fyzikmi, ktorí sa snažili vizualizovať energetické stavy v magnetických kovoch, ale nedávno bola prispôsobená pre neurovedy. Skúmali vzorce pokojovej mozgovej aktivity ľudí s rôznymi typmi afázie a porovnávali ich s internými údajmi z niekoľkých verejne dostupných LLM. A pri svojej analýze tím skutočne objavil niektoré nápadné podobnosti.
Spôsob, akým sa digitálne informácie alebo signály presúvajú a manipulujú v rámci modelov AI, sa veľmi zhodoval so spôsobom, akým sa správali niektoré mozgové signály v mozgoch ľudí s určitými typmi afázie, vrátane Wernickeho afázie. „Energetickú krajinu si môžete predstaviť ako plochu, na ktorej je guľa. Keď je tam krivka, loptička sa môže kotúľať dole a zastaviť sa, ale keď sú krivky plytké, loptička sa môže kotúľať chaoticky,“ vysvetlil Watanabe. „Pri afázii predstavuje loptička stav mozgu človeka. V LLM predstavuje pokračujúci vzor signálu v modeli na základe jeho inštrukcií a interného súboru údajov.“
Výskum má niekoľko dôsledkov. Pre neurovedu ponúka možný nový spôsob klasifikácie a monitorovania stavov, ako je afázia, na základe vnútornej mozgovej aktivity, a nie len vonkajších symptómov. Pre AI by mohol viesť k lepším diagnostickým nástrojom, ktoré pomôžu inžinierom zlepšiť architektúru systémov zvnútra. Napriek podobnostiam, ktoré vedci zistili, vyzývajú k opatrnosti a k tomu, aby sme nerobili príliš veľké predpoklady. „Netvrdíme, že chatboty majú poškodený mozog,“ povedal Watanabe. „Ale môžu byť uzavreté v určitom rigidnom vnútornom vzorci, ktorý obmedzuje, ako flexibilne môžu čerpať z uložených vedomostí, podobne ako pri recepčnej afázii. Či budúce modely dokážu toto obmedzenie prekonať, to sa ešte len uvidí. Avšak pochopenie týchto vnútorných paralel môže byť prvým krokom aj k inteligentnejšej a dôveryhodnejšej AI.“