A Google mesterséges intelligenciája saját nyelvet alkotott, emberi beavatkozás nélkül – szólnak a hírek. Ez sokakban az öntudatra ébredő (majd természetesen világuralomra törő) számítógépek rémképét vetíti előre. Noha ez talán nem holnap lesz, a cég programozóit is kissé meglepő jelenség, amelyet részleteiben egyelőre nem is értenek pontosan, arra világít rá, hogy a mesterséges neuronháló, a gépi tanulás és hasonló divatos szavak valóban a komputerek új generációját, az egyre inkább gondolkodó gépeket jelentik.

Vonat a gróf – olvasható az egyik mobiltelefon-alkalmazás webáruházas ajánlójában. A mottó teljesen érthetetlennek tűnik, ám némi támpontot adhat annak felismerésére, hogy az applikáció kisiskolás gyerekek matematikatudásának elmélyítésére szolgál. Természetesen fordítási hibáról van szó. A fejlesztők nem vesződnek azzal, hogy a világ valamennyi nyelvére lefordíttassák angolul megírt szlogenjeiket, azt inkább rábízzák a webes fordítóprogramokra, jellemzően a Google Fordítóra, aztán senki nem ellenőrzi az eredmények értelmességét. Ebben az esetben valószínűleg az történt, hogy az angol train szót (amely gyakorlást, de vonatot is jelent) és a grófot, de számolást is jelentő count szót keverte össze a szoftver.
Rengeteg hasonlóval találkozni nap mint nap. Egy általam használt konvertálóprogram, amely zenei és videofájl-formátumok közötti átalakítást tesz lehetővé, látszólag tud magyarul. Legalábbis magyar szavak szerepelnek a gombokon, menükben. Kicsit furcsa azonban, hogy amikor ki akarjuk adni a fájlátalakítás parancsát, akkor az „Áttér” gombra kell kattintani. Ennek oka vélhetően az, hogy a fordítóprogram a convert szó (egyébként egészen kézenfekvő) konvertálás jelentése helyett a vallásváltás jelentését választotta.
Az internetes fordítóprogramok népszerűségét talán csak vicces hibáik népszerűsége múlja felül, számos ilyen tematikájú blog működik (például a leiterjakab.nyest.hu). Ugyanakkor egyre gyakrabban használjuk őket, és ha nem egy-egy szót, hanem értelmes szöveget kell lefordítaniuk, egyre használhatóbb eredményt adnak. No persze senki se számítson műfordításra, de arra jók ezek, hogy ha olyan nyelvvel szembesülünk, amelyről fogalmunk sincs, legalább a szöveg hozzávetőleges tartalmáról képet alkothatunk.
Ahogy a modern számítástechnika szinte minden területén, a Google a fordítóprogramok piacán is aktív, ők működtetik a legnépszerűbb online szolgáltatást. Alig két hónapja jelentették be, hogy teljesen új, mesterséges neuronhálón alapuló algoritmust vetnek be a minden eddiginél pontosabb és gyorsabb gépi fordítás elérésére. Sokunk talán rá sem eszmél, milyen bonyolult feladat egy számítógép számára az egyik nyelvről a másikra történő fordítás. Nemcsak a rengeteg szó és a nyelvtani szabályok együttes alkalmazása nehezíti ezt meg, hanem az is, hogy rengeteg kifejezésnél képtelenség jó fordítást adni a szöveg megértése nélkül. Az emberi agy általában gond nélkül megbirkózik vele, ha egy szövegben metaforák, átvitt értelmű kifejezések, vissza- és előreutalások szerepelnek, a komputereknek azonban – legalábbis a múltban – ezekbe rendszeresen beletört a bicskájuk.
– A gépi fordítás szabályalapú volt hőskorában, tehát az algoritmusok a nyelvtani szabályok (alany, állítmány és így tovább) szerint próbálták értelmezni és fordítani a szöveget. Pedig az emberi fordítók agyában nem nyelvtani szabályok vannak, hanem „csak úgy” értik a szöveget – mondja Prószéky Gábor, a Pázmány Péter Katolikus Egyetem egyetemi tanára és a Morphologic fordítóprogramokat fejlesztő cég alapító-ügyvezető igazgatója. – Aztán húsz éve megjelent a statisztikai fordítás. Ez a szövegekben gyakran előforduló szókapcsolatokat keres, és azokból kalkulálja ki a mondat értelmét. Ám ez igazán jól csak a rokon nyelvek között működik. Például a magyar és az angol között már erősen sántít.
Amíg nem voltak megfelelően erős számítógépek, addig a statisztikai fordítás volt az egyetlen, viszonylag használható megoldás. Azoknál a szövegeknél, amelyek kötött sémákra épülnek, például szerződések, bizonyítványok, szakkönyvek fordításánál, jól használhatók ezek az algoritmusok. Még a fordítóirodák is rendszeresen alkalmazzák őket, persze utólagos emberi javítással. Viszont a szabad, bonyolult nyelvi struktúrákkal telezsúfolt szövegek átültetésére nemigen alkalmasak. Nyilvánvalóvá vált, hogy e feladatra emberi fordítókra van szükség – vagy valamire, amely hasonlóan gondolkodik, mint az ember. És itt lépnek színre a mesterséges intelligencia jelenkori reneszánszát megalapozó gépi ideghálózatok vagyis a mesterséges neuronhálók.
A mesterséges neuronhálók teljesen máshogy működnek, mint a klasszikus számítógépes algoritmusok. Az idegrendszer működését szimulálják, a program elemei gépi idegsejtekként működnek. Az információ számos idegsejten áthaladva, a közöttük lévő kapcsolatokat erősítve vagy gyengítve haladhat át, míg végül a gép kidob egy eredményt. Ez a mechanizmus a komplex feladatok megoldására általában sokkal alkalmasabb a hagyományos módszereknél. E szoftverek legnagyobb újdonsága a tanulási képesség. Ha elegendő mennyiségű mintafeladatot kapnak, akkor önállóan alkotnak szabályrendszereket, és azokat alkalmazzák később az éles feladatok megoldásánál. Mindez azt is eredményezi, hogy a pontos gondolkodási mechanizmusuk (hogy melyik virtuális neuron „tüzel” éppen, és melyik hallgat) még az alkotók számára is rejtély.
– A statisztikai fordítás akkor működik jól, ha gyakran előforduló kifejezéseket kell fordítani. Egy szövegben persze óhatatlanul lesznek ritka szókapcsolatok, és azoknál a program gyakran furcsa eredményt ad – magyarázza Prószéky Gábor. – A mesterséges neuronhálóknál azonban a gyakoriság nem a legfontosabb szempont. Azok már teljes mondatokat értelmeznek, és a bennük szereplő szavak tényleges jelentését igyekeznek meghatározni.
Amikor egy programnak (vagy akár emberi tolmácsoknak) számos különféle nyelv között kell fordítania, gyakran közvetítő – általában angol – nyelvet (szakszóval: interlinguát) alkalmaznak. Ezzel lecsökkenthető a fordítandó nyelvpárok száma, hiszen nem kell valamennyi nyelvkombinációra felkészíteni a szoftvert, elég, ha az összes nyelv és az angol között tud fordítani.
A Google mérnökei kipróbálták, mihez kezd az általuk alkotott mesterséges intelligencia, ha megfosztják az előzetesen rögzített közvetítő nyelv adta mankótól. Megtanították neki külön-külön, hogyan kell angolról koreaira és angolról japánra fordítani, és ezután tesztelték, vajon tud-e a koreai és a japán között is tolmácsolni – írja a TechCrunch. Ugyanakkor nem volt az algoritmus része, hogy minden nyelvet először angolra kell fordítani, majd azt vissza egy másik nyelvre, hanem a közvetlen fordítás volt a cél.
És ment neki, a szakemberek szerint „elfogadhatóan” jól. A gép képes volt egy olyan nyelvpárt is kezelni, amelyek tagjai nem voltak előzetesen összekapcsolva az algoritmusában. Kérdés, hogyan lehetséges ez. Ahogy korábban írtuk, a mesterséges neuronhálón alapuló gépi intelligencia még fejlesztői számára is „fekete doboz”. Adatokat táplálnak bele, az eltűnik a gép belsejében, majd kijön a válasz, de hogy pontosan mi zajlott le a doboz belsejében, az korántsem egyértelmű.
Lehet, hogy a számítógép nagyon egyszerű, „gépies” módon oldja meg a feladatot, de az is lehet – és ez sokakat tölt el csodálattal vegyes feszengéssel –, hogy a program „megértette” a szavak jelentését, és sokkal mélyebb koncepciók kialakítására is képes, mint azt eddig lehetségesnek gondolhattuk. A feltételezések szerint mégiscsak közvetítő nyelvet használ a fordításhoz, de e nyelvet nem kellett beleprogramozni, hanem ő maga alkotta meg saját használatra. A fordítóprogramok tervezői elméletben már rég felvetették, hogy az angol helyett alkotni kellene egy csak virtuálisan létező közvetítő nyelvet, amely ideális lenne a ritkán használt nyelvpárok közötti szakadék áthidalására. Ezt azonban eddig nem sikerült létrehozni, mert túl absztraktnak vélték. Talán a mesterséges neuronháló megoldotta e feladatot.
– A Google eredménye lelkesítő, de azt érdemes tudni, hogy a mesterséges neuronhálók mögött rejlő elmélet nem új. A Google előnyét nemcsak az algoritmus maga jelenti, hanem a cég rendelkezésére álló töméntelen adat és számítási kapacitás – értékel Prószéky Gábor. – Ma már a világ összes fordítóprogram-fejlesztője kísérletezik a neuronhálókkal. Mi is, ezért tudjuk, mennyire fontos e rendszerek működéséhez a hardver. E téren pedig a Google-lal, a Microsofttal és a többi világcéggel kevesen tudnak versenyezni.
Nem elég, hogy gondolkodnak a komputerek, de már saját, senki által nem ismert nyelvük is van? Mi kellhet még egy összeesküvéshez? Ez persze csak tréfa, hiszen attól, hogy az emberi intelligencia egy-egy részfeladatában egyre ügyesebbé válnak a számítógépek, még nem állítható, hogy kognitív képességeik globálisan is összemérhetők lennének a miénkkel. Ugyanakkor az is egyértelműen látszik, hogy a mai gépek gondolkodása (legalábbis a felszínen) napról napra egyre hasonlatosabb az emberi elme működéséhez.

2016. december 31.

Reklámok