Ismeret és nyelv

Mi fán terem a nyelvtechnológia?

Nyelvtechnológia

A nyelvészeket – és általában a bölcsészettudományokkal foglalkozókat – sokan szeretik matematikai-informatikai analfabétákként elképzelni, holott a (leendő) nyelvészek valójában a könyvek és szótárak bújása helyett egyre inkább programozni tanulnak. A nyelvtechnológia, vagy magyarosabban: számítógépes nyelvészet térhódítása bizonyítja, hogy a nyelvészet és az informatika nem is áll annyira távol egymástól, mint hinnénk.

Nyelvészet és informatika

A nyelvészet és a formális logika szoros kapcsolata érzékelhető a matematika és informatika órákon is, hiszen az algebrának is van nyelve, ennek a nyelvnek elsajátításával tudjuk megérteni, mit jelent a 2+2 kifejezés. A számítógépes programnyelvekkel pedig egészen összetett utasítássorozatokat tudunk kifejezni egy erre a célra készített jel- és szabályrendszer segítségével.

Hasonlóképpen rendszerszerű az emberi nyelv is, még ha a szabályait nem is érezzük mindig annyira logikusnak. Mégsem véletlen, hogy a jó matekosok sokszor  jeleskednek a nyelvtanulásban is, és az informatikusok nem ritkán érdeklődnek a nyelvészet iránt. A két tudományág házasságából született az egyre nagyobb népszerűségnek örvendő interdiszciplína, a nyelvtechnológia vagy más néven számítógépes nyelvészet. De vajon mivel is foglalkozik ez a különleges tudományterület?

A számítógép mint a nyelvész eszköze

Először is tisztázni kell, hogy a számítógépes nyelvészet és a nyelvtechnológia nem egészen szinonímák, bár sokszor nehéz őket elkülöníteni. Előbbi alatt a számítógépes eszközökkel támogatott nyelvtudományt értjük, utóbbi az informatika azon része, amely az emberi nyelvet feldolgozó alkalmazások fejlesztésével foglalkozik. A nyelvészet és a számítástechnika tehát oda-vissza hat egymásra, mindkét tudományterület felhasználja a másik eredményeit.

A nyelvész számára a számítógép fontos eszköz, hiszen a segítségével rengeteg értékes nyelvi adathoz tud hozzájutni. A szövegek vizsgálatán alapuló kutatásokkal a korpusznyelvészetnek nevezett részterület foglalkozik, és ez elképzelhetetlen informatikai támogatás nélkül. Az interneten megtalálható nagy mennyiségű szövegből némi programozói tudással hatékonyan kereshetők a minket érdeklő nyelvi jelenségek, de a szöveges adatok gépi feldolgozása nagy segítség a szótárkészítésben is. A nyelvvel foglalkozóknak tehát érdemes ismerniük az informatika adta lehetőségeket, hiszen a számítógép sokkal gyorsabban olvas és keres, mint mi.

A nyelv mint az informatika célja

Amióta a számítógép-használat általánossá vált, egyre inkább szeretnénk a géptől az emberihez hasonló intelligenciát elvárni. Ez természetesen nem teljesíthető maradéktalanul, de a nyelvtechnológia célja éppen az, hogy a számítógépek legyenek képesek az emberi nyelvet (valamilyen szinten) kezelni.

A legelterjedtebb alkalmazásokkal már korábbi cikkeinkben is foglalkoztunk: teszteltünk helyesírás-ellenőrzőket és gépi fordítókat, emellett bemutattuk a helyesiras.mta.hu nyelvtechnológus csapatát is. Ezen rövid ismertetőkből is jól látszik, hogy a módszerek sokfélék lehetnek. A nyelv modellezése történhet matematikai alapon, általában statisztikai-valószínűségi elven működnek például a szövegszerkesztő programok helyesírás-ellenőrzői és számos fordító alkalmazás is. Más hasonló célú szoftverekbe viszont komoly nyelvészeti tudás van beépítve, ezek a rendszerek a nyelvtanuló emberhez hasonlóan szabályokat tanulnak meg.

Az eddig említett alkalmazásokon kívül a nyelvtechnológia körébe tartoznak még például a beszédfelismerő és a gépi felolvasó rendszerek, az intelligens keresők, az automatikus szövegkivonatolók és a mesterséges intelligencia nyelvi vonatkozású részei is.

Mire jó a nyelvtechnológia?

A szövegek nagy része ma már géppel készül, ezért a szövegalkotást támogató nyelvi eszközökre kétségtelenül nagy szükség van. Ugyanakkor az internettel bejövő információáradat kezeléséhez is hasznos lehet számunkra a számítógép „nyelvi tudása”. Ha valamit meg szeretnénk tudni, ma már szinte automatikusan az internetes keresőhöz fordulunk. Egy ilyen eszköz tervezésénél azonban korántsem egyszerű feladat biztosítani, hogy a keresőkifejezésre jó találatokat adjon. Hasonlóan az információszerzés támogatása a gépi fordító célja is: talán nem tudja megírni a házi feladatunkat a nyelvórára, de segíthet tájékozódni például egy sípálya szlovák nyelvű honlapján.

A nyelvtechnológia tehát az emberi nyelv működését próbálja lekódolni a számítógép nyelvére, azt azonban nem várhatjuk tőle, hogy a gépeket valódi nyelvtudással ruházza fel, hiszen a számítógépnek nem (vagy csak nagyon korlátozott mértékben) lehet világismeretet, stílusérzéket, a mögöttes tartalmak megértését tanítani. A gép utasításokat teljesít, nagyon gyorsan és hatékonyan, így segítségünkre lehet akár a fordításban vagy a hibátlan szövegek megírásában is, de a gépi eszköz javaslatait fenntartásokkal kell kezelnünk. A gondolkodó robotok kora még nem jött el, az intelligencia tehát egyelőre nálunk van.

Dömötör Andrea

Leave a Reply