heti-valasz.hu/magyarokapiacon/nem-hagyomanyos-mosopor-126039

http://heti-valasz.hu/magyarokapiacon/nem-hagyomanyos-mosopor-126039

Magyarok a piacon

Digitális szövegbányászat

/ 2017.11.08., szerda 15:56 /

A mesterséges intelligencián alapuló számítógépes nyelvészeti megoldások a gazdaság szinte minden ágazatát hozzásegíthetik a fejlődéshez – mondja a kaposvári Precognox Kft. ügyvezetője, Jóföldi Endre.

A Nemzetgazdasági Minisztérium a Precognoxot választotta a hónap cégének. Mivel vívták ki az elismerést?

Számítógépes nyelvészettel, szövegbányászattal és keresőrendszerekkel foglalkozunk. Ezek kifejezetten innovatív informatikai területek, de valószínűleg legalább ennyit nyomott a latban az is, hogy az országnak olyan régiójában dolgozunk, ahol alulfejlett a számítástechnikai ágazat. Délnyugat-Magyarország az Európai Unió tíz legelmaradottabb térségének egyike; Somogy megyében például a statisztikák szerint összesen 320 informatikus dolgozik – ennek a tizede nálunk, Kaposváron. Bár most már a fővárosban is van irodánk, igazán nagy hozzáadott értéket azzal állítunk elő, ha Somogyban hozunk létre nemzetközi szinten is elismert tudásközpontot és versenyképes munkahelyeket.

Hogyan lehet informatikai céget építeni olyan városban, ahol nincs felsőfokú műszaki képzés?

Nemcsak a városban, de az egész megyében kevés olyan szakember van, aki megfelelően képzett ahhoz a munkához, amit végzünk. Ez nehézség, de nem áthidalhatatlan. Kollégáink jellemzően kezdőként kerülnek hozzánk, és mi tanítjuk meg őket a cég által végzett feladatokra.

Tehát nem szégyen bevallanunk, hogy bajban lennénk, ha meg kellene határoznunk a számítógépes szövegbányászat definícióját?

Az egyszerű meghatározás számunkra is kihívás, hiszen munkánk megértéséhez előbb át kell látni, hogyan működnek különböző, nagy adattömeget kezelő informatikai rendszerek vagy online szolgáltatások. Ahhoz például, hogy egy álláskereső portálon tetszőleges keresőkifejezésre a hirdetők által feltöltött sok ezer álláspályázat közül a legpontosabb találatokat kapjuk, szükség van egy háttérfolyamatra, melynek során a rendszer feltérképezi a feltöltött szövegeket, és azonosítja bennük a kiválasztás alapjául szolgáló kifejezéseket. Ez számítógépes nyelvészeti vagy szövegbányászati feladat.

Miben több ez, mint az egyszerű keresés?

A keresés során egyetlen, előre meghatározott karaktersort szeretnénk megtalálni a szövegben. A mi esetünkben azonban a rendszernek fel kell ismernie minden olyan kifejezést, ami releváns lehet a kulcsszó kapcsán – hiszen aki a nővér szóra keres, nyilván kíváncsi a betegápolói álláshirdetésekre is.

Azt feltételeznénk, hogy egy számítógép csak a szóalakokat képes vizsgálni, a jelentést nem.

Ezen a szinten már túlléptünk. A számítógépes nyelvészet kapcsán sokat emlegetik például a 2013-as bostoni merényletet, melynek csecsen elkövetőjét nyilvántartotta ugyan a rendőrség, de ezekben az adatbázisokban másként volt „angolosítva” a neve, mint ahogy a személyes dokumentumaiban szerepelt. Azért tudott a merénylet előtt szabadon mozogni az országban, mert az akkori hatósági rendszerek a szóalakok eltérése miatt nem ismerték fel az egyezést – ma az azonosítás már gyerekjáték lenne. A megfelelő állami szervek használják is azt a technológiát, amely kivédi az ilyen hibákat.

Néhány karakternyi eltérés kiszűrése még nem egyenlő a jelentés felismerésével.

Nem, de a példán keresztül megérthetjük, hogyan jutunk egyre közelebb a szavak jelentéséhez. Ahogy nő a számítási sebesség, a szövegelemző rendszerek egyre pontosabbakká válnak. Ugyanakkor nem érdemes bedőlni a mesterséges intelligencia körül kialakult túlzott felhajtásnak sem. Robbanásszerű a fejlődés ezen a területen, de a jelentésalapú „gondolkodásnak” számos fokozata van – és a jelenlegi technológiák még csak az első néhány lépcsőfokon járnak. Például egy jogosítvánnyal rendelkező autóvezető meglehetősen könnyen tud alkalmazkodni soha nem tapasztalt útviszonyokhoz és körülményekhez, de egy önvezető autó erre még nem képes.

Akkor egyelőre nem kell féltenünk állásunkat az intelligens szoftverektől?

Egy jól megírt szoftver képes az online sajtóból nagy pontossággal, automatikusan kigyűjteni az összes magyar gazdasági újságíró nevét, de nem tud megírni egy elemző cikket. Ugyanakkor kisebb kreativitást igénylő, például számviteli feladatokat már ma is rábízhatunk számítógépes rendszerekre. A jogászok helyében szintén nem aludnék nyugodtan, hiszen a jogi munka jelentős része kodifikált szövegek rutinszerű visszakeresésére és értelmezésére épül. Mivel egy meghatározott szabályrendszeren belül kell mozogni, ennek a feladatnak a jelentős részét pár éven belül át tudják majd venni a szoftverek. Persze optimistábban úgy is fogalmazhatunk, hogy a munkánk unalmas részeit egyre inkább átveszik a számítógépek, így mi szabadabban foglalkozhatunk a kreatív területekkel.

Napjainkban milyen ágazatok hasznosítják leginkább a számítógépes nyelvészet szolgáltatásait?

Már ma is szinte minden nagyobb gazdasági ágazat alkalmazza a technológiát, és a jövőben ez egyre kiterjedtebb lesz. Mi is dolgoztunk már rengeteg különböző területen – az egészségügytől a közigazgatáson át az egyetemi kutatási projektekig –, és egy nemrég megkötött, amerikai együttműködésnek köszönhetően nemzetközi jelenlétünk is erősödik.

Jóföldi Endre
1975-ben született Kaposváron. • Mérnökinformatikusként szerzett diplomát. • A főiskola után programozóként helyezkedett el. • 2008-ban indította a Precognox Kft.-t.

Rosta

Találkozunk 2016-ban!

Az EP nem fogadta el a kvótát, de választási ajándékot adott Orbánéknak

Nyugalom: nem igaz, hogy „állandó, felső kvóta nélküli migránsbetelepítési rendszert fogadtak el az Európai Parlamentben”. Cecilia Wikström svéd liberális képviselő tervezete maga az agyrém, de kizárt, hogy keresztülmenjen az EP-n és a Tanácson is. A választásra készülő Fidesz viszont komoly ajándékot kapott.

Zaklatásügy – megszólal a színművészeti egyetem rektora!

A próbán mondhatom, hogy vedd le a pólódat, és ülj az ölébe, de a próba végeztével nem kérhetem, hogy ülj az ölembe – mondja M. Tóth Géza rendező. A Színház- és Filmművészeti Egyetem rektora tiltott határátlépésekről és az önvizsgálat fontosságáról. Nagyinterjúnk a csütörtöki Heti Válaszban.

E-egészségügy: bolyongó páciensek, eldobott receptek

Az e-egészségügy bevezetése új korszakot nyit, orvosunk ezután mindent lát – azt is, ha nem szedjük a felírt gyógyszert, vagy ha másik specialistát keresünk fel helyette. Részletes háttér a friss Heti Válaszban.

Egyszervolt kincseink – magyar főúri és nagypolgári gyűjtemények nyomában

A századforduló és a két világháború közötti Magyarország, illetve öt legendás műgyűjtő alakja rajzolódik ki az Elveszett örökség című kötetből. A kollekciók nagy része szétszóródott, de mit tehetünk azért, hogy a világ tudjon róla: jó néhány remekmű valaha magyar tulajdonban volt. Részletek a friss Heti Válaszban.