mínuszos.hu

Új szint a magyar nyelvi mesterségesintelligencia-kutatásban

szerverA Nyelvtudományi Kutatóközpont kutatói két nyelvmodellt fejlesztettek ki szuperszámítógépeken, neurális technológiát használó gépi tanulási algoritmusok segítségével.

A magyar nyelvre elkészült első GPT-3 típusú mesterséges intelligencia, a HILANCO-GPTX a Nyelvtudományi Kutatóközpont és a Pécsi Tudományegyetem közös fejlesztéseként született meg. Az angol és magyar nyelven egyaránt folyékony kommunikációra és szövegelőállításra is alkalmas rendszer akár még programkódot is képes generálni. Ennek a kétnyelvű rendszernek a betanításához a fejlesztők egy 102 milliárd szavas angol és egy 25 milliárd szavas magyar szövegkorpuszt használtak fel. A három hónapon át tartó gépi tanulás eredményeképpen létrejött nyelvi mesterséges intelligencia mindkét nyelven jól szerkesztett mondatokat képes alkotni, sőt akár még fordítani is tud a két nyelv között. A kutatóközpont munkatársai a fenti technológiát és szuperszámítógép-rendszert használva elkészítettek egy az előzőnél is nagyobb magyar nyelvű anyagon tanított nyelvmodellt, a PULI GPT-3SX-et. Ez egy 32 milliárd szóból álló, csak magyar nyelvű szövegeket tartalmazó anyagon tanult magyarul.


 

Exit mobile version