Új szint a magyar nyelvi mesterségesintelligencia-kutatásban

szerverA Nyelvtudományi Kutatóközpont kutatói két nyelvmodellt fejlesztettek ki szuperszámítógépeken, neurális technológiát használó gépi tanulási algoritmusok segítségével.

A magyar nyelvre elkészült első GPT-3 típusú mesterséges intelligencia, a HILANCO-GPTX a Nyelvtudományi Kutatóközpont és a Pécsi Tudományegyetem közös fejlesztéseként született meg. Az angol és magyar nyelven egyaránt folyékony kommunikációra és szövegelőállításra is alkalmas rendszer akár még programkódot is képes generálni. Ennek a kétnyelvű rendszernek a betanításához a fejlesztők egy 102 milliárd szavas angol és egy 25 milliárd szavas magyar szövegkorpuszt használtak fel. A három hónapon át tartó gépi tanulás eredményeképpen létrejött nyelvi mesterséges intelligencia mindkét nyelven jól szerkesztett mondatokat képes alkotni, sőt akár még fordítani is tud a két nyelv között. A kutatóközpont munkatársai a fenti technológiát és szuperszámítógép-rendszert használva elkészítettek egy az előzőnél is nagyobb magyar nyelvű anyagon tanított nyelvmodellt, a PULI GPT-3SX-et. Ez egy 32 milliárd szóból álló, csak magyar nyelvű szövegeket tartalmazó anyagon tanult magyarul.


 

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

Next Post

ARENA4+ lett a Network4

szo nov 26 , 2022
ShareTweetPinShareÁtnevezik a Network4 médiacsoport streamingszolgáltatását és honlapját. Az ARENA4+ streamingszolgáltató a jövőben a NET4+ nevet viseli, és mostantól NET4 lesz a médiacsoport információs oldalának neve. A ráncfelvarrásra a folyamatos bővülés, az észszerűség és a modernizáció jegyében volt szükség. Nagyot nőtt a Network4 csoport kínálata az elmúlt időszakban, megszületett például az új […]
ARENA4+

És még ez is...