Facebooki ja Instagrami emafirma Meta on nüüd teine suure keelemudeli arendamisega tegelev tehisaru ettevõte, kelle kasutusse on antud eesti keele korpuse avaandmed, mis sisaldavad peaaegu 4 miljardit sõna. Sellega luuakse eeldused eesti keele ja kultuuri esindatuse kasvatamiseks kaasaaegsetes tehisintellekti mudelites, kirjutatakse justiitsministeeriumi teates.
Justiits- ja digiministri Liisa Pakosta sõnul on tähtis, et suured keelemudelid arvestaksid eesti keele ja kultuuriga: "See on meie keele ja kultuuri jätkusuutlikkuse mõttes ülioluline, et eesti keele korpuse avaandmed oleksid keelemudelite arendajatele kättesaadavad."
Eestikeelsete andmete jagamine loob eelduse, et suured keelemudelid mõistaks Eesti kultuuri konteksti ja muutuks ka eesti keele kasutamises osavamaks, öeldakse teates. Ühtlasi võimaldatakse seeläbi areng paremaks teeninduseks eestikeelsetele kasutajatele erinevates tehisintellektil põhinevates rakendustes – vestlusrobotites, tõlkesüsteemides jm keeletehnoloogial põhinevates lahendustes.
Justiits- ja Digiministeerium ning Haridus- ja Teadusministeerium koostöös Eesti Keele Instituudiga tagavad eestikeelsete andmestike kättesaadavuse.
Nii avalik kui erasektor saab avaldada andmeid avaandmete teabeväravas.