Daudzvalodu korpusa un mašīntulkošanas infrastruktūras izveide e-pakalpojumu pieejamības nodrošināšanai

Centrs īstenojis projektu „Daudzvalodu korpusa un mašīntulkošanas infrastruktūras izveide e-pakalpojumu pieejamības nodrošināšanai”, kā  rezultātā ieviesta īpaša tehnoloģija, kas ļauj jebkuram Latvijas iedzīvotājam izmantot e-pakalpojumus, tulkot dokumentus, lasīt interneta vietnes un iepazīties ar valsts likumdošanu savā izvēlētajā valodā. Tehnoloģija pašlaik nodrošina automātisku tulkošanu latviešu, angļu un krievu valodām, nodrošinot augstu personas datu drošību. Pakalpojums ir pieejams interneta vietnē www.hugo.lv.

Projekta gaitā veikta mašīntulkošanas sistēmas prasībām un projekta specifikai atbilstošu monolingvālo un paralēlo valodu korpusu (angļu- latviešu, krievu- latviešu) izveidošana, nodrošinot 3 tulkošanas virzienus  – angļu-latviešu, latviešu-angļu un latviešu-krievu.

Mašīntulkošanas sistēmas vajadzībām izveidoti sekojoši monolingvālie korpusi – 1) latviešu valodas monolingvālais korpuss, kas satur 75 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais monolingvālais korpuss ar 20 miljoniem teikumu; 2) angļu valodas monolingvālais korpuss, kas satur 50 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais monolingvālais korpuss ar 15 miljoniem teikumu; 3) krievu valodas monolingvālais korpuss, kas satur 75 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais monolingvālais korpuss ar 20 miljoniem teikumu; kā arī šādi paralēlie valodu korpusi –1) angļu-latviešu paralēlais korpuss, kas satur 5 miljonus teikumu, t.sk. valsts pārvaldes specializētais paralēlais korpuss ar 2 miljoniem teikumu; 2) krievu-latviešu paralēlais korpuss, kas satur 5 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais paralēlais korpuss ar 2 miljoniem teikumu.

Mašīntulkošanas tehnoloģiskais risinājums izstrādāts ar Eiropas Reģionālās attīstības fonda finansējumu       1 135 026,27 EUR, sadarbojoties Kultūras informācijas sistēmu centram un valodas tehnoloģiju uzņēmumam Tilde.