Arhīvi Bibliotēkas Muzeji

Drīzumā plānots valsts iestāžu valsts pārvaldes vajadzībām angļu-latviešu un krievu- latviešu mašīntulkošanas sistēmu, kuru izstrādājusi sabiedrība Tilde projekta „Daudzvalodu korpusa un mašīntulkošanas infrastruktūras izveide e-pakalpojumu pieejamības nodrošināšanai” ietvaros. Projektu īsteno Kultūras informācijas sistēmu centrs (KISC) ar Eiropas Reģionālās attīstības centra finansējumu.
Projekta mērķis ir papildināt Latvijas e-pārvaldes infrastruktūru ar mašīntulkošanas iespēju, līdz ar to paaugstinot valsts pārvaldes kvalitāti kopumā un veicinot iedzīvotāju piekļuvi Eiropas Savienības valstu informācijai.


Viens no galvenajiem efektīvas e-pārvaldes uzdevumiem ir nodrošināt būtiskas informācijas, piemēram, likumdošanas un e-pakalpojumu pieejamību un saprotamību visām iedzīvotāju grupām neatkarīgi no to valodu zināšanām. Pašlaik vairums e-pakalpojumu ir izmantojami tikai latviešu valodā, bet e-pakalpojumu nodrošināšana vairākās valodās ievērojami sadārdzinātu un palēninātu to izstrādi. Sekmīgs problēmas risinājums ir plašas pieejamības mašīntulkošanas programmas izstrāde, ļaujot valsts pārvaldes mājas lapu apmeklētājiem veikt tajās esošās informācijas kvalitatīvu tulkošanu uz angļu un krievu valodām.
Mašīntulkošanas sistēmas vajadzībām izveidoti sekojoši monolingvālie korpusi – 1) latviešu valodas monolingvālais korpuss, kas satur 75 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais monolingvālais korpuss ar 20 miljoniem teikumu; 2) angļu valodas monolingvālais korpuss, kas satur 50 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais monolingvālais korpuss ar 15 miljoniem teikumu; 3) krievu valodas monolingvālais korpuss, kas satur 75 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais monolingvālais korpuss ar 20 miljoniem teikumu; kā arī šādi paralēlie valodu korpusi –1) angļu-latviešu paralēlais korpuss, kas saturs 5 miljonus teikumu, t.sk. valsts pārvaldes specializētais paralēlais korpuss ar 2 miljoniem teikumu; 2) krievu-latviešu paralēlais korpuss, kas saturs 5 miljonus teikumu, tai skaitā, valsts pārvaldes specializētais paralēlais korpuss ar 2 miljoniem teikumu.
Šobrīd ir pabeigta monolingvālo un paralēlo valodu korpusu (angļu- latviešu, krievu- latviešu) izveidošana, nodrošinot trīs tulkošanas virzienus – angļu-latviešu, latviešu-angļu un latviešu-krievu, un notiek sistēmas testēšana.

attels