Mākslīgā intelekta dotie labumi! Beidzot arī latviski runātu tekstu var pārvērst datorrakstā

1 komentārs

Tehnoloģiju attīstība ar lieliem soļiem iet uz priekšu, arī Latvijā. Ja vēl nesenā pagātnē šķistu nereāli, ka latviešu valodā izrunāti vārdi var tikt automātiski pārveidoti un lasāmi datortekstā, tad šobrīd tā jau ir realitāte, ko izmēģināt un lietot var jebkurš. Runas atpazīšanas sistēma daudzu jomu pārstāvjiem pamatīgi atvieglos un efektivizēs darbu, piemēram, žurnālistiem, mediķiem vai tiesu sēžu stenografētājiem. Interesanti, ka šo mākslīgo intelektu gandrīz vienlaicīgi izstrādājuši gan Latvijas Universitātes zinātnieki, gan tehnoloģiju uzņēmums Tilde.

Daudzām lielajām valodām jau sen pieejama tehnoloģija, kas ļauj runātu tekstu pārvērst rakstītā tekstā. Latvijā nopietns darbs pie šādas sistēmas izveides sākās pirms dažiem gadiem, kad industrija un zinātnieki kopā lika pamatus latviešu valodas runas korpusam. Pašreiz Latvijas Universitātes Mākslīgā intelekta laboratorija un tehnoloģiju uzņēmums ”Tilde” katra atsevišķi turpina attīstīt savu balss atpazīšanas sistēmu. Tildes uzņēmuma pētniecības direktors Raivis Skadiņš stāsta, kā notiek audiofaila pārveide teksta failā. Turklāt, runātu tekstu var pārveidot datorrakstā arī aktuālajā laikā.

Saistītie raksti

Saistītie raksti

Saistītās tēmas

Skatīt vairāk

Runas atpazīšanā ir divi komponenti – pirmais – akustiskā signāla apstrāde jeb cilvēka izrunāto vārdu uztveršana, otrs – pašas valodas daudzveidība. Sarežģītība slēpjas tajā, ka latviešu valodā viens vārds var būt dažādos locījumos.

“Latviešu valodā ir liela vārdu bagātība, ja angļu valodā ar 30 000 vārdu var “nosegt” gandrīz jebkuru tekstu, tad latviešu valodā ir miljoniem vārdu. Jo ir daudz dažādu galotņu, vārdi, kuriem ir simtiem dažādu formu. Tā ir tā mūsu valodas īpatnība,” skaidro Skadiņš.

Viņš salīdzina datoru ar bērnu – abi mācās no tās informācijas, kas ir iepriekš parādīta. Lai izveidotu šo tehnoloģiju datoram tika iedots 100 stundu garš audiofails, kur runājuši tūkstošiem cilvēku. Pieaugušo un bērnu balsis, veci cilvēki, vīrieši, sievietes, latvieši ar dažādiem akcentiem, kā arī cilvēki, kuriem dzimtā valoda ir krievu vai angļu, bet, kuri runā latviski.

“Dators ir iemācījies, kā cilvēki mēdz runāt. Kādus skaņas dators ir dzirdējis, tādas tas ļoti labi atpazīst. Ja parādās kāds cilvēks ar ļoti īpatnēju izrunu, tad gan tas var būt izaicinoši datoram,” teic Tildes pārstāvis.

Tam piekrīt arī Latvijas Universitātes Matemātikas un informātikas institūta zinātnieki, kuri izstrādājuši balss atpazīšanas sistēmu – Ruta. Abu sistēmu precizitāte ir gana augsta – tās atpazīst līdz pat 80% dzirdēto latviešu vārdu. Tas nozīmē, ka no simts vārdiem, divdesmit var būt kļūdaini.

Mākslīgā Intelekta laboratorijas vadošais pētnieks Normunds Grūzītis norāda: “Latviešu valodai vēl ilgi būs situācija, kad runas atpazīšanas sistēmas nestrādās ne tuvu ne perfekti. Jo mums ir sagatavots simts stundu treniņdatu apjoms – angļu valodai un citām lielākajām valodām – tūkstošiem stundu. Līdz ar to šī atšķirība vēl kādu laiku būs.”

Ruta spēj izdalīt arī vairākus runātājus no viena faila. Tā atceras cilvēka balsi, ja tas runājis vairākas reizes. Balsis tā izšķir pēc valodas lietojuma, tembra un intonācijas.

Runas atpazinējs jau tagad noderīgs ir ļoti plašam lietotāju lokam – visiem, kas darbs sasitās ar teksta atšifrēšanu. Žurnālistiem, Saeimas vai tiesu sēžu stenografēšanai, tātad dokumentu digitalizēšanai. Taču šīs tehnoloģijas perspektīva ir “iet dziļumā” un to pielāgot ļoti specifisku profesiju vajadzībām.

Grūzītis stāsta: :”Attīstīt šo sistēmu kādām konkrētām nozarēm, teiksim, dažādu medicīnas ierakstu atšifrēšanai, vai zvanu centrālēm. Jāstrādā virzienos, kur vajadzīgs ierobežot valodu un iegūt precīzāku rezultātu – specifiskus termiņus, specifisku izteikšanās veidu, frāzes, kas tiek lietotas.”

Jāpiebilst gan, ka vismaz pagaidām neviena no sistēmām nezina, kur liekamas pieturzīmes, tādēļ pēc audio teksta pārveides rakstiskā formā, joprojām nepieciešams lietā likt vien cilvēkam piemītošo intelektu.

Foto

Video

1 komentārs

TOP komentāri

  • elefant
    0

    elefant

    Ļoti interesanti, ka mazajā Latvijā vienlaicīgi tapuši divi šādi te projekti. Un interesanti arī, ka Tildes vadītāja uzvārds parādās arī Mākslīgā intelekta laboratorijas darbinieku pirmajās rindās. Tikai sieviešu dzimtē. Nez vai tā tik tāda sakritība?

    21.02.2016 17:45

Skaties.lv e-jaunumi

Cik jauki! Tu esi pieteicies e-jaunumiem!

Skaties.lv e-jaunumi

Piesakies aktuālāko un interesantāko ziņu saņemšanai savā e-pasta kastītē!

Kas ir e-jaunumi?
Palīdzi savai ādai elpot! Četri likumi pareizai ādas attīrīšanai

Palīdzi savai ādai elpot! Četri likumi pareizai ādas attīrīšanai

Katru dienu mūsu āda ir pakļauta vides kaitīgajai ietekmei – gaisa un ūdens piesārņojumam, kā arī ultravioletajam starojumam. Pareiza un pilnvērtīga sejas attīrīšana ir pirmā palīdzība nogurušai ādai un svarīgs solis ādas veselības un jauneklīga izskata saglabāšanas virzienā.

Vēl par šo tēmu

Vēl šajā sadaļā

Laika ziņas