Scroll Top

MĀKSLĪGAIS INTELEKTS – PALĪGS TULKOŠANAI, TAČU NE AIZSTĀJĒJS

Mākslīgais intelekts 2023. gadā dominēja daudzu ziņu un viedokļrakstu virsrakstos. Kādas iespējas un riskus sniedz MI rīki? Vai tie kalpo kā “burvju nūjiņa”, kas spēj atrisināt gandrīz jebko? Šo un daudz kā cita uzzināsiet šajā “Skrivanek” bloga ierakstā.

Mākslīgā intelekta rīki, kas veidoti uz lielo valodas modeļu bāzes (“large language model”), pirmo reizi nonākot plašākas auditorijas rīcībā, daudziem radīja pretrunīgas izjūtas – sākot ar sajūsmu līdz pat pamatīgām bažām.

Darbinot klasiskos mākslīgā intelekta čatbotus, pastāv zināmi riski un ierobežojumi – it īpaši tulkošanas ziņā –, taču ar apdomu un pat viltību to izmantošana ir iespējama. Īsāk sakot, būs nepieciešama valodas profesionāļa iesaiste.

BIEŽI TRŪKST VIETĒJĀ KONTEKSTA

Teksta tulkošana kā process varētu šķist pavisam vienkāršs. Ņemam vienu vārdu, piemeklējam tādu pašu citā valodā, kurā teksts jāatveido, un gatavs!

Tik vienkārši vis nav. Īpaši radošos materiālos.

Katrai valodai var atšķirties teikumu uzbūve, partikulas, personvārdu atveide un daudz kā cita. Nemaz nerunājot par īpatnējākiem izteicieniem, frazeoloģismiem vai saīsinājumiem.

Piemēram, angļu valodā nereti viena teikuma ietvaros tiek izmantoti ne tikai viens vai divi, bet pat četri un pieci vietniekvārdi. Šāda veida teksts, apstrādājot mašīntulkošanā bez papildu instrukcijām, latviešu valodas pratējiem šķitīs savāds, nedabisks.

Mākslīgais intelekts - 1. attēls

Avots: “ChatGPT” 4.0 versija. Tulkošanas piemērs bez papildu instrukcijām.

MAZ TRENIŅDATU LATVIEŠU VALODĀ

Ņemot vērā latviešu valodā runājošo skaitu visā pasaulē, ir skaidrs, ka čatbotu trenēšanā pamatā izmanto plašāk izplatītas valodas – angļu, spāņu. Līdz ar to, ja vien čatbotam netiek speciāli piekodināts rīkoties īpašā veidā, tad ar valodas kultūru saistīti jautājumi “pazudīs tulkojumā”.

Mākslīgais intelekts - 2. attēls

Avots: “ChatGPT” 4.0 versija. Tulkošanas piemērs bez papildu instrukcijām.

Piemērā norādītais teikums ir visai vienkāršs, taču uzreiz tajā ir redzamas vairākas kļūdas, no kurām pamanāmākās ir nepareizas galotnes. Tās izlabojot, varētu domāt, ka teksts ir lietojams.

Taču latviešu valodas kultūrā nepastāv izteiciens par “sarkanajiem karodziņiem”, tādēļ daļa lasītāju varētu būt neizpratnē, ko īsti vēlamies ar šādu teikumu pateikt.

Mākslīgais intelekts - 3. attēls

Avots: “ChatGPT” 4.0 versija. Tulkošanas piemērs ar papildu instrukciju padarīt tekstu lasāmāku latviešu kā dzimtās valodas pratējiem.

Sniedzot čatbotam vēl vienu instrukciju, proti, padarīt tulkoto tekstu patīkamāku un lasāmāku latviešu valodas kā dzimtās pratējiem, teikums kļūst saprotamāks nekā iepriekšējā piemērā.

Taču, ja nav cita papildu konteksta, tad tas tāpat ir nedaudz mulsinošs. Par kādiem brīdinājuma signāliem runājam? Vadības paneļa lampiņām? Pagrieziena rādītājiem? Vai tomēr neparastiem trokšņiem motortelpā, uzsākot braucienu?

TEKSTS IR RŪPĪGI JĀPĀRBAUDA

Jebkurš vārds, kuru mums “izsniedz” čatboti, ir rūpīgi jāpārbauda. Tulkojot varētu šķist, ka faktu pārbaudei ir jāvelta mazāk uzmanības. Tiesa, jo pamata materiāls robotam jau ir, taču nereti arī tulkotie vārdi var pārveidoties un kļūt nedaudz dīvaini.

Mākslīgais intelekts - 4. attēls

Avots: “ChatGPT” 4.0 versija. Vaicājums pēc analoga latviešu valodā, kas apraksta angļu valodas vārdu “pop” reklāmas materiāla izveidei.

Kā redzams augstāk pievienotajā attēlā, mašīntulks sniedz 66 % neizmantojumu variantu, kas latviešu valodā neeksistē, vai arī ir ar citu kontekstu. Bieži šāds fenomens ir novērojams, vaicājot čatbotiem sniegt kādas citas valodas analogu latviešu valodā.

Ja vaicājums ir īss, iespējams, konteksta ir par maz, lai sniegtu apmierinošu vai pat labu variantu.

Taču līdzīgas situācijas ikdienā tiek novērotas arī ar garākiem tekstiem, kuros pēkšņi itin ikdienišķiem vārdiem galotnes kļūst izteikti greizas. Gluži kā raksta pirmajā vizuālajā piemērā, kur vārds “līdzīgā” pārtapa par neeksistējošu “līdzējā”.

INFORMĀCIJA VAR TIKT IZMANTOTA TRENIŅU NOLŪKOS

Kā vēsta sena interneta vides paruna – kas nonācis internetā, tur paliek uz mūžiem.

Cik lielā apjomā dati pēc to ievades čatbotos nonāk treniņu datos, to zina tikai paši izstrādātāji, taču, ja vien netiek izslēgta robota atmiņa, tad daļa no šiem datiem var nonākt izstrādātāju rīcībā.

Tādēļ pirms populārāko čatbotu izmantošanas ir vērtīgi iepriekš izveidot vadlīnijas, kāda veida saturu var tajā rakstīt bez raizēm, neuztraucoties par datu vai ideju “noplūdēm”.

Šā iemesla dēļ vairāki uzņēmumi veido savus iekšējos mākslīgā intelekta rīkus, lai dati nenonāktu trešo personu rīcībā.

MI RĪKI PAMAZĀM KĻŪST SLINKĀKI

Jo vairāk mākslīgā intelekta treniņdatos tiek iekļauti reāli dati no sociālajiem tīkliem un diskusiju forumiem, jo robotiņš kļūst slinkāks.

Iemesls tam ir visai uzjautrinošs un, iespējams, ne gluži precīzākais, bet ar laiku, atkārtojot līdzīgas darbības, piemēram, prasot aprakstīt vai izskaidrot tīmekļa vietni vai dokumentu, “ChatGPT” bez spraudņiem jeb “plug-ins” visbiežāk palīdzēs ar nelielu daļiņu, nevis izpildīs visu uzdevumu.

Pirms kāda laika “ChatGPT” kā jaunumu piedāvāja iespēju robotam iesniegt datnes, tos augšupielādējot, kurus tas spētu analizēt. Varētu šķist, ka šo funkciju tikpat labi varētu izmantot, lai tulkotu vairāku desmitu lappušu dokumentus.

Taču nē. Robots drīzāk sniegs nelielu ieskatu viena vai vairākos paragrāfos, bet pilnībā ignorēs pārējo dokumentu.

Iespējams, ka pie slinkuma ne tik daudz vainojama robotu novērotā rīcība internetā, cik valodas modeļa darbināšanas augstās izmaksas. 2023. gada aprīlī datu pētniecības uzņēmums “SemiAnalysis” secināja, ka katrs prasījums vai pavēle (“prompt”), kas ievadīta čatbotā, izmaksā 0,36 dolārus.

DATU APJOMS IR PĀRĀK PLAŠS

Izmantojot mākslīgā intelekta rīkus, lai tulkotu tekstus, dokumentus, lielā mērā ir noderīgi, ja treniņdatos ir iekļauts jau gandrīz viss internets – teorētiski robotam neviena tēmu nebūtu sveša.

Taču, kā saka, kas der visam, tas neder nekam.

Lai padarītu tulkošanu efektīvāku, ir divas iespējas – pašrocīgi cīnīties, veidojot pielāgotas pavēles, vai arī izmantot kādu jau latviešu valodas kultūras īpatnībām pielāgotu tulkošanas rīku.

Ja apsverat domu par mašīntulkošanu, pieslēdzot arī mākslīgo intelektu, tad iesakām ieskatīties “Skrivanek” veidotajā mašīntulkošanas risinājumā, kas pielāgots uzņēmumu vajadzībām.

Kā jau minēts, izmantojot “ChatGPT” un citus līdzīgus rīkus, treniņdatu apjoms ir plašs, taču tas nav pielāgots latviešu valodai.

Jā, arī bez pielāgojumiem ir iespējams iegūt visai augstu precizitāti ar MI rīkiem, taču ne vienmēr var paļauties, ka saturs būs bez barbarismiem, nevajadzīgiem anglicismiem vai MI jaunradītiem vārdiem.

Tulkots teksts pilnībā sasniedz savu uzdevumu, ja, to lasot, nav iespējams pateikt, ka tas iepriekš radīts citā valodā.

“SKRIVANEK” MAŠĪNTULKOŠANAS RĪKA PRIEKŠROCĪBAS:

  • Ātra apstrāde. Ja tekstu nepieciešams tulkot, lai pēc iespējas ātrāk izprastu dokumenta jēgu, ar mašīntulkošanas rīku iespējams ietaupīt laiku un naudu.
  • Pielāgots vietējam tirgum. Izteicieni, kas saprotami vienā valstī, citā var likt brīnīties.
  • Dati netiek uzglabāti serverī. Tradicionālajos MI rīkos ievadītā informācija var tikt izmantota treniņu nolūkiem. “Skrivanek” neironu mašīntulkotājā ievadītā informācija netiek nodota tālāk trešām personām.
  • Iespēja tekstu “noslīpēt”. Lai pārliecinātos, ka teksts būs “nopucēts līdz ūsiņai”, pēc MI rīka izmantošanas iespējams piesaistīt profesionālu tulkotāju vai tekstu radītāju.

KOPSAVILKUMS

Katram rīkam ir savas priekšrocības un trūkumi. Mākslīgā intelekta rīki nav izņēmums – to radītie teksti var tikt lietoti, taču, lai iegūtu ļoti izcilus, elegantus tekstus, kas mudina uz rīcību, ir svarīgs valodnieka vai tulkotāja pieskāriens.

Mākslīgais intelekts spēj veikt brīnumu lietas – it īpaši saskaroties ar šādiem rīkiem pirmo reizi –, taču bieži tie ir pārāk neparasti, lai varētu tikt uzreiz izmantoti. Lai teksts būtu labs un atbilstošs vietējam tirgum, ir svarīgs profesionāla valodas eksperta skatījums.