VAI MĀKSLĪGAIS INTELEKTS UN MAŠĪNTULKOTĀJI TIEŠĀM IR TIK LABI?

Mūsdienu digitālajā pasaulē ātra un iedarbīga saziņa ir vitāli svarīga, tādēļ ir viegli saprast, kāpēc tulkošanas un valodu pakalpojumu nozarei ir tik liela nozīme mūsu arvien vairāk digitalizētajā pasaulē. No īpaši svarīgu zinātnisku, medicīnisku un farmaceitisku dokumentu tulkojumiem līdz uzņēmumu ikdienas dokumentācijas paraugiem un pat gadījuma rakstura tūristiem, kas meklē jaunas vietas, ko iepazīt – lūk, cik plašs ir mākslīgā intelekta un mašīntulkotāju (machine translation – MT) darbalauks. Efektīva un pārdomāta tulkošana un komunikācija vēl nekad nav bijusi tik svarīga. Kā tapt sadzirdētam šajā vienveida informācijas lavīnā? Tā kā 20. un 21. gadsimtā tulkošanas nozare piedzīvoja eksponenciālu izaugsmi, bija nepieciešamas nepārtrauktas inovācijas, lai veicinātu tulkotāju spējas ne tikai sekot līdzi pieaugošajam pieprasījumam, bet arī atrast efektīvākus veidus un rīkus, kā tulkot ātrāk milzīgus satura apjomus. Pagājušā gadsimta 50. gados galvenā uzmanība tika pievērsta mašīntulkošanas attīstīšanai, un, lai gan ceļā uz to ir bijuši daudzi apstāšanās un atsākšanās punkti, mūsdienās varam izbaudīt neizmērojamus labumus, ko sniedz CAT (Computer Assisted Translation) – datorizētās tulkošanas rīki, kas ir revolucionizējuši tulkošanas procesus visā pasaulē.

Mašīntulkošanas (MT) nepieciešamība

Mūsdienās tehnoloģijas turpina attīstīties fenomenālā ātrumā, un līdz ar tām arī mašīntulkošana, runas atpazīšanas vai teksta veidošanas tehnoloģijas. MT iekļauj to, ko mēs, nozares profesionāļi, saucam par CAT rīkiem; tā ir jebkura datorizēta tulkošana, ko lieto lingvisti visā pasaulē, lai spētu veikt kvalitatīvus līdzīga satura tulkojumus daudz ātrāk, taupot klientu laiku un naudu. Milzīgs materiālu apjoms, kas ik dienu ir jātulko, vienkārši ir pārāk liels, lai to paveiktu tulkotāji. Lingvistu nepietiek, lai apmierinātu mūsu nesātīgo apetīti pēc daudzvalodu saziņas ātras pieejamības; ņemot vērā to, ka visā pasaulē ir vairāk nekā 6000 valodu, ir skaidrs, kāpēc CAT rīki ir kļuvuši nenovērtējami tulkošanas nozarē.

Tulkošanas glosāriji

Ir jāpanāk korekts līdzsvars starp leksiskās integritātes saglabāšanu, vienlaikus pareizi pārtulkojot paredzēto nozīmi no avotvalodas uz mērķvalodu. Pirms datorizētās tulkošanas sistēmu parādīšanās šis process bija darbietilpīgs un ilgstošs, un valodniekiem bija nepieciešamas gan plašas zināšanas, gan prasmes, gan apņēmība.

Pirms elektroniskajām tulkošanas vārdnīcām?

Tulkotāji bija spiesti izmantot terminoloģijas vārdnīcas, kas, lieki piebilst, bija nogurdinoši, kā arī galu galā izraisīja lielāku nekonsekvenci starp dažādu valodnieku veiktajiem tulkojumiem, izmantojot dažādas vārdnīcas.

Datorizētu elektronisko tulkošanas vārdnīcu un glosāriju ieviešana, kas spēj iekļaut neiedomājami vairāk terminu nekā daudzas papīra vārdnīcas, nemaz nerunājot par pašiem tulkotājiem, nozīmēja, ka tulkošanas process kopumā varētu tikt racionalizēts, kā arī kļūt daudz efektīvāks laika un izmaksu ziņā.

Atvērta grāmata ar spuldzi un smadzeņu simbolu tās iekšpusē, uz spuldzes uzlikta absolventa cepure – simbolisks vēstījums, ka labākais tulkotājs ir cilvēks.

Burtu klucīši ar uzrakstu "AI WRITING" uz gaiši zaļa fona – jautājums par mākslīgā intelekta spējām rakstīt un tulkot tekstus latviešu un angļu valodā.

Biznesa tērptas personas pirksts pieskaras digitālai mikroshēmai ar uzrakstu "AI", apkārt redzami virtuālo čatu logi – mākslīgā intelekta iespējas tulkošanā.

CAT RĪKI ŠODIEN

CAT rīki pārsniedz vienkāršu tulkošanas vārdnīcu digitalizāciju; ir pieejami visdažādākie rīki, kas tulkotājiem un tulkošanas komandām sniedz būtisku palīdzību, nodrošinot ātrus un uzticamus pakalpojumus, pie kuriem esam pieraduši mūsu dinamiskajā pasaulē. Tulkošanas atmiņu (translation memory – TM) datubāzes un tulkošanas pārvaldības sistēmas (translation management systems – TMS) nodrošina iespēju piekļūt iepriekš veiktiem tulkojumiem, tos saglabāt, izveidot un atkārtoti izmantot turpmākajos projektos.

Šīs savstarpēji papildinošās MT sistēmas ne tikai būtiski ietaupa laiku projektiem, bet arī palīdz nodrošināt konsekvenci klientu tulkošanas projektos, it īpaši tad, kad tas ir vissvarīgāk, piemēram, saglabājot zīmola identitāti, saskaņoti tulkojot mārketinga materiālus jauniem tirgiem.

MT priekšrocības tulkojumiem

Nepārtrauktas inovācijas MT jomā ir patiesi revolucionāri ietekmējušas tulkošanas metodes mūsdienās. Lai gan tie nav pat tuvu tam, lai aizstātu cilvēku veiktos tulkojumus, tie ir snieguši tulkotājiem nepārspējamas priekšrocības. Veicot laikietilpīgus un atkārtojošos uzdevumus, piedāvājot standartizētu centrālo informācijas bāzi, kur komandas var strādāt, kā arī nodrošinot ātru piekļuvi iepriekš paveiktajam darbam, MT ievērojami palielina valodas speciālistu produktivitāti. Tas ļauj viņiem koncentrēties uz tulkošanas cilvēcisko pusi, proti, kultūras īpatnību atšifrēšanu, jokiem, lokalizēšanu atbilstoši kultūras kontekstam un augstākas kvalitātes tulkojumu veikšanu īsākā laikā, piemeklējot unikālo teksta tonalitāti, lai tas atšķirtos un lasītājam rastos vēlme ilgāk pie tā pakavēties. Tulkotāja uzdevums joprojām ir izcīnīt lasītāja laiku un uzmanību.

Mašīntulkošanas un MI kļūdas

Mašīntulkošanas (MT) sistēmas pēdējos gados ir strauji attīstījušās, tomēr tās joprojām mēdz pieļaut dažāda veida kļūdas. Šīs kļūdas var būt gan tīri lingvistiskas (gramatikas, vārdu izvēles, stila ziņā), gan “konteksta kļūdas”, kas rodas no tā, ka datoram trūkst cilvēka izpratnes par konkrēto situāciju konkrētajā vietā un laikā. Zemāk aplūkoti reāli piemēri no dažādām jomām, statistika par kļūdu biežumu, izplatītākie kļūdu veidi un to ietekme uz tulkojumu kvalitāti un lietotāju uzticību.

Reāli mašīntulkošanas kļūdu piemēri

Medicīna: Pētījumā par ārstu norādījumu tulkošanu atklājās bīstama kļūda – angļu frāze
“hold the kidney medicine until you speak with your doctor” (aptuveni “pagaidām nelietojiet zāles nierēm līdz konsultācijai ar ārstu”)
tika mašīntulkota tā, ka pacients saprastu, ka zāles jāturpina lietot līdz konsultācijai.Šāda pretējas nozīmes kļūda medicīnas tekstā var apdraudēt pacienta veselību.
Tehnika/tirdzniecība: Kad 2020. gadā “Amazon” atklāja vietni zviedru valodā, lietotāji pamanīja virkni automātiskā tulkojuma kļūdu.
Piemēram, preces aprakstā ar vistu un gaili attēlā frāze par gaili jeb angliski “cock” tika pārtulkota kā izteiciens, kas zviedriski nozīmē
rupju, necenzētu vārdu, jo sistēmai pietrūka konteksta un izvēlējās “cock” rupjo nozīmi.Šis piemērs rāda, ka MT sistēma neveiksmīgi izvēlējās vārdam “cock” atbilstošo nozīmi, radot nepiemērotu un aizskarošu tulkojumu.
Tūrisms/sadzīve: 2018. gadā ziemas olimpiskajās spēlēs Norvēģijas komandas šefpavāri, izmantojot Google Translate,
korejiešu piegādātājam pasūtīja 1500 olas, taču Google Translate kļūdas dēļ pasūtījums izauga desmitkārt – olimpiskajā ciematā tika piegādātas 15 000 olas.MT rīks nepareizi interpretēja skaitli vai vienību, izmainot nozīmi un radot loģistikas pārpratumu.

Mārketings/idiomas: Klasiskais piemērs ir ātrās ēdināšanas uzņēmuma KFC sauklis “Finger-licking good” (par ēdienu – “tik garšīgs, ka pirkstus aplaizīsi”). Mašīntulkošanas rezultātā ķīniešu valodā tas parādījās kā “apēd savus pirkstus”, kas būtiski izkropļoja vēstījumu.Arī vispārīgi MT bieži tulko idiomas burtiski – piemēram, angļu izteicienu “to hit the books” tiešā tulkojumā kā “sist grāmatas”, lai gan patiesībā tas nozīmē “mācīties”. Šādi burtiski tulkojumi bez konteksta izpratnes rada nepareizu vai absurdu rezultātu.
Terminoloģija: Nozaru specifiski teksti ir izaicinājums MT. Piemēram, juridiskā tekstā vārds “appeal” var nozīmēt gan “apelācija” (tiesvedībā), gan “piesaistīt” (piemēram, “appeal to audience” – “uzrunāt auditoriju”). Bez konteksta mašīntulkotājs var izvēlēties neatbilstošu terminu. Līdzīgi tehniskos aprakstos vārds “lead” var tikt pārtulkots kā “vads” vai “svins”, atkarībā no nozīmes – MT nereti kļūdās šādās daudznozīmīgās leksikās izvēlēs.Turklāt “lead” mārketinga tekstā nozīmē “potenciāls klients”, un MT/MI var sajaukt, un potenciālais klients var pārtapt par ko tehnisku. Šādi var tikt sabojātas tehniskās instrukcijas, ja kļūda ir pieļauta vārda nozīmēs, kas saistītas ar tehnisko nozari, kā arī sajaukt prātu mārketinga cilvēkiem, ja potenciālie klienti pārtop par svinu vai vadu/pievadu.
Finanšu: Valūtas nosaukums “real” (oficiālā Brazīlijas valūta) mašīntulkojumā kļūdaini tika atveidots kā “reiži” – vārds, kas latviešu valodā vispār nepastāv.Korekts tulkojums šajā gadījumā būtu “Brazīlijas reāls” (vienskaitlī) vai “Brazīlijas reāli” (daudzskaitlī). Šāda kļūda, iespējams, rodas, jo MT rīks neizprot, ka “real” šajā gadījumā nav īpašības vārds (reāls kā antonīms vārdam iedomāts), bet gan valūtas nosaukums, un tādējādi, iespējams, saprotot, ka īpašības vārds “reāls” neder kontekstuāli, mēģina izveidot jaunu vārdu pēc “dollar” jeb “dolārs” principa.

Persona tur viedtālruni ar digitālu zemeslodes attēlu un valodu nosaukumiem, piemēram, English, Español, 中文 – vai mākslīgais intelekts un mašīntulkojumi ir labākie tulkotāji?

Dažādu cilvēku rokas apvienojas kopīgā “high five” žestā – simbols sadarbībai starp cilvēku un mākslīgo intelektu, tostarp tā spējai rakstīt latviski.

Persona rokās tur viedtālruni ar vizualizētu čatbota ikonu un uzrakstu "Hi..." – simbols mašīntulkošanas iespējām latviešu valodā.

KĻŪDU BIEŽUMS UN STATISTIKA

Reuters Health pētījums atklāja, ka mašīntulkošanas kļūdas joprojām ir samērā biežas, lai gan to skaits ir atkarīgs no valodas pāra un izmantotā MT risinājuma kvalitātes. Piemēram, vienā medicīnas teksta eksperimentā, tulkojot pacienta instrukcijas ar Google Translate, 92 % teikumu spāņu tulkojumā bija precīzi, bet ķīniešu valodā – tikai 81 %, latviešu valodā šis skaitlis noteikti būtu daudz zemāks.

Tātad attiecīgi aptuveni 8 % (spāņu) un 19 % (ķīniešu) teikumu saturēja kļūdas. Neliela daļa no šīm kļūdām (2 % spāņu un 8 % ķīniešu) bija nopietnas un potenciāli bīstamas.

Situācija mazāk izplatītām valodām, piemēram, latviešu, ir līdzīga – labākās MT sistēmas pieļauj ~1–2 kļūdas uz 100 vārdiem, savukārt vecākas vai mazāk trenētas sistēmas – pat 10+ kļūdas uz 100 vārdiem.

Citiem vārdiem sakot, pat modernā neironu MT rezultātā vidēji ik pēc 2–3 teikumiem rodas kāda valodas kļūda, bet vājāku modeļu gadījumā kļūda var būt teju katra teikuma tulkojumā.

Šīs kļūdas var būt dažādas – no nelielām gramatikas neprecizitātēm līdz pilnīgi aplamai nozīmei.

Ir arī novērots, ka tulkojot no valodas, kurā nav dzimtes formu, uz valodu ar dzimti (piemēram, no angļu uz latviešu), MT sistēmas mēdz sistemātiski kļūdīties dzimtē.

Arī neatpazīti specializētie termini vai saīsinājumi var palielināt kļūdu īpatsvaru tekstā, kā arī mašīntulkošanas rīkiem ir izteiktas problēmas ar lielajiem burtiem, virsrakstiem no angļu valodas (jo tie bieži tiek veidoti, ka katra vārda sākumburts ir lielais).

Kļūdu veidu biežums

Lai gan precīzs kļūdu biežums katram veidam svārstās atkarībā no teksta un valodas, zemāk tabulā apkopoti izplatītākie kļūdu veidi un to sastopamība:

Kļūdu kategorija	Apraksts un piemērs	Biežums
Vārdu nozīmes (leksiskās)	Nepareiza vārda nozīmes interpretācija vai vārda izvēle neatbilstošā nozīmē.	Ļoti bieži daudznozīmīgos terminos.
Idiomas un frāzes	Idiomātisku izteicienu tulkošana burtiski. Piemērs: “to hit the books” → “sist grāmatas” (pareizi: “mācīties”).	Diezgan bieži sastopams, īpaši ar retākām frāzēm.
Gramatika / struktūra	Gramatiskas kļūdas (laiki, locījumi), sintakses kļūdas. Piemērs: darbības vārda forma pagātnē → tagadnē.	Bieži, īpaši sarežģītos teikumos.
Dzimte	Nepareiza dzimte. Piemērs: “ārsts” → būtu “ārste”.	Samērā bieži, ja nav konteksta norāžu.
Terminoloģija	Specializētu terminu kļūdas. Piemērs: “to hold medication” → “turpināt lietot” (pareizi: “(uz brīdi) pārtraukt lietot”).	Ļoti augsts risks specifiskās nozarēs (medicīna, jurisprudence, IT).
Stils / tonis	Nepiemērots stils vai tonis. Piemērs: familiāra forma vietā, kur jābūt formālai.	Vidēji bieži. MT reti saprot nianses.
Pareizrakstība / interpunkcija	Trūkstošas pieturzīmes, lielie burti utt. Piemērs: komatu kļūdas var mainīt nozīmi.	Reti, bet joprojām sastopami punktuācijas trūkumi garos teikumos.
“Halucinācijas”	Izdomāts saturs. MT ģenerē frāzes, kas nav oriģinālā. Var būt aizskarošs vai aplams. Maina burtus, neizprot datumu pierakstu u. c.	Ļoti reti, bet bīstami – MT var radīt pilnīgi nepatiesu informāciju.
Pretēja nozīme / negācija	Pazūd “ne” daļiņa vai mainās polaritāte. Piemērs: “nav ieteicams” → “ieteicams”.	Reti, bet ļoti bīstami (tiek sauktas par katastrofālām kļūdām).

(Tabulā “biežums” kolonnā sniegts aptuvens novērtējums, jo precīzs procents atkarīgs no valodas pāra un teksta veida. Piemēram, latviešu valodā gramatisko kļūdu īpatsvars var svārstīties no <2% līdz >10% atkarībā no MT kvalitātes).

Kļūdu ietekme uz tulkojumu kvalitāti un uzticību

MT radītās kļūdas var ietekmēt tulkojumu kvalitāti un lietotāju uzticēšanos mašīntulkotiem tekstiem. Profesionālajā tulkošanā šīs kļūdas parasti cenšas novērst ar pēcrediģēšanu – proti, cilvēks (profesionāls tulkotājs vai redaktors) pārlasa un izlabo mašīnas tulkojumu, lai tas atbilstu nepieciešamajai kvalitātei

Piemēram, tulkošanas biroji vienmēr pārbaudīs, vai nav gadījusies kāda rupja nozīmes kļūda vai nepareizs terminoloģijas lietojums, pirms tekstu nodot klientam.

Lietotāju uzticība MT risinājumiem ir divējāda. No vienas puses, lasītāji dod priekšroku saturam savā valodā, pat ja tur reizēm ir kāda neliela kļūda – CSA Research pētījumā noskaidroja, ka 76% patērētāju dod priekšroku produktiem ar informāciju savā dzimtajā valodā, pat ja tulkojumā ir nelieli trūkumi, un 40% no viņiem nekad nepērk no vietnēm, kas nav pieejamas viņu valodā.

No otras puses, nopietnas vai komiskas kļūdas var graut uzticamību. Ja uzņēmuma mājaslapā vai oficiālā dokumentā redzamas acīmredzamas tulkojuma kļūdas, lietotājs var sākt šaubīties par informācijas ticamību kopumā. Īpaši bīstami tas ir situācijās ar kritisku informāciju – piemēram, valsts iestādes paziņojumos sabiedrībai. Katastrofālas kļūdas (piemēram, nepareizi pārtulkots aizliegums vai medicīniska instrukcija) var novest pie reputācijas zaudēšanas un uzticības zuduma.

Tāpēc publiskai saziņai un biznesa vajadzībām vienmēr ieteicams MT izmantot piesardzīgi – kā palīgrīku, bet gala tekstu pārbaudīt cilvēkam.

Profesionalizētā tulkošanā MT kļūdas tiek uztvertas kā kvalitātes riski, taču ar atbilstošiem rīkiem un procesiem (piemēram, integrētiem kvalitātes pārbaudes rīkiem, terminoloģijas glosārijiem, mašīntulkojuma pēcrediģēšanu) daudzus riska momentus var mazināt. Galu galā, mūsdienu MT sistēmas ietaupa laiku un resursus, bet paļaušanās uz tām prasa sapratni par to ierobežojumiem. Lietotāja uzticība MT risinājumiem pieaug, ja tie tiek lietoti atbildīgi – piemēram, tulkojumu kvalitāte ir konsekventa un kļūdas tiek ātri izlabotas. Ja gala teksts pēc MT apstrādes ir labots tā, ka lasītājs nepamana mašīnas darbības pēdas, tad arī uzticēšanās nav iedragāta.

Lai arī mašīntulkošana piedāvā nepārspējamu ātrumu un apjomu, šie piemēri apliecina – kvalitātei un nozīmes precizitātei nav alternatīvas. Neatļaujiet, lai tulkošanas kļūdas grauj jūsu profesionālo tēlu vai izkropļo būtisku informāciju. Uzticieties profesionāļiem – apvienojiet MT efektivitāti ar cilvēka precizitāti un nodrošiniet kvalitatīvus, jēgpilnus tulkojumus katram vārdam!

📣 Ja arī jūs nevēlaties riskēt ar tulkojuma kļūdām, kas var izkropļot svarīgu informāciju vai pat kaitēt uzņēmuma reputācijai, ļaujiet mums palīdzēt! Sazinieties ar Skrivanek valodu tehnoloģiju ekspertiem, lai kopā rastu optimālāko risinājumu jūsu vajadzībām – vai tas būtu mašīntulkošanas pēcrediģēšana, terminoloģijas pārvaldība, profesionāli tulkojumi vai lokalizācijas stratēģija.

Mēs sadarbojamies ar klientiem dažādās nozarēs – no medicīnas, farmācijas, tehnoloģijām un jurisprudences līdz valsts pārvaldei, izglītībai, tūrisma, e-komercijas un mārketinga jomai. Katrā no šīm sfērām valodas precizitātei un terminoloģiskajai konsekvencei ir izšķiroša nozīme. Tieši tādēļ piedāvājam ne tikai tulkošanas pakalpojumus, bet arī tehnoloģiski atbalstītus un cilvēka prasmēs balstītus risinājumus, kas pielāgoti katras nozares specifikai.

Neļaujiet tulkošanas kļūdām kļūt par šķērsli starptautiskai izaugsmei! Piesakieties tiešsaistes konsultācijai vai lūdziet personalizētu piedāvājumu – mēs esam šeit, lai jūsu ziņojums jebkurā valodā būtu skaidrs, iedarbīgs un profesionāls. Kvalitāte sākas ar valodu.

NEPIECIEŠAMS DOKUMENTU TULKOJUMS, NOTARIĀLI APLIECINĀTS TULKOJUMS VAI MĀJASLAPAS LOKALIZĀCIJA? SAZINIETIES AR MUMS!

Pasūtītājs

Privātpersona
Uzņēmums

E-pasts

Valodu kombinācija

Papildu informācija

Pievienot dokumentu līdz 20 MB, ja dokumenta izmērs ir lielāks, lūdzam to norādīt ziņā un mēs sazināsimies

Drag & Drop Files, Choose Files to Upload You can upload up to 10 files.

Kā par mums uzzinājāt

Nospiežot pogu "Nosūtīt", jūs piekrītat personas datu apstrādei saskaņā ar Skrivanek Baltic Privātuma politiku.