1515

Google Translate är (fortfarande) hopplöst dåligt på att översätta svenska klassiker

Med en ny teknik vill Google Translate göra yxiga och kantiga översättningar till ett minne blott. Tjänsten rullades nyligen ut i Sverige. Men hur fungerar den? Di Digital har testat och är inte helt imponerade.

August Strindberg och Selma Lagerlöf. Kollage.
August Strindberg och Selma Lagerlöf. Kollage.

Dagligen använder miljontals människor över hela världen Googles översättningstjänst Google Translate som lanserades 2006. De flesta som har använt verktygen har nog reagerat på de ibland yxiga och kantiga översättningar den producerar.

Längre fraser eller meningar från skönlitteratur blir ofta obegripliga eller helt manglade.

Eller blev.

Hösten 2016 uppmärksammade nämligen en del användare att översättningarna plötsligt hade blivit bättre och lättare att förstå. Sökjätten hade då rullat ut tjänsten i en ny tappning, med stöd för åtta språk, som översatte på ett sätt som ligger närmare hur vi människor använder språket.

I stället för att översätta fraser i mindre delar så har Google gått över till ett system som de kallar ”neural machine translation” som översätter hela meningar på en och samma gång. Genom att ta hänsyn till meningens kontext menar sökjätten att de kan hitta den mest relevanta översättningen.

”Översättningarna blir nu mer exakta och liknar bättre det språk vi människor använder när vi pratar med varandra”, säger Andrea Lewis Åkerman, som är kommunikationsansvarig på Google i Sverige och Finland, till Di Digital.

Ett reportage i New York Times från i vintras visade på närmast perfekta översättningar från japanska till engelska tack vare den nya tekniken. Nyligen fick den uppdaterade översättningsalgoritmen stöd för översättning från svenska till engelska och vice versa.

Maskininlärning är ett central tema, säger Andrea Lewis Åkerman.

”Google Translate kommer bara att fortsätta bli bättre allt eftersom fler översätter genom tjänsten, eftersom teknologin gör att systemet nu lär sig att skapa mer naturliga och lättförståeliga översättningar.”

Hur blir då översättningarna efter att Google bytt ut sin översättningsalgoritm?

Di Digital har testat med två klassiska inledningar ur den svenska litteraturhistorien och en från den amerikanska.

Selma Lagerlöfs vackra inledning till ”Gösta Berlings saga” lyder:

”Äntligen stod prästen i predikstolen. Församlingens huvuden lyftes. Så, där var han ändå! Det skulle inte bli mässfall denna söndagen såsom den förra och många söndagar förut. Prästen var ung, hög, smärt och strålande vacker.”

I Google Translates översättning blir det:

”At last the priest stood in the pulpit. The heads of the congregation are lifted. So, there he was anyway! It would not be fairfall this sunday like the last and many sundays before. The priest was young, tall, painful and radiantly beautiful.”

Google Translate missar alltså översättningen av ”mässfall” och gör den meningen svårförståelig överlag. ”Smärt” förvandlas dessutom till ”painful”. Resten är, om inte perfekt, så åtminstone läsbart.

August Strindbergs klassiska inledning till ”Hemsöborna” lyder:

”Han kom som ett yrväder en aprilafton och hade ett höganäskrus i en svångrem om halsen. Clara och Lotten voro inne med skötekan att hämta honom på Dalarö brygga; men det dröjde evigheter innan de kommo i båt.”

I Google Translates översättning blir det:

”He came as an appetite an aprilafton and had a tall easter egg in a strap around his throat. Clara and Lotten were in a hurry to pick him up at Dalarö Pier; But it lasted forever before they got into a boat.”

Strindbergs mer komplexa språk ställer till det för Google Translate. ”Yrväder” blir ”appetite”, ”aprilafton” översätts inte alls och ”höganäskrus” blir ”tall easter egg”, för att nämna några problem.

Inte särskilt imponerande, enligt Anna Sågvall Hein. Hon är professor emeritus i datorlingvistik vid Uppsala universitet och vd för Convertus, ett maskinöversättningsbolag som grundades vid universitetet.

”I en riktig litterär översättning jobbar översättaren otroligt mycket med att skapa rätt stämning och rätt känsla. Allt går förlorat i en mekanisk översättning”‚ säger Anna Sågvall Hein som påpekar att Google Translate fortfarande ger ett mycket mindre varierat språk än traditionell litterär översättning.

Googles översättningar grundar sig inte på ett lexikon, där till exempel ”bord” alltid blir ”table”. Därmed riskerar ”smärt” att översättas till ”painful”, som i fallet med Selma Lagerlöfs text ovan, i stället för till exempel ”slender”.

”Google Translate bygger på sannolikheter. Östergötland kan bli Västergötland eftersom de två har förekommit i samma kontext många gånger. Det är en fundamental skillnad mot annan översättning.”

Resultaten blir dock något bättre i översättningen från engelska till svenska.

Vi testade detta med inledningen från Scott F Fitzgeralds klassiker ”The Great Gatsby”.

Den lyder:

”In my younger and more vulnerable years my father gave me some advice that I’ve been turning over in my mind ever since.

'Whenever you feel like criticizing any one,' he told me, 'just remember that all the people in this world haven’t had the advantages that you’ve had.'”

I Google Translates översättning blir det:

”I mina yngre och mer sårbara år gav min far mig några råd som jag har vända mig om i mitt sinne ända sedan.

'När du känner för att kritisera någon', berättade han för mig, 'kom bara ihåg att alla människor i den här världen inte har haft de fördelar du har haft.'”

Exakt vad som vänder sig inuti huvudpersonen är inte helt klart i Googles version, men resten är nästan prickfritt. Till sin hjälp har Google i detta fall ett relativt enkelt språkbruk i originaltexten.

Det finns dock ännu mer pricksäkra Google-översättningar. 

New York Times testade den nya översättningsalgoritmen med en passage från Ernest Hemingways ”Snön på Kilimanjaro”. Den nya algoritmen hade då stöd för översättning från engelska till japanska och vice versa, men ännu inte svenska och engelska.

Originalet:

”Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.”

Google Translate (från en mänsklig japansk översättning tillbaka till engelska):

”Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.”

New York Times noterar att det enda egentliga felet med Googles översättning är att ordet ”leopard” saknar artikel, i det här fallet alltså ”a” och ”the”.

Innan uppdateringen översatte Google Translate passagen på ett betydligt yxigare sätt:

”Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said that the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.”

Google Translates motor verkar alltså ha gjort avsevärda framsteg, åtminstone med vissa språkpar. Men det lär dröja innan de litterära översättningarna övertygar experterna på bred front.

Hösten 2015 gjorde Di Digitals Viktor Ström en längre genomgång av problemet för datorer med att översätta mänskliga språk. Kontentan är att tekniker har försökt lösa språkförbistringen med datorer i 60 år, utan att riktigt lyckas därför att språk är mer komplext och tvetydigt än matematik. I matematik betyder 6 alltid 6, men det gäller inte för språket.

Läs hela artikeln: Varför blir Google translate inte bättre?


Innehåll från AdmincontrolAnnons

En digitaliserad arbetsplats – med minskad risk för cyberattacker

På senare år har en digitaliserad arbetsplats varit en hög prioritet för många företag. Samtidigt jobbar allt fler hemifrån, vilket ökar behoven av säkra och fullt digitala lösningar – inte minst när mängden cyberattacker blir alltmer förekommande och förödande.

– Genom vår styrelseportal kan dokument delas och signeras digitalt på ett väldigt enkelt och säkert sätt, säger Rebecka Soma, Country Manager på Admincontrol i Sverige.

Sättet vi lever på har förändrats drastiskt i samband med coronapandemins intåg runt om världen, men kanske allra främst hur och var vi arbetar. Dessförinnan var kontoret allt som oftast en obligatorisk arbetsplats på daglig basis. När hemmakontor blivit allt vanligare har flera svenska bolag under det senaste året vittnat om en markant ökning av cyberattacker, och både SÄPO och Internetstiftelsen har i flera rapporter skrivit om hur attackerna blir fler i pandemins spår. Enligt Rebecka Soma, Country Manager på Admincontrol i Sverige, kommer därför kompetens inom cybersäkerhet bli av högsta vikt framöver.

Tidigare med hjälp av en kontorsnärvaro kunde viktiga dokument signeras direkt på plats, något som innebar en problematik när företag stängde ner och drev sin verksamhet via distans. Det ställde nya krav på smidiga och säkra digitala lösningar, och Admincontrol blev snabbt ett alternativ som visade sig gynnsamt för den nya tidens behov. 

– Säkerhet är väldigt viktigt för oss. Vi kan se att behovet ökat lavinartat under pandemin; elektronisk signering används mer än någonsin. Vår tjänst möjliggör att alla tryggt kan jobba var som helst utan att behöva infinna sig i styrelserummet så fort något ska signeras, berättar Rebecka Soma.

Säkerheten måste prioriteras

Den snabba omställningen till hemmakontor och virtuella möten gjorde att många bolag förlitade sig på olika digitala tjänster – som inte alltid var helt optimala och tillräckligt säkra för ändamålet. Företagens styrelseledning måste därför förstå området kring cybersäkerhet och hur de kan arbeta för att motverka det, menar hon.

– Alla kommer behöva sträva mot en bra säkerhetskultur inom sina företag. En absolut majoritet av felen som sker på en arbetsplats är ”human errors”, och risken för att göra fel när man inte vistas på kontoret ökar ju också. Därför blir en god säkerhetskultur extremt viktigt.

Enligt statistik från tidigare i år, framtaget av cybersäkerhetsföretaget Cybint är just human errors anledningen till hela 95 procent av alla intrång.

– Har man ett bra säkerhetstänk är man mycket bättre rustad för en eventuellt kommande cyberattack. En bra och enkel åtgärd är att använda tvåfaktorsautentisering, men det till trots är det bara fyra av tio som nyttjar det.

En tjänst för nya tider

Det talas mycket om vad som väntar arbetsvärlden och den nya samtiden när vi återgår till det normala. Många är eniga om att pandemin avsevärt skyndat på digitaliseringen och många av de tjänster och arbetssätt som vi idag tillämpat förväntas stanna kvar även efter pandemin.

En av dessa är just elektronisk signering, och företag som inte rustat upp med tjänster likt dessa förväntas snabbt hamna efter i förhållande till sina konkurrenter. 

– Vinningen är oerhört stor med att kunna signera digitalt. Dels är det mer miljövänligt i och med att det eliminerar stora mängder papper, men det möjliggör också en större frihet för alla inblandade när de inte behöver infinna sig på en specifik plats.

Med Admincontrol samlas allt från digital dokumentstyrning och ett förenklat samarbete för styrelse och ledning på en och samma plats. Dessutom är det Sveriges enda ISO 27001:2013-certifierade styrelseportal och utlovar effektiva och säkra styrelsemöten – på ett användarvänligt vis.

– Med Admincontrol blir det en säkrare hantering när vi inte längre har samma förutsättningar som förr, avslutar Rebecka Soma.

Ladda ner Admincontrols e-bok för att lära dig mer om ”utvärdering av dina investeringar i styrelsens teknologi” här 

 

Mer från Admincontrol

Artikeln är producerad av Brand Studio i samarbete med Admincontrol och ej en artikel av Dagens industri

Det verkar som att du använder en annonsblockerare

Om du är prenumerant behöver du logga in för att fortsätta. Vill bli prenumerant kan du läsa Di Digitalt för 197 kr inkl. moms de första 3 månaderna.

  • Full tillgång till di.se med nyheter och analyser

  • Tillgång till över 1100 aktiekurser i realtid

  • Dagens industri som e-tidning redan kvällen innan

  • Innehållet i alla Di:s appar, tjänster och nyhetsbrev

3 månader för
197 kr
Spara 1000 kr

Prenumerera

Redan prenumerant?