Att ha ett litet språk som modersmål framställs ofta som en nackdel i en alltmer globaliserad värld. Den nya AI-tekniken kan göra att det i stället blir en fördel, skriver German Bender.

En av mänsklighetens äldsta drömmar, dagen då alla kan tala och förstå alla mänskliga språk, är på god väg att bli verklighet. ChatGPT kan redan kommunicera på hyfsad svenska och det finns andra AI-tjänster som mer eller mindre simultant översätter mellan många språk med stor precision. Vi är full färd med utveckla teknik som motsvarar universalöversättaren i Star Trek och babelfisken i ”Liftarens guide till galaxen”.

Möjligheterna är svindlande för alla som har ett mindre språk som modersmål, till exempel svenska. Nu är det bara en fråga om tid innan alla kan kommunicera relativt väl på engelska, kinesiska eller spanska.

Det är faktiskt en smått häpnadsväckande utveckling.

Vilka blir de positiva arbetsmarknadseffekterna om språkmodeller är sämre på små språk?

 

Samtidigt är många oroliga för att AI:s lingvistiska framsteg inte bara ska hjälpa oss att kommunicera, utan också ersätta många av de arbetsuppgifter som vi utför med hjälp av språk. Vilket i en avancerad ekonomi som den svenska skulle påverka en betydande andel av jobben.

Under lång tid har små modersmål ansetts vara en nackdel i en värld som blir alltmer globaliserad. Men tänk om det nu blir tvärtom?

Tänk om små modersmål i stället blir en konkurrensfördel, eftersom arbetsuppgifter som måste utföras på små språk är svårare att ersätta med stora språkmodeller som ChatGPT?

De här så kallade generativa AI-systemen tränas på enorma datamängder. Kvantiteten och kvaliteten på data och är avgörande för hur bra modellerna kan bli. I båda dessa avseenden är svenska data betydligt mer bristfälliga än de är för större språk. Dessutom är det långtifrån säkert att ett litet land som Sverige kan uppbåda de enorma resurser som krävs för att träna nationella språkmodeller.

Det finns därför anledning tro att arbetsmarknaderna i länder med små modersmål kan bli mindre påverkade av AI än de i länder med stora språk – såvida inte alltmer avancerade algoritmer kan kompensera för de här bristerna.

Jag frågar ChatGPT hur hen ser på den saken.

Är dina kunskaper i ett visst språk direkt beroende av mängden data du är tränad på i det språket?

ChatGPT: Ja, i stort sett är min förmåga att förstå och generera text på ett specifikt språk direkt beroende av mängden träningsdata som jag har blivit exponerad för på det språket. Ju mer träningsdata jag har för ett visst språk, desto bättre blir min förmåga att förstå och generera text på det språket.

Min förmåga att svara på frågor på ett språk bygger på det språket och dess grammatik, ordförråd och mönster som jag har lärt mig från träningsdata. Om jag har tillgång till stora mängder textdata på ett visst språk, kan jag utveckla en bättre förståelse och förmåga att kommunicera på det språket.

Å andra sidan, om det finns mycket begränsad träningsdata för ett språk, kommer min förmåga på det språket att vara begränsad och mindre pålitlig. Därför är min förmåga att kommunicera effektivt på olika språk varierande beroende på mängden och kvaliteten på den träningsdata jag har fått.

Innebär det att du aldrig kommer att bli lika bra på svenska som på engelska?

ChatGPT: Min förmåga att kommunicera på ett visst språk är i hög grad beroende av mängden och kvaliteten på träningsdata som jag har fått för det språket. Eftersom jag har blivit tränad främst på engelska och har haft mycket mer tillgång till engelskspråkig text och information, är min kompetens på engelska mycket starkare än på andra språk, inklusive svenska.

Det är teoretiskt möjligt att jag skulle kunna förbättra min förmåga på svenska om jag exponeras för större mängder träningsdata och information på svenska. Men det skulle kräva betydande resurser och ansträngningar att göra mig lika bra på svenska som på engelska. För närvarande är min svenska förmåga begränsad jämfört med min engelska, och jag är mest effektiv när jag kommunicerar på engelska.

Innebär det att arbetsuppgifter som måste utföras på svenska är svårare att ersätta med AI?

ChatGPT: Ja, i allmänhet kan arbetsuppgifter som kräver att arbeta på svenska vara svårare att ersätta med AI om AI:n inte har en stark kompetens i det svenska språket. Ett starkt språkligt AI-system är avgörande för att utföra uppgifter som kräver kommunikation på svenska, såsom kundsupport, översättning, eller skapandet av svenskspråkigt innehåll.

Om AI:n inte är lika kompetent på svenska som på andra språk, kan det begränsa dess förmåga att utföra uppgifter som kräver svenska språkkunskaper och kan kräva mänsklig intervention eller anpassning.

Det är dock möjligt att förbättra AI:ns kompetens på ett specifikt språk genom att tillhandahålla mer träningsdata och använda avancerade träningsmetoder. Men detta är en pågående utvecklingsprocess, och det kan ta tid att uppnå samma nivå av kompetens på svenska som på mer vältränade språk som engelska.

Detta bör noga analyseras av små språkländer som Sverige, exempelvis av regeringens produktivitetskommission, liksom av den AI-kommission som statsministern vill tillsätta för att ”hitta en nisch som grundar sig på svenska kärnvärderingar” (min översättning).

Det finns många frågeställningar för kommissionerna (och hugade forskare) att borra i. Jag ska nämna några av de mest uppenbara.

1) På vilket sätt och i vilken omfattning är stora språkmodellers språkkunskaper beroende av mängden och kvaliteten på data? Kan mer utvecklade algoritmer göra systemen lika bra på små språk som på stora, även om tillgången och kvaliteten på data är sämre?

2) Vilka blir de positiva arbetsmarknadseffekterna om språkmodeller är sämre på små språk? Kan det innebära ett större skydd för vissa länder, sektorer eller yrken, exempelvis genom längre omställningstid? Kan det göra att befolkningar med små modersmål upprätthåller sin språkliga nivå medan andra länders eroderar? Finns det andra komparativa fördelar för små språkländer?

3) Vilka blir de negativa effekterna? Kan svensk konkurrenskraft drabbas om det innebär att vi inte kan tillgodogöra oss de mest avancerade AI-framstegen, som i högre grad sker på stora språk? Kommer företag att flytta jobb utomlands eller omsätta delar av sin verksamhet till engelska och andra stora språk?

4) Finns det en svensk win-win, där ”babel-effekten” (den alltmer sofistikerade översättningstekniken) gör att vi kan tillgodogöra oss de positiva effekterna av en AI-genererad produktivitetsökning, samtidigt som vi åtnjuter ett visst skydd för många arbetsuppgifter i kraft av den jämförelsevis lilla korpus som finns tillgänglig på svenska? Kan man rentav ta begränsa de negativa effekterna och understödja de positiva i den fortsatta utvecklingen av den svenska versionen av ChatGPT?

Arbetsmarknadseffekterna av AI för olika språkområden är en hittills ouppmärksammad och understuderad fråga. Förhoppningsvis inte länge till.

German Bender är utredningschef på Arena Idé och doktorand vid Handelshögskolan