Features Languages Business Blog Status
Download on App Store
Analyse February 20, 2025 7 min read

Hvorfor diktering feiler på norsk

Du trykker på mikrofonikonet, snakker tydelig norsk, og får tilbake noe som ligner på en forvirret maskins forsøk på å gjette hva du mente. Det er ikke deg det er noe galt med. Det er teknologien.

Det øyeblikket du ga opp diktering

De fleste nordmenn har prøvd diktering minst én gang. Kanskje mens du kjørte bil og ville sende en rask melding. Kanskje på bussen med kalde fingre. Kanskje bare av nysgjerrighet, fordi Apple eller Google lovet at det «bare fungerer».

Du sa noe helt enkelt. «Jeg kommer om ti minutter, møter deg ved inngangen.» Og det du fikk tilbake var: «Jeg kommer om ti minutter moter deg ved inngangen.» Eller verre: «Yeah kommer om team in utter motor deg ved inn gangen.»

Du lo litt, rettet teksten manuelt, og bestemte deg for at diktering ikke er noe for deg. Ikke fordi du er teknologisk konservativ. Men fordi det var raskere å taste meldingen enn å rydde opp i rotet dikteringen skapte.

Det er akkurat her problemet ligger. Ikke i deg. Ikke i stemmen din. Men i systemene som aldri ble bygget for norsk.

Ø blir o. Æ blir ae. Norsk blir uleselig.

La oss starte med det mest åpenbare. Norsk har tre bokstaver som ikke finnes i det engelske alfabetet: æ, ø og å. Disse er ikke eksotiske utsmykninger. De er distinkte fonemer — de endrer ordets betydning fullstendig. «For» og «før» er to helt forskjellige ord. «Bar» og «bær» likeså.

Men de fleste dikteringsmotorer er bygget på engelskspråklige grunnmodeller. Når de hører en norsk «ø»-lyd, må de bestemme seg: er dette en «o», en «u», eller noe annet? Og fordi modellens statistiske tyngdepunkt ligger i engelsk, velger den ofte feil. «Ønsker» blir «onsker». «Søker» blir «soker». «Ærlig» blir «aerlig» — eller i verste fall «early».

Dette er ikke små feil. Det er systematisk ødeleggelse av språket. Tenk deg at engelsk diktering konsekvent byttet ut «th» med «t» — «te» i stedet for «the», «tink» i stedet for «think». Ingen ville akseptert det. Men for norsk er dette hverdagen.

Bokmål og nynorsk: et valg systemet ikke forstår

Norge har to offisielle skriftspråk, og de er ikke trivielle variasjoner av hverandre. Bokmål og nynorsk har ulike bøyningsmønstre, ulik ordstilling i visse konstruksjoner, og hundrevis av ord som er forskjellige. «Jeg» på bokmål er «eg» på nynorsk. «Ikke» er «ikkje». «Hva» er «kva».

De fleste dikteringssystemer behandler «norsk» som én ting. Apple tilbyr «Norwegian (Bokmål)» som et valg, men under overflaten er støtten tynn. Nynorsk eksisterer knapt i dikteringsvårdenen. Hvis du snakker med en vestlandsdialekt som ligger nærmere nynorsk, får du et resultat som er en merkelig hybrid — halvt bokmål, halvt gjetting, helt ubrukelig.

For de 600 000 nordmennene som bruker nynorsk som hovedmål, er diktering i praksis ikke tilgjengelig. Det er som om systemet sier: «Du kan bruke stemmen din, men bare hvis du snakker slik vi forventer.»

Fyllordenes håpløse skjebne

Norsk muntlig kommunikasjon er full av fyllord. Det er ikke slurv — det er en naturlig del av hvordan vi snakker. «Liksom», «altså», «på en måte», «sant», «ikke sant», «da», «vet du» — disse ordene gir muntlig tale flyt og nyanser. Men de har ingenting i skriftlig tekst å gjøre.

Engelske dikteringssystemer har lært seg å fjerne «um», «uh» og «like». Det tok år, men de er blitt gode på det. Norske fyllord? De står igjen i teksten. Ord for ord.

Du sier: «Jeg tenkte liksom at vi kanskje burde, altså, flytte møtet til onsdag, sant.» Og du får: «Jeg tenkte liksom at vi kanskje burde altso flytte motet til onsdag sant.» Med feil bokstaver, uten tegnsetting, og med fyllord som gjør teksten uleselig. Du må redigere alt. Da kunne du like gjerne ha tastet det selv.

Diktering som krever like mye redigering som manuell skriving er ikke et verktøy. Det er et ekstra steg.

Engelskens gravitasjonsfelt

Her er et problem som få snakker om: norske ord som ligner på engelske, trekkes mot engelsk. Språkmodellene har sett så mye engelsk data at de har en innebygget tendens til å tolke tvetydige lyder som engelske ord.

Si «bra», og systemet lurer på om du mente det engelske «bra» (undertøy). Si «fire», og det vurderer om du mener tallet eller det engelske ordet for brann. Si «mine», og du får kanskje et engelsk possessivpronomen i stedet for det norske.

Det er som å snakke med noen som hører etter på feil språk. Du sier norsk, men lytteren filtrerer alt gjennom et engelsk øre. Resultatet er en tekst som hverken er god norsk eller god engelsk — den er et forvirret mellomting.

Sammensatte ord: splitt og hersk

Vi har allerede nevnt sammensatte ord, men det fortjener et eget avsnitt i dikteringssammenheng. Når du sier «sykkelreparasjonsverksted», sier du det som ett ord med ett trykk. Men dikteringssystemet hører fire stavelser etter hverandre og må bestemme seg: er dette ett ord, to ord, eller tre?

Engelsk har nesten ingen sammensatte ord på denne måten. «Bicycle repair shop» er tre separate ord. Så når en engelsktrånt modell hører den norske ekvivalenten, gjør den det den er trent til å gjøre: splitter det opp. «Sykkel reparasjon verksted». Tre ord. Feil.

For profesjonell kommunikasjon er dette katastrofalt. «Arbeidsmiljøloven» er ett presist juridisk begrep. «Arbeidsmiljø loven» er en grammatisk feil som får deg til å se upresis ut. I norsk endrer en mellomromstast betydningen.

Hva må være annerledes

Problemet er ikke at talegjenkjenning er umulig for norsk. Problemet er at de store aktørene — Apple, Google, Microsoft — optimaliserer for sine største markeder. Engelsk. Spansk. Mandarin. Norsk, med sine fem millioner brukere fordelt på to skriftspråk og hundrevis av dialekter, får det de får: en tilpasning av en engelsk modell, ikke et system bygget fra grunnen for norsk.

Det som trengs er det motsatte: en tilnærming der norsk er utgangspunktet, ikke et ettertanke. Der modellen forstår forskjellen mellom «o» og «ø» på lydnivå. Der den vet at «liksom» er et fyllord som skal fjernes. Der den kan skille mellom bokmål og nynorsk basert på kontekst. Der sammensatte ord holdes sammen fordi modellen vet hvordan norsk fungerer.

Aivo er bygget med akkurat denne tilnærmingen. Ikke norsk lagt oppå engelsk, men norsk som førsteprioritet. Resultatet er diktering som faktisk gir deg tekst du kan bruke — med riktige bokstaver, riktige ord, riktig tegnsetting, og uten fyllordene du aldri ville skrevet selv.

Det høres kanskje ut som en liten ting. Men for alle som har gitt opp diktering fordi det aldri fungerte på norsk, er det en ganske stor forandring. Det betyr at stemmen din endelig er god nok — ikke fordi den ble bedre, men fordi teknologien endelig lærte seg å lytte.

Diktering som faktisk fungerer på norsk

Prøv Aivo gratis — stemmetastaturet som er bygget for nordiske språk. Fungerer i alle apper på iPhone og Mac.