Hur maskininlärning kan gå fel – Filled with drama, he now praises the iPad!

I oktober rapporterade en användare in till Google att det var någonting konstigt med deras Text-to-Speech-funktion. Alltså, möjligheten att läsa upp en skriven text. Istället för att bara säga det som stod, så sa den ibland helt andra texter.

Texter som innehåller ”end with”, läses upp som ”end(and) he now praises the iPad”!

Jag spelade in en liten film om hur det kan se ut:

Det är en av de engelska kvinnliga rösterna som säger fel. Den mexikanska siten (.com.mx) verkar använda den som standard. Den manliga rösten jag fick på svenska och engelska Google uttalar texten rätt.

Det funkar även i vissa andra av Google’s text-to-speech-tjänster (t.ex. Google Now, när dess svar innehåller uttal liknande ”end with”.

Anledningen till att det kan gå så fel är att mycket av Googles data kommer från maskininlärning. Alltså att program ”lär sig” vilka ord och fraser som hör ihop, etc. Det är därför även Google Translate ibland kan råka ”översätta” texter som ”Jag cyklar i Gävle” till exempelvis ”I ride a bike in Shanghai”. Om det sedan skett helt automatiskt, eller om det är någon som felaktigt godkänt uttalet på något sätt, det är svårt att veta i dagsläget.

Detta uppmärksammades även på HN och det verkar som att källtexten som datan kommer från kan vara denna artikel från 2011.

 

Missa inget!

Prenumerera på Säkerhetsbloggen via e-post!

No comments

Your email address will not be published.