Der er større chancer for at få Google Translate eller en søgemaskine til at fungere godt hvis det sprog der tastes ind er standardengelsk. Maskinerne virker mindre godt med uformelt engelsk eller små sprog som for eksempel dansk og svensk. Anders Søgaard arbejder i sin afhandling på at udligne den forskel så sprogteknologien i fremtiden også kan klare andre typer sprog.
Anders Søgaard har netop forsvaret sin doktorafhandling: Learning Linguistics Models under Bias. I den tester han forskellige statistiske metoder til at behandle de store tekstsamlinger der ligger til grund for eksempelvis Google Translate, så det er muligt at korrigere den sproglige ensretning, dvs. så det bliver muligt at få maskinen til at kunne håndtere sprog der ikke er standardsprog. Anders Søgaards ambition er nemlig at sprogteknologien skal være brugbar for alle og ikke kun dem der taler og skriver det ‘rigtige’ sprog.
- Læs mere om Anders Søgaards projekt på Københavns Universitets hjemmeside.
- Hele Anders Søgaards doktorafhandling kan læses på Center for Sprogteknologis hjemmeside, hvor man også kan læse mere om Anders Søgaard og se hans publikationsliste.
- Se også en tidligere nyhed fra sproget.dk om Anders Søgaards sprogteknologiske arbejde.