Hvor mange ord er der i dansk?

Denne tekst er skrevet af informationsmedarbejder ved Dansk Sprognævn Jørgen Nørby Jensen og blev bragt som en del af klummen "Hvor mange ord er der i dansk?" den 17. juli 2008. Læs hele artiklen .

»Hvor mange ord er der egentlig i dansk«? Det er et spørgsmål som med garanti dukker op hvis man afslører at man beskæftiger sig med sprog. Og skuffelsen er som regel lige så stor som forargelsen når man ikke straks spytter ud med et nøjagtigt tal: Ærlig talt! Nogen må da have gjort sig den ulejlighed at tælle ordene i dansk. Hvor svært kan det være? Og om ikke andet må man vel kunne sige det sådan cirka: Er der omkring 10.000 ord? 100.000? 500.000? 1 million? 10 millioner?

Der er flere grunde til at det kan være vanskeligt at give et endeligt tal for hvor mange ord der er i dansk. En grund er at det er svært at afgøre hvordan man overhovedet skal tælle ordene: Hest er ét ord. Men hvad så med hesten, hestens, heste, hestene og hestenes? Er det forskellige ord, eller skal de kun tælles som ét ord? Eller hvad med drikke, drak og drukket? Er det et og samme ord, eller er der tale om flere forskellige?

Så er der homonymerne, dvs. ord med forskellige betydninger, men samme form: Hede kan betyde stærk varme (»pyh, sikken hede«), men det kan også betyde landområde (»ude på den jyske hede«). Er hede så et eller to ord?

Nye ord – og gamle

Og hvor skal man overhovedet stoppe med at tælle? I de traditionelle dialekter findes en lang række ord som man ikke bruger i rigssproget. Skal de tælles med?

Og hvad med mærkelige eller sjældne fremmedord (eudaimonisme, ikonoklasme, skabrositet)? Eller gamle ord der ikke længere bruges, men som man kan støde på i ældre tekster – skal de tælles med? Er de en del af ordforrådet i dansk?

Alle disse problemer er dog i virkeligheden småting. Man kunne formodentlig godt opstille en række nogenlunde klare principper for hvordan man ville tælle ordene. F.eks. kunne man vedtage at bøjningsformer som heste og hestenes kun skulle tælle for ét ord, og at dialektord ikke skulle tælles med. Nej, det største problem er at tælle de sammensatte ord.