De ti mest almindelige ord i dansk
Topti over de mest almindelige ord i dansk ændrer sig alt efter hvilke tekster man tæller ord i.
I tabellen nedenfor er der fire forskellige lister over de mest almindelige ord i dansk. Listerne stammer fra fire forskellige optællinger.
Liste 1 | Liste 2 | Liste 3 | Liste 4 |
---|---|---|---|
Dansk Frekvensordbog | Hyppige ord i Danske Aviser, Ugeblade og Fagblade | Hyppige Ord i Danske Romaner | Hyppige ord i Lemma 5000 |
1. og | 1. i | 1. og | 1. i |
2. i | 2. og | 2. det | 2. være |
3. at | 3. at | 3. i | 3. og |
4. det | 4. af | 4. at | 4. en |
5. er | 5. er | 5. han | 5. den |
6. en | 6. en | 6. var | 6. på |
7. på | 7. til | 7. jeg | 7. til |
8. til | 8. det | 8. en | 8. det |
9. med | 9. for | 9. ikke | 9. at |
10. af | 10. der | 10. til | 10. af |
Liste 1 er fra bogen Dansk Frekvensordbog. Listen er lavet på grundlag af en ordoptælling i en tekstsamling (et korpus) på 4.070.419 ord. Ordene stammer fra tekstuddrag fra udvalgte romaner og noveller, aviser og ugeblade fra 1987-90.
Liste 2 er fra bogen Hyppige Ord i Danske Aviser, Ugeblade og Fagblade. Listen er lavet på grundlag af en ordoptælling i en tekstsamling (et korpus) på 250.000 ord. Ordene stammer fra tekstuddrag fra udvalgte fagblade fra 1970-74.
Liste 3 er fra bogen Hyppige Ord i Danske Romaner. Listen er lavet på grundlag af en ordoptælling i en tekstsamling (et korpus) på 250.000 ord. Ordene stammer fra tekstuddrag fra udvalgte børnebøger fra 1970-74.
Liste 4 er fra en liste som Det Danske Sprog- og Litteraturselskab har lavet over de 10.000 hyppigste ord. Listen er blevet til på baggrund af ca. 880 mio. ords tekst, primært nyhedsstof fra 2006-2016.
Læs mere
Læs mere om de nye frekvenslister for dansk, og find yderligere beskrivelser og korpusmuligheder på Lemma 5000-hjemmesiden (på engelsk).
Kendetegn ved de almindeligste ord i dansk
Hvilke ord der helt præcist er de mest almindelige, kan vi altså ikke give noget svar på. Det kommer an på hvilke tekster man tæller ord i.
Resultaterne af de forskellige optællinger ligner alligevel hinanden på mange punkter. Ved at sammenligne listerne kan man derfor sige noget om hvad der sandsynligvis kendetegner de mest almindelige ord i dansk.
Ligheder mellem liste 1, 2 og 3
- Og, det, i, at, en og til optræder på alle tre lister. (Men det betyder naturligvis ikke at de vil ligge så højt på listen i en hvilken som helst ordoptælling).
- De mest almindelige ord i dansk er ‘småord’, fx konjunktioner (bindeord), præpositioner (forholdsord) og pronominer (stedord). Substantiver (navneord) er der derimod ikke nogen af på listerne.
- At være (eller rettere: bøjningsformerne er og var) er meget almindeligt i dansk. På alle tre lister optræder enten er eller var.
Hvorfor er de mest almindelige ord ‘småord’?
Forklaringen på at de mest almindelige ord er ‘småord’, hænger sammen med disse ords funktion. Småord fungerer nemlig som en slags kit der holder de mere indholdstunge ord (fx substantiver (navneord) og verber (udsagnsord)) sammen. Ligegyldigt hvad for et emne man skriver om, har man som regel brug for ord som og, det, i, at, en og til. Hvilke substantiver og verber man anvender, kommer derimod helt an på hvad man skriver om.
Optælling af de almindeligste ord i dansk en gang for alle
I stedet for at tælle ord i afgrænsede tekstsamlinger kunne man måske ønske sig at tælle alle danske ord i alle skrevne tekster på dansk en gang for alle. På den måde kunne man nå frem til det helt rigtige, endegyldige svar på hvilke ord der er de mest almindelige.
Som ved en optælling af alle danske bogstaver ville sådan en optælling imidlertid give mindst fire problemer i praksis:
- Indsamling af alle danske tekster. Hvordan skulle man kunne gøre det? Hvordan skulle man fx sørge for at fru Jensens indkøbsseddel som hun skrev sidste lørdag, eller hendes nieces hemmelige kærestebreve skulle komme med i optællingenTeksternes alder. Hvor gamle skulle teksterne være for at blive talt med? Skulle man fx inkludere tekster helt tilbage fra middelalderen, eller skulle man kun undersøge tekster fra det sidste år?
- Teksternes alder. Hvor gamle skulle teksterne være for at blive talt med? Skulle man fx inkludere tekster helt tilbage fra middelalderen, eller skulle man kun undersøge tekster fra det sidste år?
- Vigtigheden af teksterne. Er nogle tekster mere vigtige end andre? Er der fx forskel på en digtsamling der udkommer i 100 eksemplarer, og en avis der udkommer i 600.000 eksemplarer om dagen? Skal resultaterne fra optællingen i avisen veje 6.000 gange så meget som resultaterne fra digtsamlingen?
- Talesprog. Hvad med det talte sprog? Der er, så vidt vi ved, ikke lavet optællinger af ordhyppighed i talesprog. For at lave en optælling af ordene i talt sprog ville det ville kræve at man skrev en stor mængde talesprog ned.
Kilder
- Henning Bergenholtz: Dansk Frekvensordbog, 1992.
- Hanne Ruus og Bente Maegaard: Hyppige ord i Danske Aviser, Ugeblade og Fagblade, 1992.
- Hanne Ruus og Bente Maegaard: Hyppige Ord i Danske Romaner. Bind 1 og 2, 1986.
Læs mere
- Hanne Ruus og Bente Maegaard: Hyppige Ord i Danske Børnebøger, 1981.