af Jørgen Nørby Jensen og Henrik Lorentzen
Den traditionelle indsamling af ord
Den traditionelle metode til at finde nye ord er “manuel”: Man læser, lytter og lægger i det hele taget mærke til hvad der siges og skrives, og så husker man forhåbentlig at notere det ned.
En mere systematisk måde at gøre dette på er at læse bestemte aviser, blade osv. igennem og skrive de nyskabelser ned som man får øje på. Iagttagelserne føres ind på kartotekskort, gerne med supplerende oplysninger som fx den sproglige sammenhæng ordet eller udtrykket er brugt i, hvilken kilde der er tale om, hvilken betydning ordet har osv. Metoden kaldes excerpering og kan siges at være lidt tilfældig fordi det fortrinsvis er de mere iøjnefaldende ord og udtryk der registreres, mens mere upåfaldende ord og konstruktioner slipper igennem nettet.
10 ord fra 1960'erne
- abeskøn
- butiksdød
- fritidspædagog
- gæstearbejder
- indretningsarkitekt
- jazzballet
- kummefryser
- maoist
- stereoanlæg
- stofmisbruger
Nye metoder til ordindsamling
I vore dage er det oplagt at bruge computerteknologi til dette arbejde, og lidt forenklet sagt lader man computeren sammenligne det man har i eksisterende ordlister, fx Retskrivningsordbogen eller Den Danske Ordbog, med forskellige tekstsamlinger; det kan være korpusser over moderne dansk sprog, fx KorpusDK, og det kan være dele af avisdatabaser som fx Infomedia.
En fordel ved den automatiske “ordfinding” er at man kan udnytte de såkaldte nyordsmarkører, som bl.a. er anførselstegn eller et “såkaldt”, der ofte optræder sammen med et nyt ord i en konkret tekst. Ordet kan også være sat med kursiv, eller det kan ledsages af en forklaring eller kommentar netop fordi det er nyt og ikke kan forudsættes bekendt af alle. Disse signaler kan være med til at udpege et ord eller udtryk som nyt.
Computeren vs. mennesket
Man kommer dog ikke uden om en menneskelig behandling af det maskinen finder; den kan give os en liste over mulige kandidater til nye ord, og så må vi som mennesker bedømme hvor mange af dem der reelt er nye. Metoderne skal kort sagt kombineres, og et af de problemer man støder på, er fx at computeren let kan afgøre om et ord findes i listerne i forvejen, men den kan ikke afgøre om et allerede kendt ord bruges i en ny betydning (fx livline i betydningen ‘hjælp i en håbløs situation’ eller morfar i betydningen ‘lur’). Maskinen har også svært ved at finde udtryk bestående af flere ord, fx på den lange bane, hvis alle ordene står i ordlisterne i forvejen, og det nye er kombinationen af dem.
Dansk Sprognævn og de nye ord
Dansk Sprognævn har siden sin oprettelse i 1955 haft som en af sine hovedopgaver at indsamle og registrere nye ord. Siden 1997 er registreringen foregået elektronisk. Der er i Sprognævnets ordsamling flere eksempler på hvert ord, så i alt rummer basen ca. 1 mio. eksempler fordelt på ca. 300.000 forskellige ord. Basen vokser for tiden med 4000-5000 ord og eksempler om året.
En stor del af ordsamlingen er blevet digitaliseret, og med tiden er det meningen at hele ordsamlingen skal kunne konsulteres fra computeren. På samme måde arbejder man på ordbogsredaktioner med at registrere nye ord, og man udnytter selvsagt computerteknologien mest muligt, fx ved at lade brugerne foreslå nye ord. Det er også muligt at indberette nye ord her på sproget.dk.
Sprognævnets orddatabase er en slags levende ordbog der viser vigtige sider af det danske sprogs udvikling siden midten af 1950’erne. Ordbasen giver et billede af hvilke ord der faktisk bliver brugt i dansk uden at der ved indsamlingen bliver taget stilling til om de enkelte ord er gode eller dårlige, nyttige eller overflødige, grimme eller smukke osv. Der er altså ikke tale om at nye ord bliver godkendt ved at Sprognævnet tager dem med i ordbasen. Det er ikke Sprognævnets opgave at godkende eller afvise ord. Sprognævnet skal blot notere sig ordene og vide besked med hvordan de bruges, hvad de betyder osv.
Hvad man registrerer i Sprognævnets samling, er først og fremmest ords og ordforbindelsers forekomster i skriftsproget. Det er meget svært at finde ud af hvornår et ord eller udtryk er dukket op i talesproget – det er ofte tidligere end i skriftsproget. Der kan også være tale om at ord og udtryk har været udbredt i snævrere kredse før de bliver en del af almensproget. Man kan altså aldrig være helt sikker på at et ord nu også er helt nyt. Et nyt ord er strengt taget bare et ord man ikke kan bevise er gammelt.
Kilder
- Jakob Halskov og Pia Jarvad: Om menneskers og maskiners tilgang til excerpering af sproglige nydannelser – en diskussion og en systemevaluering. Nyt fra Sprognævnet, nr. 4, 2009.
- Pia Jarvad: Nye ord. Hvorfor og hvordan? Gyldendal, 1995.