Du er her: Forside Temaer Sprogteknologi Fagsprog og termbaser

Fagsprog og termbaser

Termbaser bruges til at sikre at man forstår det samme ved et fagord.
Termbaser bruges til at sikre at man forstår det samme ved et fagord.
Termbase: Almindelig søgning og begrebsmodel
Illustration: Anna Odgaard Ingram

Af Bodil Nistrup Madsen og Pia Lyngby Hoffmann

Fagords betydning er vigtig for kommunikationen

Viden om termer (fagord) og de tilhørende fagbegreber er vigtig både i professionel sammenhæng og i mange hverdagssituationer, fx

  • når vi som almindelige borgere skal kommunikere med offentlige myndigheder
  • når vi skal sætte os ind i nye emner
  • eller når vi skal forstå begreber på andre sprog end dansk.

Her følger nogle eksempler:

  • En borger vil gerne indberette kørselsfradrag og håndværkerfradrag, men kan ikke finde dem på årsopgørelsen fordi SKAT betegner disse som henholdsvis befordringsfradrag og servicefradrag.

Her er man nødt til at være sikker på at betegnelserne dækker det rigtige.

  • En studerende der læser miljøteknologi på DTU, skal i gang med et nyt emne: drivhuseffekt. Der er mange vanskelige begreber, og det er svært at forstå deres indbyrdes relation, fx is-albedo-effekt og global opvarmning.

Her hjælper en systematisk oversigt over de termer, der knytter sig til emnet – både på dansk og engelsk.

  • En medarbejder i en virksomhed bliver præsenteret for en fuldmagt på engelsk og er usikker på hvad det er.

Her hjælper viden om hvordan de engelske begreber forholder sig til de danske.

  • En kommunalt ansat skal vejlede en borger der har spørgsmål om det der i almindeligt dagligsprog kaldes børnepenge, men som hos SKAT både hedder børne- og ungeydelse og familieydelse. Andre steder i det offentlige kaldes det børnefamilieydelse og børnecheck – og børnepenge kan desuden dække andre begreber som børnebidrag og børnetilskud.

Det er vigtigt at få begreberne på plads så man ikke taler forbi hinanden.

Første skridt er at den ansatte bliver klar over at de forskellige begreber findes, og hvordan de forholder sig til hinanden.

Metoder til begrebsafklaring

Fælles viden om hvad forskellige fagord præcist dækker over, kan være med til at sikre konsistens og præcision i brugen af fagbegreber for både professionelle og private.

Begreb: 'samlet forestilling om de træk der opfattes som fælles og karakteristiske for en given slags ting, væsner, forhold eller fænomener'. Kilde Den Danske Ordbog (ordnet.dk/ddo).

En anerkendt metode til at afklare fagords betydning er at begreberne systematiseres ved hjælp af deres karakteristiske træk og deres betydningsmæssige relationer til andre begreber i form af faglige begrebsmodeller.

Begrebsmodeller skaber overblik

Begrebsmodeller samler et fagområdes begrebsinventar i en systematisk og lettilgængelig form.

Begrebsmodeller er ofte udformet som ontologier, der er kendetegnet ved entydige definitioner og angivelse af relationer mellem begreberne.

Ved at systematisere begreberne i en begrebsmodel (en ontologi) får man et anderledes overblik over et fagområde end ved blot at få vist en række termer i alfabetisk rækkefølge.

Har man adgang til begrebsmodellen i elektronisk form, er det muligt at navigere i et hierarki eller et netværk af begreber i stedet for blot at søge på enkelte udtryk.

Eksempel på en begrebsmodel

Nedenfor ses et udsnit af en begrebsmodel som er udarbejdet i et nordisk samarbejdsprojekt, ”Termbank til støtte for nordisk mobilitet”.

Formålet med projektet er at styrke mobiliteten mellem de nordiske lande, særligt for elever, studerende og jobansøgere.

Ideen er at forældre som vil flytte til et andet nordisk land, kan undersøge fx de begreber der beskriver skolesystemet i det land som de vil flytte til. Dernæst kan de sammenligne dem med de begreber der beskriver systemet i deres eget land.

Entydige definitioner suppleres med relationer

Begrebsmodeller og entydige definitioner af de enkelte begreber er udarbejdet for alle de nordiske sprog.

Begrebsmodellerne beskriver relationen mellem begreberne og supplerer definitionerne. Dermed bliver det lettere at overskue de komplekse sammenhænge.

Udsnit af begrebsmodel

Forklaring til begrebsmodellen

De mørkegule bokse repræsenterer begreber som er relateret ved hjælp af begrebsrelationer.

Grønne (skrå) streger svarer til typerelationer (en folkeskole er en type skole). Under hver begrebsboks er der et karakteristisk træk som kort beskriver begrebet og adskiller det fra andre begreber (fri skole – INITIATIV = privat, folkeskole – INITIATIV = kommunalt).

De lysegule bokse angiver kriterier som begreberne inddeles efter og defineres ud fra.

Det vanskelige i det danske uddannelsessystem er at der er både frie skoler, frie grundskoler og friskoler. Sammenhængen fremgår af begrebsmodellen, og til hvert begreb er der knyttet en definition.

Definitioner baseret på begrebsmodellen

Sprogteknologiske værktøjer til videnshåndtering og vidensdeling

Opbygning af begrebsmodeller foretages typisk af fageksperter i samarbejde med terminologer som tager udgangspunkt i fx lærebøger, fagtekster, fagordbøger og eksperternes generelle viden om området.

Det er et møjsommeligt arbejde, og derfor er der udviklet forskellige værktøjer, fx terminologistyringsværktøjer og begrebsmodelleringsværktøjer til at holde styr på begreberne.

En termbase hjælper bl.a. oversættere

Kernen i et terminologistyringsværktøj er en termbase. En termbase er en database over fagord som stilles til rådighed for bestemte brugere, fx ansatte i en virksomhed.

Et terminologistyringsværktøj bruges konkret i det daglige arbejde til at systematisere, lagre, opdatere og fremsøge informationer om termer på et eller flere sprog. Oversættere og tekstforfattere kan bruge værktøjet for at opnå konsistent og korrekt brug af termer i deres tekster.

Hvis en virksomhed udliciterer oversættelser til oversættelsesbureauer, er det almindeligt at virksomhedens termbase også gøres tilgængelig for de eksterne oversættere så der sikres konsistent anvendelse af termer.

En termbank kan hjælpe alle

En termbank stilles til rådighed for en bred og uspecificeret gruppe af brugere. Offentlige myndigheder opretter termbanker, ofte kaldet begrebsbaser, som fastlægger definitioner af begreber indenfor et bestemt domæne, fx sundhedsområdet.

Indenfor sundhedsområdet findes forskellige typer samtykke. Sundhedsvæsenets begrebsbase, en termbank for sundhedsområdet, kan skabe entydighed i forhold til hvad der præcist menes med fx:

  • informeret samtykke
  • stiltiende samtykke
  • udtrykkeligt samtykke
  • skriftligt samtykke
  • mundtligt samtykke

Og hvilke af termerne der er synonymer.

Eksempler på offentlige termbanker:

Definitionerne i disse termbanker er baseret på begrebsmodeller.

På trods af mange års arbejde med grundlaget for en dansk termbank, er der i Danmark, i modsætning til i de øvrige nordiske lande, ikke blevet opnået finansiering til oprettelsen af en større termbank.

Værktøj til at opbygge en begrebsmodel

Et begrebsmodelleringsværktøj anvendes til at opbygge og præsentere begrebsmodeller, som for eksempel begrebsmodellen over det danske uddannelsessystem ovenfor.

Med et sådant værktøj kan man udarbejde og præsentere begrebsmodeller og få vist begreber i basen, som er forsynet med definitioner, kommentarer, ækvivalenter på andre sprog og evt. en lang række andre informationer.

Sprogteknologiske værktøjer til automatisk vidensindsamling og begrebsmodellering

Både traditionelt ordbogsarbejde og terminologiarbejde er tidskrævende, men ved hjælp af sprogteknologiske værktøjer kan arbejdet gøres mere effektivt.

Med sprogteknologiske værktøjer kan man automatisk indsamle viden om fagbegreber fra tekster på internettet og automatisk opbygge udkast til begrebsmodeller. Derefter kan terminologer i samarbejde med fageksperter forfine disse begrebsmodeller.

Værktøjerne er fx

  • webcrawlere som bruges til opbygning af store tekstsamlinger, såkaldte korpusser
  • korpusanalyseværktøjer som bruges til at trække sproglige informationer ud af en tekst.

Korpusopbygning ved hjælp af webcrawlere

Ifølge Den Danske Ordbog er et korpus i den sprogvidenskabelige betydning en '(elektronisk) samling af tekster der bruges til sproglige eller litterære undersøgelser'.

Man kan bruge webcrawlere til at finde og downloade relevante tekster fra internettet indenfor et fagområde.

Og de kan dermed bruges til opbygning af et korpus.

Et sådan korpus kan sammensættes af tekster indenfor et bestemt fagområde.

Korpusanalyse ved hjælp af konkordanser og frekvenslister

Ordbogsredaktører og terminologer baserer typisk deres arbejde på hvordan et ord optræder i sin kontekst. Konteksten kan afsløre noget om betydningen og brugen af ord eller termer, men mængden af tekster er i dag overvældende.

Ved hjælp af korpusanalyseværktøjer kan man analysere store mængder tekst automatisk, identificere bestemte forekomster af ord og udtryk (tekststrenge) i teksterne og præsentere dem på forskellige måder.

Det kan for eksempel være lister med oplysninger om hvor hyppigt termer forekommer i en eller flere tekster (frekvenslister).

Konkordans er en 'systematisk opstillet oversigt over de steder hvor et bestemt ord, udtryk, emne el.lign. optræder i en given tekst eller tekstsamling', ifølge Den Danske Ordbog.

Analyseværktøjer kan også præsentere konkordanslister som netop viser konteksten.

Uddrag af konkordans
Uddrag af en konkordans for ordet konkordans i korpusværktøjet KorpusDK.

En anden type korpusværktøjer er ekstraktionsværktøjer

Ekstraktionsværktøjer bruges til at trække sproglige informationer ud af en tekst.

Ved hjælp af et termekstraktionsværktøj kan man udtrække termer og informationer om disse fra et korpus. Dette korpus kan bestå af tekster om et bestemt fagområde eller emne, fx uddannelse, sundhed eller offentlig forvaltning.

På basis af syntaktiske og bøjningsmæssige mønstre eller regler samt statistiske beregninger kan der udtrækkes lister over termkandidater med tilhørende informationer.

Termkandidater findes ved at sammenligne korpusser

Ekstraktionsværktøjer fungerer ved at foretage en statistisk sammenligning mellem et korpus med fagtekster og et korpus med almensproglige tekster.

Hvis de statistiske beregninger viser at et ord forekommer oftere i fagteksterne end i de almensproglige tekster i referencekorpusset, stiger sandsynligheden for at ordet er en term.

I DanTermBank-projektet er der udviklet en række af de omtalte værktøjer. Se mere på projektets hjemmeside.

Anvendelse i andre sprogteknologiske systemer

Både oversættelser og søgninger bliver mere præcise hvis systemerne har adgang til termbaser og begrebsmodeller, altså systematiseret terminologi.

Systematiseret terminologi indgår som en væsentlig resurse i mange sprogteknologiske værktøjer, fx i maskinoversættelse.

Udover den pædagogiske gevinst der ligger i de klare definitioner og den grafiske fremstilling, er der altså både tid og penge at spare i hverdagen. Der er derfor mange gode grunde til at bruge tid og energi på at skabe orden i begreberne.

Teksten bygger på artiklen "Sprogteknologi til håndtering af fagsproglig viden" af Bodil Nistrup Madsen og Pia Lyngby Hoffmann, bragt i Nyt fra Sprognævnet 2015/4.
NB! Sprogteknologi udvikler sig hurtigtLigesom al anden teknologi udvikler sprogteknologien sig i en rasende fart, så når denne artikel læses, har nye generationer af teknologien allerede set dagens lys. Redaktionen og forfatterne tager derfor forbehold for at oplysningerne i dette tema kan være forældede. Temaet er redigeret og offentliggjort i maj 2018.