Corpus-analysetools
Tools voor corpusanalyse maken het mogelijk om handig gebruik te maken van de contextuele informatie in tekstcorpora. Men kan bijvoorbeeld de frequentie van woorden onderzoeken of termkandidaten selecteren op basis van naamwoordclusters. Ook kan men termen in bepaalde contexten selecteren, of zoeken naar het voorkomen van bepaalde termen in teksten, websites e.d.
Terwijl wij wachten op de nieuwe termextractor van de Taalunie is het handig om kennis te maken met twee gratis programma’s voor het maken van concordanties. Ze kunnen weliswaar een termextractor niet vervangen maar kunnen wel handmatige termextractie en het maken van termenlijsten vergemakkelijken. Deze twee programma’s zijn TextSTAT en AntConc.
Met deze twee simpele programma’s kan men onderzoeken hoe termen in een tekst zich gedragen. U kunt een lijst samenstellen van alle woorden of clusters van woorden in een tekst, geordend op alfabet of frequentie. U kunt ook concordanties maken en KWIC (keyword-in-context) -overzichten. Met behulp van deze functies kan men binnen enkele uren een termenlijst van honderden termen samenstellen. Handig voor het voorbereiden van de vertaling van grote, gespecialiseerde teksten.
Overzicht
- Corsis
- DIMAP
- FastR
- Plug Word Aligner
- System Quirk
- Termprofile
- Twente Word Alignment
- WordNet
- XLEX/www
Wegwijzer – Colofon – Contact – Vrijwaring – Opmerkingen en reacties