Computational Linguistics er den videnskabelige undersøgelse af sprog ud fra et computerbaseret perspektiv. Computerlingvister er interesserede i at tilvejebringe computermodeller for forskellige former for sproglige fænomener. Disse modeller kan være “vidensbaserede” (“håndlavede”) eller “datadrevne” (“statistiske” eller “empiriske”). Arbejdet inden for computerlingvistik er i nogle tilfælde motiveret ud fra et videnskabeligt perspektiv, idet man forsøger at give en computerbaseret forklaring på et bestemt sprogligt eller psykolingvistisk fænomen; og i andre tilfælde kan motivationen være mere rent teknologisk, idet man ønsker at tilvejebringe en fungerende komponent i et tale- eller naturligt sprogsystem. Faktisk indgår computerlingvisternes arbejde i mange fungerende systemer i dag, herunder talegenkendelsessystemer, tekst-til-tale-synthesizere, automatiserede stemmesvarssystemer, web-søgemaskiner, tekstredigeringsprogrammer, sprogundervisningsmaterialer, for blot at nævne nogle få.
Populære lærebøger om computerlingvistik omfatter:
- Christopher Manning og Hinrich Schütze (1999) Foundations of Statistical Natural Language Processing, Cambridge, Massachusetts, USA. MIT Press.
Se også bogens websted med supplerende materialer på Stanford. - Daniel Jurafsky og James Martin (2008) An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition. Prentice Hall.