Datorlingvistik är den vetenskapliga studien av språk ur ett beräkningsperspektiv. Beräkningslingvister är intresserade av att tillhandahålla beräkningsmodeller för olika typer av språkliga fenomen. Dessa modeller kan vara ”kunskapsbaserade” (”handgjorda”) eller ”datadrivna” (”statistiska” eller ”empiriska”). Arbetet inom beräkningslingvistik är i vissa fall motiverat ur ett vetenskapligt perspektiv genom att man försöker ge en beräkningsteknisk förklaring till ett visst språkligt eller psykolingvistiskt fenomen, och i andra fall kan motivationen vara mer rent teknisk genom att man vill tillhandahålla en fungerande komponent i ett system för tal eller naturligt språk. Faktum är att datorlingvisternas arbete ingår i många fungerande system i dag, bland annat taligenkänningssystem, text-till-tal-synteser, automatiserade röstsvarssystem, webbsökmotorer, textredigerare, språkundervisningsmaterial, för att bara nämna några.
Populära läroböcker i datorlingvistik är bland annat:
- Christopher Manning och Hinrich Schütze (1999) Foundations of Statistical Natural Language Processing, Cambridge, Massachusetts, USA. MIT Press.
Se även bokens webbplats för kompletterande material på Stanford. - Daniel Jurafsky och James Martin (2008) An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition. Prentice Hall.