Korpusová lingvistika je studium jazyka, jak se tento jazyk vyjadřuje ve svém textovém korpusu (korpusech), tedy v souboru "skutečných" textů. Korpusová lingvistika navrhuje, že spolehlivá analýza jazyka je možná spíše pomocí korpusů shromážděných v terénu - přirozeném kontextu ("realia") tohoto jazyka - s minimálním experimentálním zásahem. Velké sbírky textů umožňují lingvistům provádět kvantitativní analýzy lingvistických konceptů, které jsou jinak těžko kvantifikovatelné. [1] Metoda textové korpusy využívá soubor textů napsaných v libovolném přirozeném jazyce k odvozenísouboru abstraktních pravidel, která tento jazyk ovládají. Tyto výsledky lze použít k prozkoumání vztahů mezi jazykem daného předmět a jinými jazyky, které byly podrobeny obdobné analýze. První takové korpusy byly odvozeny ručně ze zdrojových textů, ale nyní je tato práce automatizována. Korpusy byly použity nejen pro lingvistický výzkum, ale také pro sestavování slovníků (např. The American Heritage Dictionary of the English Language v roce 1969) a příruček, jako je AComprehensiveGrammar of the English Language, publikovaná v roce 1985. Odborníci v oboru mají různé názory na anotaci korpusu. Tyto názory sahají od Johna McHardyho, [2] jenž prosazuje minimální anotaci, aby texty samy hovořily za sebe, až po tým Survey of English Usage (University College, Londýn), [3] jenž vidí v anotaci možnost většího lingvistického porozuměním prostřednictvím důsledného záznamu.
Facebook Twitter