Зарегистрироваться

Корпусная лингвистика: статьи

Коллокация

Коллокация (collocation) – в корпусной лингвистике под коллокацией понимается последовательность слов или терминов, частотность совместного появления которых в корпусе выше, чем ожидаемая вероятность их совместного появления.

Конкорданс

Конкорданс – это список всех употреблений заданного языкового выражения (например, слова) в контексте, возможно, со ссылками на источник.

Корпус (лингвистический)

(Лингвистический) корпус – это некоторый филологически-компетентный массив языковых данных (как правило, множество текстов): - отобранных в соответствии с некоторой исследовательской задачей; - специально подготовленных, размеченных, структурированных, представленных в унифицированном виде;

Национальный корпус

Национальный корпус — это собрание текстов в электронной форме, представляющих данный язык (на определенном этапе его существования), отображающий данный язык во всем многообразии жанров, стилей, территориальных и социальных вариантов и т. п.

Разметка (лингвистическая)

(Лингвистическая) разметка (англ. tagging, annotation) – это процесс или результат приписывания текстам и их компонентам специальных меток.

Репрезентативность

Репрезентативность (по отношению к проблемной области) - требование, предъявляемое к составу и объему корпуса и важнейшее его свойство. Под репрезентативностью понимается способность корпуса текстов отражать все свойства проблемной области, релевантные для данного типа лингвистических исследований, в определенной пропорции, определяемой частотой явления в проблемной области.

статей нет