Зарегистрироваться

Национальный корпус

Категории Корпусная лингвистика | Под редакцией сообщества: Филология

Национальный корпус — это собрание текстов в электронной форме, представляющих данный язык (на определенном этапе его существования), отображающий данный язык во всем многообразии жанров, стилей, территориальных и социальных вариантов и т. п.

Общепризнанными образцами являются, в частности, Британский национальный корпус (BNC), на который ориентированы и многие другие корпуса; среди славянских корпусов выделяется Чешский национальный корпус, созданный в Карловом университете Праги, Русский национальный корпус.

Национальный корпус создается лингвистами для научных исследований и обучения языку. Глобальной задачей создания такого корпуса является отразить в полной мере всю картину употребления языка, по возможности во всех его проявлениях, в некоторый период времени. Таким образом, уже в силу поставленной задачи национальный корпус представляет собой наиболее представительное, сбалансированное, лингвистически аннотированное собрание текстов на данном языке. Это означает, что корпус содержит по возможности все типы письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т.п.), и что все эти тексты входят в корпус по возможности пропорционально их доле в языке соответствующего периода. Следует иметь в виду, что хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов словоупотреблений). Планируемый составителями объем Национального корпуса русского языка — 200 млн. слов.

Национальный корпус предназначен в первую очередь для обеспечения научных исследований лексики и грамматики языка, а также тонких, но непрерывных процессов языковых изменений, происходящих в языке на протяжении сравнительно небольших периодов. Другая задача корпуса — предоставление всевозможных справок, относящихся к указанным областям (лексика, грамматика, акцентология, история языка). Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях.

 

Редактор статьи Архипов Александр Владимирович, кандидат филологических наук, доцент филологического факультета МГУ.

Эта статья еще не написана, но вы можете сделать это.