Зарегистрироваться

Конкорданс

Категории Корпусная лингвистика | Под редакцией сообщества: Филология

Конкорданс – это список всех употреблений заданного языкового выражения (например, слова) в контексте, возможно, со ссылками на источник. В этом значении данный термин широко используется в корпусной лингвистике. Поиск в корпусе данных позволяет по любому слову построить конкорданс – список всех употреблений данного слова в контексте со ссылками на источник. Обычно конкордансом называют список примеров, полученных в результате поиска по корпусу интересующего пользователя языкового выражения со ссылками на источник.

В первом своем значении этот термин также употребляется для обозначения списка ключевых слов книги или работы, расположенных в алфавитном порядке, с их непосредственными контекстами.

Первый конкорданс, к Вульгате, был создан в 13 веке Хьюго де Сент-Шером (Hugues de Saint-Cher), которому помогали 500 монахов.

Именно из-за объёма работы по составлению конкордансов в докомпьютерные времена конкордансы были созданы только для трудов высочайшей важности – Вед, Библии, Корана или произведений У.Шекспира.

Даже с использованием компьютера создание конкорданса является трудоёмкой работой, так как конкордансы часто включают комментарии, определения слов или интертекстуальные ссылки – материалы, которые пока невозможно получить автоматически.

Двуязычные конкордансы – это конкордансы, основанные на параллельных текстах.

Тематические конкордансы – это списки тем, которые охватывает книга, с содержанием сути этих тем. Наиболее известный из таких конкордансов – Nave's Topical Bible.

Конкорданс (в первом упомянутом значении) является одним из основных понятий корпусной лингвистики. Конкордансы часто используются в прикладной лингвистике: в лексикографии, при анализе текста, при обучении и изучении языка, при переводе.

Конкордансы используются для решения следующих лингвистических задач:

  • сравнение различных использований одного слова,
  • анализ ключевых слов,
  • анализ частотности слов и словосочетаний,
  • поиск и исследование фраз и идиом,
  • поиск перевода, например, терминологии,
  • создание списков слов (что используется при публикации).

Существуют специальные программы составления конкордансов по некоторому корпусу текстов, так называемые конкордансеры. Они позволяют получать частоту той или иной языковой единицы по произвольному корпусу текстов, список контекстов, в которых данная единица встретилась. Многие из них позволяют также сортировать контексты по ключевому слову (в исходной форме) или по словоформе, по ближайшему контексту (фрагмент конкорданса для слова bag, см. Пример конкорданса.PPT)

Примеры конкордансов:

 

Примеры конкордансеров:

TextSTAT - Simples Text Analyse Tool - конкордансер, работающий с корпусами на разных языках, с использованием специального языка запросов (языка регулярных выражений)

Система лингвистического поиска для русского, английского и немецкого языков, доступная с сайта http://aot.ru/

 

Редактор статьи Архипов Александр Владимирович, кандидат филологических наук, доцент филологического факультета  МГУ.

 

Эта статья еще не написана, но вы можете сделать это.