Статья "Национальный корпус русского языка. Поиск слов и их анализ"

Яшина Александра Михайловна

AntConc – конкордансер, программа для для лингвостатистического анализа текста. Работа с программой на примере поиска слова "судьба".

Скачать:

ВложениеРазмер
Файл kk.docx13.52 КБ

Предварительный просмотр:

Национальный корпус русского языка. Поиск слов и их анализ

Конкорданс — это список контекстов искомого слова в исследуемом корпусе.

Результаты поиска показываются в формате, который называется KWIC (key word in

context).

AntConc – конкордансер, программа для для лингвостатистического анализа текста,

например, получения списка всех употреблений конкретного слова или выражения или

анализ частотного словаря. Открываем сверху во второй строке меню кнопку «Word List»,

выбираем «Sort by Word», чтобы сортировка слов была в алфавитном порядке, и

нажимаем «Start». Нас интересует употребления словоформы «судьба». В частотном

списке после удаления текстов, не содержащих искомое слово, остаётся 27 текстов. В

простом списке указано, что в начальной форме искомое слово встречается 23 раза, в

остальных формах – 36 раз.

Формат простого списка не даёт возможности снять полисемию и неоднозначность

грамматического класса слова, поэтому находим в списке нужное слово «судьба» и

нажимаем на него. Автоматически начинается его поиск в окне Concordance. Конкорданс –

это список всех употреблений заданного языкового выражения в контексте. Нас

интересует количество употреблений данного слова, а, соответственно, все его формы,

поэтому убираем маркер возле слова Words, а в слове судьба убираем окончание, чтобы в

окне Concordance было выведено большинство форм искомого слова «судьба». Найдено

57 совпадений. Необходимо учитывать и чередование в корне слова «судьба» во

множественном числе. Поэтому через специальный маркер «|» обозначаем варианты

«судьб|судеб» и находим все словоформы существительного «судьба». Найдено 59

совпадений; указан контекст каждого. Через ключевое слово можно перейти в исходный

файл и скопировать необходимый для работы фрагмент.

С помощью программы AntConc мы отобрали 27 поэтических и прозаических текстов

общеобразовательных программ для 5 – 6 классов, в которых в разной степени

частотности употреблена словоформа «судьба». На основе этих данных можно строить

работу с конкретными текстами, извлекая из них материал для наполнения содержания

концепта «судьба».

Конкордансы полезны для изучения устойчивых словосочетаний (коллокаций). Нам

это необходимо для прорабатывания ассоциативного поля у обучающихся при

употреблении концепта «судьба». Результаты поиска можно по-разному сортировать.

Можно настроить AntConc на демонстрацию того или иного количества слов справа и

слева от искомого слова. Также можно изменять порядок строк конкорданса. Мы

отсортировали в алфавитном порядке слова, непосредственно следующие до слова

поиска (то есть слева), расположив на панели KWIC (key word in context) уровни

ближайших трёх слов от искомого на позицию L (left). Это помогло найти подходящие

дополнения, которые можно употреблять с этим существительным.