МИНОБРНАУКИ РОССИИ
Федеральное государственное автономное образовательное
учреждение высшего профессионального образования
«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Факультет лингвистики и словесности
УТВЕРЖДАЮ
Декан факультета лингвистики и словесности С.Г. Агапова «_» 2013 г.
РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
Количественные методы лингвистического анализа Направление подготовки (специальность) 050100 Педагогическое образование Профиль подготовки "Русский язык" и "Литература" Квалификация (степень) выпускника Бакалавр Кафедра перевода и информационных технологий в лингвистике Курс 3 семестр Форма обучения очная Программа разработана:Агапов А.М., доцент кафедры перевода и ИТЛ Коваленко Е.М., доцент кафедры перевода и ИТЛ, д.ф.н.
Рецензент:
Ласкова М.В., зав. кафедрой перевода и ИТЛ, д.ф.н. профессор Ростов-на-Дону
МИНОБРНАУКИ РОССИИ
Федеральное государственное автономное образовательное учреждение высшего профессионального образования«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Факультет лингвистики и словесностиУТВЕРЖДАЮ
Декан факультета лингвистики и словесности С.Г. Агапова «_» 2013 г.
РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
Количественные методы лингвистического анализа Направление подготовки (специальность) 050100 Педагогическое образование Профиль подготовки "Русский язык" и "Иностранный язык" Квалификация (степень) выпускника Бакалавр Кафедра перевода и информационных технологий в лингвистике Курс 3 семестр Форма обучения очная Программа разработана:Агапов А.М., доцент кафедры перевода и ИТЛ Коваленко Е.М., доцент кафедры перевода и ИТЛ, д.ф.н.
Рецензент:
Ласкова М.В., зав. кафедрой перевода и ИТЛ, д.ф.н. профессор Ростов-на-Дону Рассмотрена и рекомендована к Рассмотрена и рекомендована к утверждению на заседании учебно- утверждению на заседании кафедры методического совета факультета перевода и ИТЛ лингвистики и словесности протокол заседания протокол заседания от «_» 201 г. № от «_» 201 г. №
СОГЛАСОВАНО
Протокол заседания кафедры русского языка и культуры речиМИНОБРНАУКИ РОССИИ
Федеральное государственное автономное образовательное учреждение высшего профессионального образования«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Рассмотрен и рекомендован к утверждению УТВЕРЖДАЮ на заседании кафедры перевода и ИТЛ Декан факультета лингвистики и Протокол от № _ «_» 201_ г. С.Г. АгаповаУЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС ДИСЦИПЛИНЫ
Количественные методы лингвистического анализа Направление подготовки (специальность) 050100 Педагогическое образование Профиль подготовки (специализация) "Русский язык" и "Литература" Квалификация (степень) выпускника Бакалавр Разработчик(и):Агапов А.М., доцент кафедры перевода и ИТЛ Коваленко Е.М., доцент кафедры перевода и ИТЛ, д.ф.н.
МИНОБРНАУКИ РОССИИ
Федеральное государственное автономное образовательное учреждение высшего профессионального образования«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Рассмотрен и рекомендован к утверждению УТВЕРЖДАЮ на заседании кафедры перевода и ИТЛ Декан факультета лингвистики и Протокол от № _ «_» 201_ г. С.Г. АгаповаУЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС ДИСЦИПЛИНЫ
Количественные методы лингвистического анализа Направление подготовки (специальность) 050100 Педагогическое образование Профиль подготовки (специализация) "Русский язык" и "Иностранный язык" Квалификация (степень) выпускника Бакалавр Разработчик(и):Агапов А.М., доцент кафедры перевода и ИТЛ Коваленко Е.М., доцент кафедры перевода и ИТЛ, д.ф.н.
СОДЕРЖАНИЕ
I. ЦЕЛИ И ЗАДАЧИ ОСВОЕНИЯ ДИСЦИПЛИНЫII. МЕСТО ДИСЦИПЛИНЫ В СТРУКТУРЕ ООП БАКАЛАВРИАТА ВПО..................
III. ТРЕБОВАНИЯ К РЕЗУЛЬТАТАМ ОСВОЕНИЯ СОДЕРЖАНИЯ ДИСЦИПЛИНЫ
IV. СОДЕРЖАНИЕ И СТРУКТУРА ДИСЦИПЛИНЫ
V. ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ
VI. ОЦЕНОЧНЫЕ СРЕДСТВА ДЛЯ ТЕКУЩЕГО КОНТРОЛЯ УСПЕВАЕМОСТИ И
ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИVII. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ
VIII. МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ............... IX. УЧЕБНАЯ КАРТА ДИСЦИПЛИНЫ
КРАТКОЕ ИЗЛОЖЕНИЕ ПРОГРАММНОГО МАТЕРИАЛА С
МЕТОДИЧЕСКИМИ УКАЗАНИЯМИ СТУДЕНТУМодуль 1. ЭЛЕМЕНТЫ ПРИКЛАДНОЙ ЛИНГВИСТИКИ
Модуль 2. ИСПОЛЬЗОВАНИЕ ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОГО МОДЕЛИРОВАНИЯ ЯЗЫКА И РЕЧИ
I. ЦЕЛИ И ЗАДАЧИ ОСВОЕНИЯ ДИСЦИПЛИНЫ
Целью освоения дисциплины «Количественные методы лингвистического анализа»является содействие формированию и развитию у студентов общекультурных и профессиональных компетенций, позволяющих им в дальнейшем осуществлять профессиональную деятельность посредством освоения основ использования информационных технологий и количественной обработки информации в лингвистическом анализе текстов.
Задачи изучения дисциплины «Количественные методы лингвистического анализа»:
формирование понимания сущности ряда количественных методов, получивших признание в теоретических и прикладных лингвистических исследованиях, и умений применять их на практике при проведении лингвистического анализа;
усвоение методики и методов структурно-вероятностного моделирования языка и речи, основных математико-статистических методов обработки лингвистической информации, методики контент-анализа; формирование умений применять их при проведении прагмалингвистического анализа;
усвоение основ теории и практики корпусной лингвистики, формирование умений по использованию национальных корпусов текстов в профессиональной деятельности;
усвоение основ теории и практики частотных словарей, формирование умений применять их в своей профессиональной деятельности.
II. МЕСТО ДИСЦИПЛИНЫ В СТРУКТУРЕ ООП БАКАЛАВРИАТА ВПО
2.1. Учебная дисциплина «Количественные методы лингвистического анализа»относится к дисциплинам вариативной части естественнонаучного цикла ООП бакалавриата (Б2.ДВ1).
2.2. Для успешного освоения данной дисциплины студент должен:
владеть знаниями, умениями и навыками, сформированными программой по дисциплине Информационные технологии в образовании:
Знать: основные понятия, методы и приемы формального моделирования естественного языка, основные понятия, методы и приемы информатики и компьютерных технологий.
Уметь: использовать понятийный аппарат прикладной лингвистики для решения профессиональных задач; работать с традиционными носителями информации, распределенными базами данных и знаний, электронными словарями и другими электронными ресурсами для решения лингвистических задач; оформлять текст перевода в компьютерном текстовом редакторе; использовать в профессиональной деятельности математические методы обработки информации и возможности вычислительной техники и программного обеспечения.
Владеть: способностью к анализу, обобщению информации, навыками работы с компьютером как средством получения, обработки и управления информацией; навыками работы с информацией в глобальных компьютерных сетях.
владеть знаниями, умениями и навыками, сформированными программой по дисциплинам Русский язык, Философия, Введение в филологию, Теория языка.
Знать: основы теоретического и сопоставительного языкознания, ориентируясь в основных лингвистических направлениях; основные этапы становления лингвистических учений в разные периоды истории.
Уметь: использовать понятийный аппарат теоретической и прикладной лингвистики для решения профессиональных задач; структурировать и интегрировать знания из различных областей профессиональной деятельности, обладать способностью их творческого использования и развития в ходе решения профессиональных задач; видеть междисциплинарные связи изучаемых дисциплин и понимать их значение для будущей профессиональной деятельности.
Владеть: системой лингвистических знаний, включающей в себя знание основных фонетических, лексических, грамматических, словообразовательных явлений и закономерностей функционирования изучаемого иностранного языка, его функциональных разновидностей; стандартными методиками поиска, анализа и обработки материала исследования; способностью оценить качество исследования в данной предметной области, соотнести новую информацию с уже имеющейся, логично и последовательно представить результаты собственного исследования.
2.3. Современные прикладные филологические исследования требуют применения информационных технологий и математических методов обработки информации для выявления сущности лингвистических явлений. Основываясь на положениях «математика является универсальным языком науки и мощным средством решения прикладных задач»
и «математика и информатика должны работать на профессиональную подготовку будущего специалиста, быть ее органичной частью», необходимо рассматривать информационные технологии в качестве лингвистического компонента профессионального образования филологов. Таким образом, математическая и информационно-технологическая подготовка лингвистов является актуальнейшей задачей современного филологического образования.
Освоение дисциплины «Количественные методы лингвистического анализа» является необходимой основой для последующего изучения дисциплин базовой части профессионального цикла. Приобретенные в результате изучения дисциплины знания, умения и навыки являются необходимой основой для прохождения практики, написания курсовых работ и выпускной квалификационной работы.
III. ТРЕБОВАНИЯ К РЕЗУЛЬТАТАМ ОСВОЕНИЯ СОДЕРЖАНИЯ
ДИСЦИПЛИНЫ
3.1. Процесс изучения дисциплины направлен на формирование элементов следующих компетенций в соответствии с ФГОС ВПО (ОС ЮФУ) и ООП ВПО по данному направлению подготовки (специальности):а) общекультурных (ОК) или универсальных (УК):
владеет культурой мышления, способен к обобщению, анализу, восприятию информации, постановке цели и выбору путей ее достижения (ОК-1);
готов использовать основные методы, способы и средства получения, хранения, переработки информации, готов работать с компьютером как средством управления информацией (ОК-8);
способен работать с информацией в глобальных компьютерных сетях (ОК-9);
способен понимать сущность и значение информации в развитии современного информационного общества, сознавать опасности и угрозы, возникающие в этом процессе, соблюдать основные требования информационной безопасности, в том числе защиты государственной тайны (ОК-12).
б) профессиональных (ПК):
способен выявлять и использовать возможности региональной культурной образовательной среды для организации культурно- просветительской деятельности (ПК-10);
готов использовать систематизированные теоретические и практические знания для определения и решения исследовательских задач в области образования (ПК-11) способен разрабатывать современные педагогические технологии с учетом особенностей образовательного процесса, задач воспитания и развития личности (ПКОсвоение данной дисциплиной является необходимой основой для последующего изучения теоретических курсов, проведения научно-исследовательской работы, прохождения переводческой практики и подготовки к итоговой государственной аттестации.
IV. СОДЕРЖАНИЕ И СТРУКТУРА ДИСЦИПЛИНЫ
4.1. Содержание модулей дисциплины Элементы прикладной Языкознание и математика. Конспект лекций.Вероятностноисследованию языковых Проектное 4.2. Структура дисциплины. Общая трудоемкость дисциплины составляет зачетные единицы (72 часа).
Общая трудоемкость лекционного материала; подготовка к лабораторным занятиям Модули дисциплины, изучаемые в 6 семестре Элементы прикладной лингвистики Вероятностно-статистическое 4.3. Лабораторные работы Математика и гуманитарные науки. Математическая Статистический подход к исследованию языковых структур. Основания и условия вероятностностатистического изучения языка и речи Структурно-вероятностные модели языка. Основные области приложения структурно-вероятностной модели языка: компьютерная лингвистика; корпусная лингвистика, Методика статистического эксперимента (на примере Анализ лабораторных работ «Статистический анализ Корпусная лингвистика как важнейший этап решения лингвостатистических моделей. Опыт разработки корпусов Частотный словарь как структурно-вероятностная модель языка и речи. Важнейшие применения частотных словарей Этапы подготовки и проведения контент-анализа. Факторы контроля качества эксперимента. Методы достижения репрезентативности в контент-анализе. Виды контентанализа.
Компьютерные технологии проведения контент-анализа.
4.4. Практические занятия (семинары) По программе не предусмотрены 4.5. Курсовой проект (курсовая работа) По программе не предусмотрены 4.6. Самостоятельное изучение модулей дисциплины № Темы \ вопросы, выносимые на самостоятельное изучение Кол-во Языкознание и математика. Элементы статистики.
Естественный язык и язык математики как семиотические Комбинаторная и квантитативная лингвистика.
Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения.
Современная глоттохронология как диахроническая модель.
Лексикостатистика Статистический подход к исследованию языковых структур.
Математические методы проверки гипотез.
Корпусная лингвистика. Опыт разработки корпусов текстов.
Фундаментальные корпусы. Электронные корпуса текстов.
Важнейшие применения частотных словарей. Частотные словари и: а) обучение языку, б) учебная лексикография, в) инженерная лингвистика, г) лингвистическая типология.
V. ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ
В рамках преподавания дисциплины используются стандартные образовательные технологии (лекции, устный опрос, зачет, системы задач), инновационные технологии обучения (индивидуальные образовательные траектории, технология модульного обучения, дистанционное обучение, компетентностно-ориентированное обучение, он-лайн и оф-лайн обучение) и информационные технологии:Интерактивное обучение (компьютерные обучающие программы, включающие в себя электронные учебники, тренажеры, тьюторы, лабораторные практикумы, тестовые системы).
Мультимедийное обучение (презентации, электронные УМР, мультимедийные курсы, представленные в системе Moodle на сайте e-learning.pi.sfedu.ru).
Интеллектуальные и обучающие экспертные системы, используемые в различных предметных областях.
Сетевые компьютерные технологии (Интернет, локальная сеть, Цифровой Кампус) Электронные библиотеки, распределенные и централизованные издательские системы.
Распределенные базы данных по отраслям знаний.
Компьютерное тестирование (диагностическое, промежуточное, итоговое, срезовое) В процессе преподавания дисциплины «Количественные методы лингвистического анализа» используется компетентностный подход, который помогает повысить мотивированность студентов, их ответственность за качество полученных знаний. Все лекции представлены в презентациях, используются гиперссылки на соответствующие сайты. На лекциях используются элементы лекций-бесед. Применяются современные методы контроля студентов (тесты, творческие задания, контроль с помощью технических средств).
Материал курса представлен на информационных сайтах ЮФУ:
http://www.incampus.ru/ http://itlflis.ru/ 95% интерактивных занятий от объема аудиторных занятий
VI. ОЦЕНОЧНЫЕ СРЕДСТВА ДЛЯ ТЕКУЩЕГО КОНТРОЛЯ
УСПЕВАЕМОСТИ И ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИ
Текущий контроль проводится в период аудиторной и самостоятельной работы студента и включает: посещение лекционных и лабораторных занятий, выполнение всех проектных заданий; выполнение самостоятельных заданий, итогового тестирования, а также выполнение иных заданий, определяемых преподавателем. Формы контроля, порядок начисления баллов и фонды контрольных заданий для текущего контроля по дисциплине отражены в учебной карте дисциплины.Рубежный контроль проводится с целью определения результатов освоения студентом модуля. Каждый модуль дисциплины завершается практической формой (выполнение лабораторных заданий в блоке информатика) и письменной формой (в блоке математика) контроля усвоения учебного материала и получением рейтинговых баллов, которые суммируются с рейтинговыми баллами текущего контроля. В качестве форм контроля модуля используются: контрольная работа, тестирование, реферат, эссе, собеседование с письменной фиксацией ответов студентов, итоговая контрольная работа, целью которой является закрепление студентами полученных знаний в ходе изучения курса и другие, которые отражены в учебной карте дисциплины.
Итоговый рейтинг студента по данной дисциплине включает в себя сумму баллов текущего, рубежного контроля и промежуточной аттестации (зачета). Он отражает качество освоения студентом учебного материала в семестре и определяется по 100бальной шкале.
Промежуточная аттестация проводится в форме зачёта, который выставляется по баллам, набранным студентом в рамках текущего и рубежного контроля, которые отражены в учебной карте дисциплины (см. п. IX). Студенты, не набравшие в течение семестра необходимого минимума баллов должны отработать мероприятия рубежного контроля, выполнить соответствующие задания в течение одной недели после окончания модуля.
Студенты, которые по уважительной причине не смогли набрать необходимое число баллов по текущему и рубежному контролю модуля, могут по согласованию с преподавателем отработать задолженности до начала промежуточной аттестации.
При повторном прохождении рубежного контроля или промежуточной аттестации, баллы, набранные впервые не суммируются с баллами, полученными повторно для одного и того же модуля или дисциплины.
В случае если студентом в соответствующие нормативные сроки не набрано минимальное количество баллов, студент считается не прошедшим промежуточную аттестацию по дисциплине.
Минимальная сумма баллов, достаточная для получения промежуточной аттестации в форме зачета составляет 60 баллов.
ОБРАЗЕЦ ТЕСТА ИТОГОВОГО КОНТРОЛЯ
Тема: «Исследование употребления М. Булгаковым различных букв русского алфавита»Определить относительную частоту f употребления двух букв «о, е» в следующей небольшой выборке из романа М.А. Булгакова «Мастер и Маргарита»:
Она несла в руках отвратительные, тревожные желтые цветы. Черт их знает, как их зовут, но они первые почему-то появляются в Москве. И эти цветы очень отчетливо выделялись на черном ее весеннем пальто.
Она несла желтые цветы! Нехороший цвет.....
II. Определение минимально достаточного объёма выборки По данным предварительного эксперимента определить минимально достаточный объём выборки N для получения достоверных сведений об употреблении М. Булгаковым в художественных произведениях букв русского алфавита «а, е» при заданных относительной ошибке = 0,15 (15%) и надёжности = 0,95 (95%).
сформулировать возможные цели данного исследования, определить возможные единицы анализа;
провести анализ генеральной лингвистической совокупности (ГЛС) по одной из сформулированных Вами целей исследования;
оценить степень достоверности относительной частоты f, полученной в предварительном эксперименте, используя понятия «репрезентативность выборки (ВЛС)», «относительная ошибка», «надёжность» и «минимально достаточный описать методику комплектования с помощью случайного, механического, серийного или типического отбора новой выборки (ВЛС) объёма N (определённого по данным предварительного эксперимента) для получения достоверных результатов.
Задание № 1. Перевести (дешифровать) с санскрита небольшой текст. (Факультативно:
решить задачи на определение периода дивергенции и коэффициента сохранности лексики).
Задание № 2. Построить классификацию местоимений русского языка (или какой-либо их части, например, только изменяемых местоимений, только неизменяемых, только субстантивного типа и т.п.) на основе теоретико-множественного подхода.
Задание № 3. Лабораторная работа по исследованию предисловий к текстам по Национальному корпусу русского языка.
Задание № 4. Лабораторная работа по статистическому исследованию публицистических и рекламных текстов, представленных в Национальном корпусе русского языка.
Задание № 5. Лабораторная работа по статистическому анализу газетного текста.
Задание № 6. Лабораторная работа по контент-анализу литературного текста.
Задание № 7. Тест итогового контроля.
1. Языкознание и естественные науки.
2. Математика и языкознание.
3. Различия лингвистического и математического знака.
4. Количественные методы в языкознании.
5. Математическая лингвистика (комбинаторная и квантитативная лингвистика).
6. Сравнение методов описательной, теоретической и прикладной лингвистики.
7. Модель, оригинал, структурная модель.
8. Формализация и моделирование в лингвистике.
9. Некоторые типы моделей теоретической лингвистики.
10. Математические модели в лингвистике.
11. Основные области приложения структурно-вероятностной модели языка.
12. Возможности использования структурно-вероятностной модели языка в теории и практике перевода.
13. Основания и условия вероятностно-статистического изучения языка и речи.
14. Методика статистического эксперимента.
15. Генеральная лингвистическая совокупность, выборочный метод.
16. Методика создания выборочной лингвистической совокупности. Требования к ней.
17. Репрезентативность; приемы, обеспечивающие надежную репрезентативность тематических выборок.
18. Корпусная лингвистика как важнейший этап решения задачи автоматизированного построения лингвостатистических моделей.
19. Опыт разработки корпусов текстов. Фундаментальные корпусы.
20. Электронные корпуса текстов.
21. Национальный корпус русского языка.
22. Методика контент-анализа и примеры её применения.
23. Сущность контент-анализа.
24. Концептуальная переменная.
25. Этапы подготовки и проведения контент-анализа.
26. Варианты контент-анализа.
27. Факторы контроля качества контент-анализа.
28. Частотный словарь как вероятностно-статистическая модель языка.
29. Современная глоттохронология.
30. Лексикостатистика.
31. Основные постулаты глоттохронологии, их недостатки, необходимость пересмотра некоторых из них.
VII. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ
7.1. Основная литература:1. Алексеев П.М. Частотные словари: Уч. пособие. - СПб.: Изд-во СПб ун-та, 2001.
2. Баранов А.Н. Введение в прикладную лингвистику: Уч. пособие. - М.: Эдиториал УРСС, 2001.
3. Головин Б.Н. Язык и статистика. - М.: Просвещение, 1971.
4. Грес П.В. Математика для гуманитариев. Уч. пособие. - М.: Логос, 2004.
5. Математика. Большой энциклопедический словарь / Гл. ред. Ю.В. Прохоров. – 3-е изд.
М.: Большая Российская энциклопедия, 1998.
6. Пиотровский Р.Г. и др. Математическая лингвистика. Уч. пособие для пед. ин-тов. М.: Высшая школа, 1977.
7. Русский язык. Энциклопедия / Гл. ред. Ю.Н. Караулов. – 2-е изд., перераб. и доп. – М.:
Большая Российская энциклопедия; Дрофа, 1998.
8. Турыгина Л.А. Моделирование языковых структур средствами вычислительной техники. - М.: Высшая школа, 1988.
9. Философский энциклопедический словарь. – М.: ИНФРА-М, 1998.
10. Частотный словарь русского языка. / Под ред. Л.Н. Засориной – М., 1977.
11. Языкознание. Большой энциклопедический словарь / Гл. ред. В.Н. Ярцева. – 2-е изд. М.:
Большая Российская энциклопедия, 1998.
7.2. Дополнительная литература:
1. Агапов А.М. Математические методы прагмалингвистического анализа – исследование личностных качеств персонажей художественного произведения // Словесность:
традиции и современность. – Ростов н/Д: Изд-во РГПУ, 2006. – с. 9-13.
2. Агапов А.М., Коваленко Е.М. Магия слова М.А. Булгакова //Материалы международной научной конференции «Языковая система и речевая деятельность:
лингвокультурологические и прагматические аспекты». – ЮФУ, 3–7 октября 2007 г. – с. 215-218.
3. Амирова Т.А. Из истории лингвистики XX века. Учебное пособие. - М.: ЧеРо, 1999.
4. Арнольд И.В. Основы научных исследований в лингвистике. - М.: Высшая школа, 1991.
5. Барт Р. Избранные работы: Семиотика: Поэтика: Пер. с фр. – М.: Прогресс, 1989.
6. Бурлак С.А., Старостин С.А. Введение в лингвистическую компаративистику:
Учебник. - М.: Эдиториал УРСС, 2001.
7. Гладкий А.В., Мельчук И.А. Элементы математической лингвистики. - М.: Наука, 1969.
8. Дешериева Т.И. Языкознание и математика. - Алма-Ата: Наука, 1973.
9. Журавлев А.П. Диалог с компьютером. – М., 1987.
10. Зарубежная лингвистика. I (II, III): Пер. с англ. / Общ. ред. В.А. Звегинцева и Н.С.
Чемоданова. -М.: Издательская группа «Прогресс», 1999.
11. Ионина А.А., Саакян А.С. Longman Grammar of Spoken and Written English (обзорнокритическая рецензия) // Иностранные языки в школе. – 2003. – № 3. С. 104-108.
12. Кобозева И.М. Лингвистическая семантика: Учебник. - М.: Эдиториал УРСС, 2000.
13. Лотман Ю.М. Семиосфера. – СПб, 2001.
14. Марчук Ю.Н. Основы компьютерной лингвистики. Учебное пособие. Издание 2-е дополненное. - М.: Изд-во МПУ «Народный учитель», 2000.
15. Молодший В.Н. Очерки по философским вопросам математики. - М.: Просвещение, 16. Шалак В.И. Современный контент-анализ. Приложения в области: политологии, психологии, социологии, культурологии, экономики, рекламы. – Омега-Л, 2004.
7.3. Список авторских методических разработок.
1. Коваленко Е.М., Агапов А.М. Элементы прикладной лингвистики в PR-технологиях.
(Учебно-методическое пособие). – Ростов н/Д: ИПО ПИ ЮФУ, 2009.
2. Коваленко Е.М., Агапов А.М. Количественные методы в прикладной лингвистике.
(Учебно-методическое пособие). – Ростов н/Д: ИПО ПИ ЮФУ, 2010.
3. Коваленко Е.М., Агапов А.М. Информационные технологии в лингвистике:
Количественные методы в прикладной лингвистике. (Учебно-методическое пособие) – Ростов н/Д: ИПО ЮФУ, 2013.
7.4. Периодические издания 7.5. Интернет-ресурсы 1. http://itlflis.ru/ – сайт ФЛИС, на котором представлены электронные тексты статей, выдержки из труднодоступной литературы, различные дополнительные текстовые материалы.
2. starling.rinet.ru - сайт Старостина С.А. «Вавилонская башня»
3. links-guide.ru - сайт «Лингвистические ресурсы в Internet-е».
4. vaal.ru - сайт разработчиков компьютерной версии контент-анализа.
5. www.vaal.ru/show.php?id=114 – статья М. Дымшица «Звуко-цветовая синестезия и методы ее исследования».
6. colormind.narod.ru/YanshinMonograph/YnshinMngrphIndex.htm – монография Яньшина П.В. «Введение в психосемантику цвета».
7. http://www.textology.ru/web.htm — лигвоанализатор, автоматически сравнивающий тексты по параметрам индивидуального авторского стиля.
8. ruscorpora.ru (corpora.yandex.ru) - национальный корпус русского языка.
9. www.philol.msu.ru/~lex/corpus — компьютерный корпус текстов русских газет конца XX-го века.
10. artint.ru/projects/frqlist.asp - частотный словарь современного русского языка.
11. natcorp.ox.ac.uk/ — текстовые базы данных: The British National Corpus (BNC) is a million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of current British English, both spoken and written.
12. http://dict.ruslang.ru/freq.php – новый частотный словарь русской лексики, созданный на основе НКРЯ.
13. http://zhurnal.lib.ru/h/hmelew_d_w/ – лингвоанализатор Д. Хмелева.
14. http://bw.keytown.com/model.htm – сайт «Мир Булгакова», посвященный творчеству М.
А. Булгакова. Информационные лингвистические модели.
15. http://www.lsw.ru/cfrl/index.htm– машинный фонд русского языка (МФ РЯ) (Гл.конструктор В.М.Андрющенко).
16. http://uz-translations.net/?category=linguistics – книги для филологов.
17. http://www.zpu-journal.ru/e-zpu/2008/ – электронный журнал "Знание. Понимание.
Умение" 2008 г.
7.6. Программное обеспечение современных информационно-коммуникационных технологий.
Материал курса представлен на информационных сайтах ЮФУ:
http://itlflis.ru/ http://www.incampus.ru/ http://kemsema.wikispaces.com/ (для получения доступа нужна регистрация) ruscorpora.ru (corpora.yandex.ru) - национальный корпус русского языка.
VIII. МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ
8.1. Учебно-лабораторное оборудование 1. Специально оборудованные аудитории и компьютерные классы Мультимедийная аудитория. Электронная доска SMART Board680i с Мультимедийная аудитория. Электронная доска Smart640. 14 ПК.Мультимедийная аудитория. Электронная доска SmartBoard 680i Мультимедийная аудитория. Электронная доска Smart Мультимедийная аудитория. Электронная доска Polymedia. 12 ПК.
Учебный класс. 19 ПК, проектор, переносной экран, интерактивная доска, мобильный класс (11 ноутбуков), беспроводная точка доступа Лингафонный кабинет: 12 ПК, система синхронного перевода. Учебный класс: 18 ПК, лингафонная система Санако, беспроводная точка доступа Учебный класс. 15 ПК, интерактивная доска, беспроводная точка доступа 8.2. Программные средства 1. Пакет программ MS Office 2. ОС Windows 3. Психолингвистическая экспертная система Ваал® – 1 лицензия.
4. Vaal-mini – бесплатная программа фоносемантического анализа текста.
8.3. Технические и электронные средства Презентации к лекциям и практическим занятиям. Выход в сеть Интернет.
Демонстрационные видеоролики, подобранные преподавателем в сети Интернет по темам занятий.
IX. УЧЕБНАЯ КАРТА ДИСЦИПЛИНЫ
«Количественные методы лингвистического анализа»Преподаватель _ Кафедра перевода и информатики Курс 3 Семестр 6 Группа _ Направление подготовки (специальность): 050100 Педагогическое образование Текущий контроль Посещение лекций Посещение ЛЗ Работа на ЛЗ Конспект лекций Перевод с санскрита Классификация местоимений ЛР по исследованию предисловий Рубежный контроль ЛР по статистическому исследованию НКРЯ ЛР по статистическому анализу газетного ЛР по контент-анализу литературного текста Тест итогового контроля Собеседование с письменной фиксацией ответа студентов Промежуточная аттестация Дополнительные требования для студентов, отсутствующих на лекциях и лабораторных занятия по уважительной причине: устное сквозное собеседование с преподавателем по проблемам лекционных занятий, обязательное выполнение аудиторных и внеаудиторных работ.
Преподаватель Согласовано: заведующий кафедрой _ Примечание: Количество баллов на текущий и рубежный контроль устанавливается Ученым советом факультета. Количество баллов за мероприятия текущего контроля устанавливает преподаватель дисциплины.
X. КРАТКОЕ ИЗЛОЖЕНИЕ ПРОГРАММНОГО МАТЕРИАЛА
С МЕТОДИЧЕСКИМИ УКАЗАНИЯМИ СТУДЕНТУ
Модуль 1. ЭЛЕМЕНТЫ ПРИКЛАДНОЙ ЛИНГВИСТИКИ Рассмотрение некоторых теоретических проблем квантитативной и математической лингвистики в рамках прикладной лингвистики, некоторых проблем оптимизации коммуникативной, когнитивной, эпистемической функций языка. Изучение данного модуля позволит студентам усвоить теоретические принципы прикладной лингвистики, основания, условия и границы применения некоторых математических методов в гуманитарных исследованиях, а также продолжить формирование соответствующих компетенций.Лекция № 1. Математика и гуманитарные науки. Математическая лингвистика.
Роль формальных методов в гуманитарном знании. Основные функции языка, металингвистическая функция и математические методы лингвистического анализа.
Естественный язык и язык математики как семиотические системы. Понятие математической экспликации. Комбинаторная и квантитативная лингвистика.
Лекция № 2. Прикладная лингвистика.
Некоторые методы современной лингвистики, заимствованные у смежных наук.
Теоретическая и прикладная лингвистика. Методы классификации и моделирования в описательной, теоретической и прикладной лингвистике. Типы лингвистических моделей:
а) компонентные, предсказывающие, имитирующие и диахронические; б) анализирующие и синтезирующие.
Лабораторное занятие 1. Математика и гуманитарные науки. Математическая лингвистика.
1. Математика и гуманитарные науки.
2. Язык и математика. Различия лингвистического и математического знака.
3. Математическая экспликация лингвистических явлений.
4. Содержание понятия «математическая лингвистика». Математическая ли это дисциплина?
5. Комбинаторная и квантитативная лингвистика.
1. Пиотровский Р.Г. и др. Математическая лингвистика. Уч. пособие. М., 1977.
2. Гладкий А.В., Мельчук И.А. Элементы математической лингвистики. М., 1969.
3. Марчук Ю.Н. Основы компьютерной лингвистики. Уч. пособие. М., 2000.
4. Дешериева Т.И. Языкознание и математика. Алма-Ата, 1973.
5. Ельмслев Л. Пролегомены к теории языка // Новое в лингвистике. М., 1960. Вып. I.
6. Амирова Т.А. Из истории лингвистики XX века. Уч. пособие. М., 1999.
7. Языкознание. Большой энциклопедический словарь / Гл. ред. В.Н. Ярцева. - М., 8. Математика. Большой энциклопедический словарь. М., 1998.
1 Посещение лекций 0-4 б. За 1 час лекции – 1 балл 2 Посещение ЛЗ 0-1 б. За 1 час практического занятия – 0,75 балла 3 Работа на занятиях 0,5 б. Выполнение заданий, ответ на вопросы 4 Конспект лекций 0-2 б. Конспект всех лекций и дополнительных материалов 6 Перевод с 5 б. Оценивается степень самостоятельности, наличие 7 Классификация 3 б. Описание в рамках теоретической, описательной и 3. Задания, обеспечивающие достижение студентом комплексной цели модуля Задание № 1. Перевести (дешифровать) с санскрита небольшой текст.
(Факультативно: решить задачи на определение периода дивергенции и коэффициента сохранности лексики) Задание № 2. Построить классификацию местоимений русского языка (или какойлибо их части, например, только изменяемых местоимений, только неизменяемых, только субстантивного типа и т.п.) на основе теоретико-множественного подхода.
Конспект лекций должен быть сдан преподавателю на проверку на первом лабораторном занятии. Проектные задания № 1 и № 2 должны быть сданы на проверку на 3-4 лекции. Все замечания в работах должны быть устранены к итоговой аттестации, формой которого является зачет.
Формой промежуточной аттестации является зачет. При этом система текущего и рубежного контроля строится по бально-рейтинговой модели, итоговый зачет студенты получают в качестве накопительной рейтинговой оценки (не менее 60 баллов).
В технологической карте дисциплины выделены все формы текущего и рубежного контроля, каждая из которых оценивается определенным количеством баллов.
5. Методические указания по видам управляемой самостоятельной работы Задание № 1. (Задача А.Б. Долгопольского и А.А. Зализняка) I этап: Переведите – дешифруйте с санскрита текст (дан в упрощенной записи).
Dame vidhav jvati. Damas navas asti. Dame agnis asti: vidhav damam tpayati.
Catvras snavas na santi dame: aviks psanti prastre. Nav snu na budhyate:
supyate. Vidhav etm snum bodhayati: «Раса mnsam!» iti. Snu havate:
«Devaras, bharata avikm!» iti. «Katarm?» iti. «Tm tanukm, devaras» iti. Trayas devaras jvm avikm bharanti. Avik ravati. Devaras etm avikm mrayanti. Snu meam darati, mnsam pacati, dhme vartayati. Vidhav snum havate: «Vaha madhu!» iti nodayati. Snus ravati: «Nnam, mtar!» iti. Snus madhu vahati. Vidhav snum sdayati, snu devaram pyayati. Nnam catvras adaks sdanti, mnsam adanti, madhu giranti. «Madhu-ptis jvayati, mtar!» iti ravanti.
1. В записи санскритских слов с означает ч, j – слитное дж, – ш, – щ, у – й; bh, dh, th – единые согласные; черта над гласной означает долготу.
2. Слово iti не переводится; оно указывает на конец прямой речи. Слова на -te переводите так, как если бы они кончались на -ti.
Санскрит (литературный древнеиндийский язык) родственен русскому. Ниже приведено несколько пар соответствующих друг другу по происхождению санскритских и русских словоформ. (Конечные элементы, не тождественные друг другу по происхождению, заключены в скобки). Если словоформы расходятся по значению, при санскритской словоформе в кавычках дан перевод.
plavik(am) 'паромщика' – пловц(а) (вин. пад.) bhaga 'о, податель благ!' – боже!
Составьте таблицу соответствий между санскритом и русским:
Гласные: санскрит – русский Сочетания: an, n, am – у или я Согласные: v – в; h – з; с – ч и т. д..
Элементы склонения: …..
Элементы спряжения: ….
Обратите внимание на образование форм единственного и множественного числа у глаголов.
После этого приступайте к дешифровке текста. Не «переводите», а «дешифруйте»!
II этап: Выясните, в каком родстве находятся русский язык и санскрит (в виде генеалогического дерева). (см. Бурлак С.А., Старостин С.А. Введение в лингвистическую компаративистику. М., 2001, с. 188URL: http://itlflis.ru/mmla/starostin/ctarostin.pdf (нужна регистрация)).
Описать категорию «местоимение» в рамках описательной, теоретической и прикладной лингвистики (см. Баранов А.Н. Введение в прикладную лингвистику: Уч. пособие.
М., 2001, с. 11).
Построить классификацию местоимений русского языка (или какой-либо их части, например, только изменяемых местоимений, только неизменяемых, только субстантивного типа и т.п.) на основе теоретико-множественного подхода – разбиения множества на классы. Выявить нечёткость множества выбранных лингвистических объектов и попытаться определить полевую структуру данной подсистемы языка. Работу сдать для проверки на 3–4-й лекции.
6. Методические рекомендации по подготовке к практическим занятиям Лекционные и лабораторные занятия направлены на выработку у студентов представления об основаниях, условиях и границах применения некоторых математических методов в гуманитарных исследованиях, основных областях приложения структурно-вероятностной модели языка, основных понятиях корпусной лингвистики. На лабораторных занятиях проверяются и совершенствуются теоретические знания, полученные студентами на лекциях и при изучении специальной литературы.
Лекционный курс и практические задания адаптированы с учётом возможных интересов будущих специалистов.
Модуль 2. ИСПОЛЬЗОВАНИЕ ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКОГО
МОДЕЛИРОВАНИЯ ЯЗЫКА И РЕЧИ
Изучение методики и методов структурно-вероятностного моделирование языка и речи, методики контент-анализа, формирование умений применять их при проведении прагмалингвистического анализа; ознакомление студентов с информационными лингвистическими технологиями. Изучение данного модуля позволит студентам усвоить основные области приложения структурно-вероятностной модели языка, освоить основные математические понятия, применяемые в исследовании текста и речи, изучить методику статистического эксперимента и контент-анализа, научиться использовать эти понятия и методы в своей работе, освоить ряд компьютерных технологий, связанных с применением методов статистического моделирования языка и текста, а также сформировать соответствующие компетенции.Лекция № 3. Основные области приложения структурно-вероятностной модели языка.
Прикладные аспекты квантитативной лингвистики. Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения. Основные области приложения структурно-вероятностной модели языка.
Лекция № 4-5. Статистический подход к исследованию языковых структур. Основания и условия вероятностно-статистического изучения языка и речи.
Субъективное, статистическое и классическое определение вероятности.
Статистический подход к исследованию языковых структур. Статистические закономерности в языковых структурах. Основания и условия вероятностностатистического изучения языка и речи. Основы построения лингвостатистических моделей. Минимально-необходимые статистические инструменты. Компьютерные технологии.
Лекция № 6. Методика статистического эксперимента. Методика создания выборочной лингвистической совокупности (выборки).
Этапы статистического эксперимента. Генеральная лингвистическая совокупность, выборочный метод. Методика создания выборочной лингвистической совокупности (выборки). Требования к выборочной лингвистической совокупности – репрезентативность и рациональный объем выборки.
Лекция № 7. Корпусная лингвистика. Электронные корпуса текстов.
Языковой материал в лингвистических исследованиях. Корпусная лингвистика как важнейший этап решения задачи автоматизированного построения лингвостатистических моделей. Исходные понятия корпусной лингвистики. Требования к корпусу текстов как к выборочной лингвистической совокупности, отражающей проблемную область. Опыт разработки корпусов текстов. Фундаментальные корпусы. Электронные корпуса текстов.
Лабораторное занятие 2-5. Вероятностно-статистическое изучение языка и речи.
1. Статистический подход к исследованию языковых структур.
2. Основания и условия вероятностно-статистического изучения языка и речи 3. Структурно-вероятностные модели языка. Основные области приложения структурновероятностной модели языка: компьютерная лингвистика; корпусная лингвистика, авторизация/атрибуция текста.
4. Методика статистического эксперимента (на примере создания частотного словаря):
– формулирование цели исследования;
– определение единицы анализа; аналитическая грамматика частотного словаря;
– методика сбора информации, генеральная и выборочная лингвистические совокупности;
– репрезентативность выборки;
– рациональный объем выборки, определение достаточности объема выборки.
5. Математические методы проверки гипотез. Элементы теории статистических гипотез.
6. Анализ лабораторных работ «Статистический анализ текста».
1. Пиотровский Р.Г. и др. Математическая лингвистика. Уч. пособие. М., 1977.
2. Баранов А.Н. Введение в прикладную лингвистику: Уч. пособие. М., 2001.
3. Марчук Ю.Н. Основы компьютерной лингвистики. Уч. пособие. М., 2000.
4. Головин Б.Н. Язык и статистика. М., 1971.
5. Турыгина Л.А. Моделирование языковых структур средствами вычислительной техники. М., 1988.
6. Частотный словарь русского языка. / Под ред. Л.Н. Засориной. М., 1977.
7. Алексеев П.М. Частотные словари: Уч. пособие. СПб., 2001.
9. www.philol.msu.ru/~lex/corpus - компьютерный корпус текстов русских газет конца XX-го века.
10. info.ox.ac.uk/bnc - текстовые базы данных: The British National Corpus (BNC).
11. Языкознание. Большой энциклопедический словарь. М., Лабораторное занятие 6. Корпусная лингвистика. Электронные корпуса текстов.
1. Корпусная лингвистика как важнейший этап решения задачи автоматизированного построения лингвостатистических моделей.
2. Исходные понятия корпусной лингвистики: проблемная область, корпус данных, корпус текстов, единица хранения, типы корпусов данных, способы представления и хранения корпуса данных.
3. Требования к корпусу текстов как к выборочной лингвистической совокупности, отражающей проблемную область.
4. Опыт разработки корпусов текстов. Фундаментальные корпусы (США, Великобритания, Германия, Франция, Россия).
5. Электронные корпуса текстов. Британский национальный корпус. Национальный корпус русского языка. Компьютерный корпус текстов русских газет конца XX-го века.
Баранов А.Н. Введение в прикладную лингвистику: Уч. пособие. - М., 2001.
Частотный словарь русского языка. / Под ред. Л.Н. Засориной. – М., 1977.
philol.msu.ru/~lex/corpus — компьютерный корпус текстов русских газет конца XX-го века.
philol.msu.ru/~humlang/articles/PolystylCorp.htm – полистилевой корпус текстов современного русского языка.
5. ruscorpora.ru (corpora.yandex.ru) – национальный корпус русского языка.
6. natcorp.ox.ac.uk/ — текстовые базы данных: The British National Corpus (BNC) is a 100 million word collection of samples of written and spoken language from a wide range of sources, designed to represent a wide cross-section of current British English, both spoken and written.
Лабораторное занятие 7-9. Методика, сущность, этапы подготовки и проведения контент-анализа. Примеры применения методики контент-анализа.
1. Контент-анализ, его методика и сущность с лингвистической точки зрения.
Концептуальная переменная, проблемы отбора ее значений.
2. Этапы подготовки и проведения эксперимента.
3. Факторы контроля качества эксперимента. Виды контент-анализа.
4. Контент-анализ литературного текста (на примере лабораторной работы):
структура концепта «СВОЙ-ЧУЖОЙ», возможные составные части этого «эксклюзивность», «инклюзивность», «чужое», «Я и Ты» как компоненты концепта «СВОЙ-ЧУЖОЙ»;
соответствие количественных характеристик текста качественному анализу, подтверждает или опровергает весь текст поэмы полученные на основе количественных данных качественные выводы.
1.Компьютерные технологии проведения контент-анализа. Система «ВААЛ».
1. Баранов А.Н. Введение в прикладную лингвистику: Уч. пособие. М., 2001.
2. www.vaal.ru - сайт разработчиков компьютерной версии контент-анализа.
2 Посещение лабораторных 0-15 б. За 1 час практического занятия – 0,75 балла занятий 3 Работа на лабораторных 0-4,5 б. Выполнение заданий, ответ на вопросы занятиях ЛР по статистическому 0-9 б. Оценивается выполнение адаптированного анализу газетного текста перевода, самостоятельность и выполнение 8 Тест итогового контроля 0-10 б. Первый и второй этап - максимально 9 Собеседование с письменной 0-5 б. Устное собеседование по проблемам фиксацией ответа студентов лекционных занятий и выполненным 3. Задания, обеспечивающие достижение студентом комплексной цели модуля Задание № 3. Лабораторная работа по исследованию предисловий к текстам по Национальному корпусу русского языка.
Задание № 4. Лабораторная работа по статистическому исследованию публицистических и рекламных текстов, представленных в Национальном корпусе русского языка.
Задание № 5. Лабораторная работа по статистическому анализу газетного текста.
Задание № 6. Лабораторная работа по контент-анализу литературного текста.
Задание № 7. Тест итогового контроля.
Конспект лекций должен быть сдан преподавателю на проверку на первом лабораторном занятии. Проектное задание № 3 должно быть сдано на проверку на 3-м лабораторном занятии. Проектные задания № 4 и 5 должны быть сданы на проверку на шестом лабораторном занятии. Проектное задание № 6 - на 8-м лабораторном занятии.
Тест итогового контроля выполняется на 9-м практическом занятии по индивидуальным вариантам. К итоговой аттестации необходимо провести работу над ошибками, объяснив характер и причины сделанных ошибок. Все замечания в работах должны быть устранены к итоговой аттестации, формой которого является зачет.
Формой итоговой аттестации является зачет. При этом система текущего и рубежного контроля строится по балльно-рейтинговой модели, итоговый зачет студенты получают в качестве накопительной рейтинговой оценки (не менее 60 баллов).
В технологической карте дисциплины выделены все формы текущего и рубежного контроля, каждая из которых оценивается определенным количеством баллов.
5. Методические указания по видам управляемой самостоятельной работы Задание № 3. Лабораторная работа по исследованию предисловий.
Работа заключается в проведении статистического анализа литературного текста по грамматическим категориям и должна быть сдана преподавателю для проверки на 3-м лабораторном занятии.
Для выполнения работы необходимо взять два отрывка текста из основного подкорпуса Национального корпуса русского языка: предисловие к роману М.Ю.
Лермонтова «Герой нашего времени» и предисловие к роману М.А. Булгакова «Театральный роман».
АНАЛИЗ
1 этап. Используя возможности метаразметки НКРЯ:определите для каждой единицы анализа её грамматическую категорию и заполните таблицу для каждого текста отдельно;
составьте для каждой грамматической категории список употребления лексем по убыванию, оформив результаты работы в виде частотного словаря (для каждой грамматической категории отдельно) с указанием частоты употребления единиц сформулируйте собственную гипотезу о совпадении (схожести/несхожести) структур предисловий к произведениям.
Грамматические категории Существительное Прилагательное Числительное Предикатив Местоимение 11. Причастие 12. Остальные Итого (общая сумма) 2 этап. Проведите анализ распределения частот грамматических категорий слов в предложенных текстах, сравнив полученные данные с данными таблицы 4, приведенной в приложении 4 частотного словаря русского языка под редакцией Засориной Л.Н.:
– проанализируйте расхождения и совпадения относительных частот грамматических категорий слов, полученных Вами, со средними «по Засориной» значениями для всех функциональных стилей (жанров); укажите возможные на Ваш взгляд причины этих расхождений и совпадений;
– определите функциональный стиль, к которому «тяготеют» предложенные отрывки и можно ли однозначно ответить на этот вопрос;
– какие типы текстов могут давать похожие таблицы;
– можно ли «догадаться», и каким образом о формальном содержании текста только по таблице частот.
3 этап. Проведите сравнительный анализ количественных моделей (таблиц) и частотных словарей (по грамматическим категориям) исследуемых предисловий:
проанализируйте наиболее употребительные лексемы в каждом тексте, выявляя общие признаки частоупотребимых/редкоупотребимых единиц анализа для каждой грамматической категории;
проведите сравнительный анализ распределения частот грамматических категорий слов в двух полученных Вами таблицах;
проверьте сформулированную вами гипотезу для предложенных предисловий, выявив характерные особенности идиостиля языка М.Ю. Лермонтова и М.А. Булгакова для исследуемых отрывков.
Задание № 4. Статистический анализ публицистических и Работа заключается в проведении статистического анализа публицистических и рекламных текстов, представленных в НКРЯ (национальном корпусе русского языка), по грамматическим категориям и должна быть сдана преподавателю для проверки на 5-м лабораторном занятии.
1 этап. Для выполнения работы необходимо заполнить следующую таблицу (отдельно для публицистических, отдельно для рекламных текстов).
существительное прилагательное наречие предикатив числительное числительное-прилагательное местоимение-существительное местоимение-прилагательное местоименное наречие местоимение-предикатив (некого, нечего) предлог частица вводное слово междометие инициал прочие (иностранные слова, звукоподражания) Число словоупотреблений – абсолютное количество слов; % словоупотреблений – относительное количество.
Из ЧС под ред. Л. Засориной необходимо выбрать характеристики газетножурнального стиля.
На сайте НКРЯ (ruscorpora.ru) задать подкорпус публицистических текстов со снятой омонимией. На странице поиска выбрать соответствующие грамматические признаки, осуществить поиск и записать полученные количественные характеристики в соответствующие ячейки таблицы.
Такое же исследование провести для рекламных текстов.
2 этап. Проведите анализ распределения частот грамматических категорий слов для каждой таблицы, сравнив полученные данные с с характеристиками газетно-журнального стиля таблицы № 4 приложения 4 частотного словаря (ЧС) под ред. Л. Засориной.
3 этап. Проведите сравнительный анализ двух полученных Вами таблиц, указав особенности рекламного жанра.
Задание № 5. Статистический анализ газетного текста Работа заключается в проведении статистического анализа газетного текста по грамматическим категориям и должна быть сдана преподавателю для проверки на 6-м лабораторном занятии. Для выполнения работы необходимо взять 2 газетные статьи объемом 350-500 словоупотреблений каждая: одна из статей должна относиться к рекламному жанру (т.е. быть либо явным рекламным текстом, либо рекламным сообщением, облеченным в форму традиционных газетных жанров – заметок, корреспонденций, интервью, очерков), другая – носить общественно-политический характер.
1 этап. Используя раздел «Аналитическая грамматика словаря» из «Частотного словаря русского языка» под ред. Л.Н. Засориной (в дальнейшем ЧС), справочную литературу по грамматике (в т.ч. словари), определите для каждой единицы анализа её грамматическую категорию и заполните таблицу для каждой газетной статьи отдельно.
Кроме того, необходимо составить для каждой грамматической категории список употребления лексем по убыванию (для обоих текстов), т.е. ЧАСТОТНЫЙ словарь по грамматическим категориям.
Грамматические категории Абсолютная частота (F) Относительная частота (f) 1. Существительное 2. Глагол 3. Прилагательное 4. Наречие 5. Числительное 6. Местоимение 7. Союз 8. Предлог 9. Частица в том числе: частицы не, ни 10. Причастие 11. Остальные 12. ИТОГО (общая сумма) 2 этап. Проведите анализ распределения частот грамматических категорий слов, сравнив полученные данные с данными таблицы № 4, приведенной в приложении частотного словаря (ЧС), а также с полученными данными по НКРЯ в задании № 4:
- проанализируйте расхождения и совпадения относительных частот грамматических категорий слов, полученных Вами, со средними значениями в ЧС для всех функциональных стилей (жанров) и с полученными значениями в НКРЯ; укажите возможные на Ваш взгляд причины этих расхождений и совпадений;
- определите функциональный стиль, к которому «тяготеет» этот отрывок и можно ли однозначно ответить на этот вопрос;
- какие типы текстов могут давать похожие таблицы;
- можно ли «догадаться», и каким образом, о содержании текста только по таблице частот.
3 этап. Проанализируйте наиболее употребительные лексемы в каждой статье и выявите особенности текста. Проведите сравнительный анализ распределения частот грамматических категорий слов в двух полученных Вами таблицах, выявив особенности рекламного жанра. Является ли выбранный Вами рекламный текст «типичной» статьей современной рекламы, а общественно-политический - текстом современной публицистики (см. таблицу по НКРЯ)?
Целью данной лабораторной работы является освоение методики контент-анализа;
выявление его сильных и слабых сторон, а также интерпретация полученных результатов с позиций традиционного филологического подхода.
Для выполнения работы необходимо выбрать 2 отрывка текста из пьесы В. Шекспира «Ромео и Джульетта» /перевод Б. Пастернака/ (http://ru.wikipedia.org/wiki/Ромео_и_ Джульетта): текст сцены 2 из II акта («сцена у балкона») и текст сцены 5 из III акта, ограничившись репликами Ромео и Джульетты до появления леди Капулетти («сцена прощания»).
Затем выполните следующие действия:
1. Заполнение столбцов «кол-во»: в строках 1-7 укажите количество употреблений (абсолютную частоту) указанных словоформ – значений концептуальной переменной (КП);
2. Заполнение столбцов «частотн.»: в строках 1-7 укажите относительную частоту употреблений словоформ–значений КП.
Значения относительных частот округлите до двух значащих цифр после запятой, например: 0,025; 0,00042; 0,12 и т.п. (значащие цифры выделены полужирным курсивом).
8. Итого (всего словоупотреблений) Ты, Вы + Твой, ваш k13 + k14 k13 + k14 + k I. Прагмалингвистический - проинтерпретировать полученные количественные данные, используя следующие показатели (см.: Баранов А.Н. Введение в прикладную лингвистику, стр. 271-281):
1. Семантико-прагматический репрезентант категории «СВОЙ–ЧУЖОЙ»:
ЭКСКЛЮЗИВНОСТЬ. Одним из компонентов категории СВОЙ–ЧУЖОЙ является понятие «эксклюзивности» – ориентации говорящего на себя, на свои мысли, желания, на свое прошлое и будущее. На языковом уровне «эксклюзивность» представлена, прежде всего, формами личного местоимения «я» и притяжательного местоимения «мой».
2. Семантико-прагматический репрезентант категории «СВОЙ–ЧУЖОЙ»:
ИНКЛЮЗИВНОСТЬ. «Эксклюзивность» тесно связана с «инклюзивностью» – включенностью в свою личную сферу. Сюда входит то, что говорящий считает важным, существенным для себя, с чем он в какой-то мере себя отождествляет.
Языковыми репрезентантами этого компонента оказываются в первую очередь формы местоимений «мы» и «наш». «Эксклюзивное» вместе с «инклюзивным» фактически формируют ядро ЛИЧНОЙ СФЕРЫ говорящего – это «мое Я» и то, что я связываю или отождествляю с собой.
3. Семантико-прагматический репрезентант категории «СВОЙ–ЧУЖОЙ»:
ЧУЖОЕ. СВОЕ, ЛИЧНАЯ СФЕРА противопоставлены ЧУЖОМУ. Наиболее очевидные представители этого компонента – формы личных местоимений «он, она, оно, они», а также притяжательных местоимений «его, ее, их».
4. Семантико-прагматический репрезентант категории «СВОЙ–ЧУЖОЙ»: «Я» и «ТЫ» (ГОВОРЯЩИЙ и СОБЕСЕДНИК). Еще одно измерение категорий СВОЙ– ЧУЖОЙ и ЛИЧНАЯ СФЕРА – отношение между говорящим и слушающим – «Я и ТЫ». Очевидными репрезентантами этого отношения в тексте оказываются личное местоимение «вы (ты)» и его притяжательный аналог «ваш (твой)».
«КОММУНИКАТИВНЫЙ ЭГОЦЕНТРИЗМ». Для вычисления этого показателя необходимо найти отношение суммы относительных частот форм личного местоимения «я» и притяжательного местоимения «мой» к сумме относительных частот форм личного местоимения «вы (ты)» и его притяжательного аналога «ваш (твой)». Данный интегральный показатель отражает кроме личностных качеств героев также их культурный уровень, возраст, социальное положение, гендерный аспект, контекст коммуникации и др. факторы, которые необходимо учитывать во время исследования.
II. Филологический - написать сочинение, в котором на основе результатов прагмалингвистического анализа и анализа исследований о творчестве Б.Л. Пастернака (см. литература и др. источники) изложить собственную точку зрения на особенности личностных качеств героев и их отношения. Также необходимо охарактеризовать особенности идиостиля переводчика, выявленные с помощью прагмалингвистического анализа.
Литература:
1. Пастернак Б.Л. Заметки о переводе: "Ромео и Джульетта" (из статьи "О Шекспире") // http://www.romeo-juliet-club.ru/shakespeare/romeojuliet_pasternak3.html.
2. Пастернак Е.Б. Борис Пастернак. Биография. – М., "Цитадель" 1997.
(http://www.russofile.ru/articles/article_78.php).
3. Быков Д.Л. Борис Пастернак.
//http://www.imwerden.info/belousenko/books/bykov/bykov_pasternak.htm Требования к оформлению работы (контент-анализ) Работа оформляется по следующим правилам: текст в формате документа MS Word: шрифт - Times New Roman, размер шрифта – 14-ый, межстрочный интервал – полуторный, все поля по 2–2,5 см., страницы нумеруются, расстановка переносов – включена, выравнивание абзацев – по ширине. Объём работы – неограничен.
Титульный лист – установленного образца. Таблица распечатывается на отдельном листе. На отдельных листах – прагмалингвистический анализ и филологический анализ.
Титульный лист – установленного образца. Таблица распечатывается на отдельном листе. Работа должна быть сдана для проверки не позднее, чем на 8-ом лабораторном занятии.
Задание № 7. ОБРАЗЕЦ ТЕСТА ИТОГОВОГО КОНТРОЛЯ Тема: «Исследование употребления М. Булгаковым Определить относительную частоту f употребления двух букв «о, е» в следующей небольшой выборке из романа М.А. Булгакова «Мастер и Маргарита»:
Она несла в руках отвратительные, тревожные желтые цветы.
Черт их знает, как их зовут, но они первые почему-то появляются в Москве. И эти цветы очень отчетливо выделялись на черном ее весеннем пальто. Она несла желтые цветы! Нехороший цвет.....
II. Определение минимально достаточного объёма выборки По данным предварительного эксперимента определить минимально достаточный объём выборки N для получения достоверных сведений об употреблении М. Булгаковым в художественных произведениях букв русского алфавита «а, е» при заданных относительной ошибке = 0,15 (15%) и надёжности = 0,95 (95%).
сформулировать возможные цели данного исследования, определить возможные провести анализ генеральной лингвистической совокупности (ГЛС);
описать методику комплектования выборки (ВЛС) с помощью случайного, механического, серийного или типического отбора для полученного объема оценить репрезентативность выборки (ВЛС) с точки зрения целей исследования, используя понятия «относительная ошибка», «надёжность» и «минимально достаточный объём выборки».
6. Методические рекомендации по подготовке к практическим занятиям Лекционные и лабораторные занятия направлены на выработку у студентов представления об основаниях, условиях и границах применения некоторых математических методов в гуманитарных исследованиях, основных областях приложения структурно-вероятностной модели языка, основных понятиях корпусной лингвистики. На лабораторных занятиях проверяются и совершенствуются теоретические знания, полученные студентами на лекциях и при изучении специальной литературы. Особое внимание уделяется статистическому подходу к исследованию языковых структур. В ходе лабораторных занятий студенты должны освоить базовые принципы и основные математические понятия и методы, применяемые в исследовании языка и речи, методики статистического эксперимента и контент-анализа.
Важнейшим компонентом курса является самостоятельная работа студентов.
Поскольку курс призван сформировать у студента способность к рефлексивному анализу возможностей и значимости количественных методов для языкознания через собственный опыт, рекомендуется использовать различные формы самостоятельной работы – работа со справочной и учебной литературой, проведение анализа текстов на основе количественных методов, формулирование лингвистических задач и методики их решения с помощью статистического моделирования и т.п. Для демонстрации возможностей статистического подхода к исследованию конкретного языкового материала служит задание по нахождению частот грамматических категорий в небольшом газетном тексте и анализу их распределения. Проведение контент-анализа литературного текста призвано познакомить студентов с одним из самых эффективных способов анализа и интерпретации текстов, применяемых в современных прикладных исследованиях.