Государственное образовательное учреждение
высшего профессионального образования Московской области
«Международный университет природы, общества и человека «Дубна»
(университет «Дубна»)
ИСАУ
кафедра системного анализа и управления
УТВЕРЖДАЮ
проректор по учебной работе
С.В. Моржухина «_»_20 г.
Программа дисциплины Основы формальной лингвистики Направление подготовки 080500 Бизнес-информатика Профиль подготовки Электронный бизнес Квалификация (степень) выпускника Бакалавр Форма обучения Очная г. Дубна, 2011г.
Программа составлена в соответствии с требованиями ФГОС ВПО с учетом рекомендаций и ПрООП ВПО по направлению подготовки – 080500 «Бизнес-информатика» профиль «Электронный бизнес».
Программа рассмотрена на заседании кафедры системного анализа и управления (название кафедры) Протокол заседания № _ от «» 20 г.
Заведующий кафедрой /проф. Е.Н. Черемисина / (подпись) (ФИО)
СОГЛАСОВАНО
директор института САУ _ /проф. Е.Н. Черемисина/ (подпись) (ФИО) Дата «» _ 20 г.Рецензент: _ (ученая степень, ученое звание, место работы, должность) // (подпись) (ФИО) Дата «» _ 20 г.
Руководитель библиотечной системы _ / В.Г. Черепанова/ (подпись) (ФИО) Дата «» _ 20 г.
1. Цели освоения дисциплины Целью изучения учебной дисциплины является получение компетенций, достаточных для:
ознакомления студентов с важнейшими разделами и проблемами науки о языке;
изучения терминологического аппарата языкознания на современном этапе развития;
ознакомления с современными лингвистическими концепциями и методами работы с языком.
Задачи дисциплины:
Повторить и закрепить базовую терминологическую систему языкознания.
Изучить современные представления об устройстве и функционировании языка.
Ознакомиться с возможностями подхода к описанию языка с разных точек зрения и разными методами.
2.Место дисциплины в структуре ООП бакалавриата Дисциплина «Основы формальной лингвистики» относится к вариативной части дисциплин по выбору студентом Математического и естественнонаучного цикла (Б2.В.ДВ.1) и изучается в 5-ом семестре.
Перечень дисциплин с указанием разделов (тем), усвоение которых студентами необходимо для изучения дисциплины:
Программирование (1,2 семестры) Информационные системы и технологии (2 семестр) Базы данных (3, 4 семестр) Изучение дисциплины «Основы формальной лингвистики» дает основу для изучения как последующих курсов:
Нечеткая логика и нейронные сети (7 семестр).
Управление интернет-проектами (7 семестр) Системы поддержки принятия решений (8 семестр).
3. Компетенции обучающегося, формируемые в результате освоения дисциплины Процесс изучения дисциплины направлен на формирование следующих компетенций:
способен логически верно, аргументированно и ясно строить устную и письменную речь (ОК-6);
осознает сущность и значение информации в развитии современного общества;
владеет основными методами, способами и средствами получения, хранения, переработки информации (ОК-12);
имеет навыки работы с компьютером как средством управления информацией, способен работать с информацией в глобальных компьютерных сетях (ОК-13);
управлять контентом предприятия и Интернет-ресурсов, управлять процессами создания и использования информационных сервисов (контент-сервисов) (ПК-7);
разрабатывать контент и ИТ-сервисы предприятия и Интернет-ресурсов (ПК-18);
профессиональной деятельности для теоретического и экспериментального исследования (ПК-19);
использовать соответствующий математический аппарат и инструментальные средства для обработки, анализа и систематизации информации по теме исследования (ПК-20).
В результате изучения дисциплины студент должен приобрести:
знания:
Результат обучения компетенция Образовательная технология Форма целостном исторически сложившемся функциональном образовании связи языка и мышления, ПК- языка и общества основных направлениях формальной лингвистики умения:
Результат обучения компетенция Образовательная технология Форма Способен применять системы обработки естественного языка Способен обрабатывать лингвистические данные применение:
Результат обучения компетенция Образовательная технология Форма контроля Владеет соответствующими гипертекстовыми технологиями представления текста Владеет методами и средствами информационно-поисковых систем 4. Структура и содержание дисциплины Общая трудоемкость дисциплины составляет 2 зачетных единицы 80 часов, из них 36 часов аудиторной нагрузки и 44 часа самостоятельной работы.
Общая трудоемкость Аудиторные занятия:
Лекции Практические занятия (ПЗ) Самостоятельная работа:
Курсовая работа Расчетно-графические работы Реферат Вид промежуточного информационнопоисковых систем Раздел 1. Становление прикладной лингвистики как научной дисциплины лингвистической теории. Метод моделирования и его применение в лингвистике и ее приложениях. Существующие подходы к определению термина «прикладная лингвистика»; широкое и узкое понимание прикладной лингвистики. Прикладная лингвистика как оптимизация функций языка. Оптимизация когнитивной и эпистемической функций языка; оптимизация функции языка как средства передачи информации; оптимизация социальной функции языка.
Раздел 2. Формальная лингвистика и ее инструментарий Понятие структур знаний: фреймы и сценарии. Общее представление об основных направлениях компьютерной лингвистики: моделирование общения, машинный перевод, моделирование структуры текста, гипертекст, корпусная лингвистика, компьютерная лексикография и др.
Текст и гипертекст. Исторические корни гипертекстовых систем. Теоретические основания гипертекста. Компоненты гипертекста, элементы типологии гипертекста.
Корпусная лингвистика. Исходные понятия корпусной лингвистики: проблемная область, корпус данных и корпус текстов, единица хранения корпуса данных / текстов.
Типология корпусов текстов: исследовательские корпусы, иллюстративные корпусы, динамические vs. статические корпусы. Способ представления и хранения корпуса данных. Параметризация проблемной области. Требования к корпусу текстов с точки зрения пользователя (репрезентативность, полнота, экономичность, структуризация материала, компьютерная поддержка — компьютерные «оболочки» корпусов, программы составления конкордансов, словников). Опыты разработки корпусов текстов.
Фундаментальные корпусы для английского, немецкого и французского языков. Корпусы текстов разговорной речи, мультимедиальные корпусы. Корпусы текстов по русскому языку.
Машинный перевод. Элементы хронологии машинного перевода. Стратегии машинного перевода. Области использования машинного перевода. Важнейшие системы машинного перевода: система GAT, системы CETA и GETA, система TAUM, системы семейства ЭТАП, система ФРАП, переводческий комплекс АМПАР, система CUILT, системы семейства ALPS. Перспективы развития систем машинного перевода.
Оптимизация общения с ЭВМ: системы обработки естественного языка.
Базовая структура человеко-машинного взаимодействия. Основные компоненты компьютерных систем, обеспечивающих взаимодействие с ЭВМ на естественном языке.
Элементы типологии систем, обеспечивающих взаимодействие с ЭВМ на естественном языке.
Теория и практика информационно-поисковых систем. Основные понятия информационного поиска. Поисковый образ документа, поисковое предписание, релевантность и пертинентность документа. Полнота и точность поиска. Типы информационно-поисковых систем. Информационно-поисковые языки. Языкиклассификации и языки дескрипторного типа. Понятие информационно-поискового тезауруса.
Лексикография как дисциплина прикладной лингвистики. Базовые параметры типологизации словарей. Лингвистические/ филологические словари и энциклопедии.
Толковые словари, общие и частные толковые словари. Фразеологические словари, словари жаргонов и сленгов, диалектные словари, словари иностранных слов; общие и региональные словари, словари синонимов, антонимов и паронимов. Словари-тезаурусы.
Двуязычные/ переводные словари. Ассоциативные словари; частотные словари. Обратные словари; грамматические словари. Исторические и этимологические словари. Словари метафор; авторские словари. Типы словарей и сферы лексикографического описания языка. Основные структурные компоненты словарей. Основные структурные компоненты словарной статьи (зоны словарной статьи). Компьютерная лексикография.
Лексикографические базы данных. Устройство записи лексикографической базы данных.
Автоматические словари.
Терминоведение и терминография. Понятие термина и терминосистемы.
Важнейшие направления деятельности в терминоведении и терминографии.
Институциональный аспект терминоведения. Понятие «терминологического банка данных (ТБД)». Важнейшие существующие ТБД. Терминологический стандарт и словари стандартов. Лингвистическая терминология как особая терминосистема. Источники лингвистической терминологии. Проблемы перевода лингвистических терминов.
Имеющиеся словари лингвистических терминов.
Квантитативная лингвистика с точки зрения прикладной лингвистики приложения структурно-вероятностной модели языка. Возможности авторизации текста.
Понятие о лингвистической экспертизе: содержательный и институциональный аспект.
5. Образовательные технологии Методика преподавания дисциплины строится на сочетании семинарских, лабораторных занятий и самостоятельной подготовки в виде выполнения домашних заданий по рекомендованной учебно-методической литературе и материалам в Internet.
Лабораторные работы включают: написание под руководством преподавателя текста программы для имитационной модели соответствующего объекта, настройку инструментальной среды, составление плана модельного эксперимента, исследование характеристик модели, формирование стандартного отчёта, содержательный анализ полученных результатов.
Интерактивные образовательные технологии, используемые в аудиторных занятиях Семестр При изучении теоретического курса на лекциях предусматривается заложение материала в виде презентации. Отдельные лекции излагаются по проблемной технологии.
Некоторые разделы теоретического курса изучаются с использованием опережающей самостоятельной работы: студенты получают задания на ознакомление с новым материалом до его изложения на лекциях.
6. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины и учебно-методическое обеспечение самостоятельной работы студентов 6.1. Лабораторные работы:
ЛР1 Представление лингвистических знаний. DATR, язык для представления лексических знаний и его компьютерная реализация.
ЛР2 Морфологический анализ и синтез. Анализаторы, использующие двухуровневую модель морфологии.
ЛР3 Синтаксический анализ. Анализаторы, использующие грамматики непосредственных составляющих. Лексикосинтаксический интерфейс таких анализаторов:
признаковые ограничения, унификация. Анализаторы, использующие формализм зависимостей.
ЛР4 Прикладная лексикография. Требования к словарям, задействованным в системах обработки естественного языка. Общие принципы и практические способы построения таких словарей.
ЛР5 Машинный перевод. Существующие системы МП, основанные на идеологии прямого перевода. Системы перевода с трансфером. Оценка качества перевода.
Сравнительный анализ двух типов систем.
ЛР6 Базы данных. Структура базы данных, ее зависимость от лингвистических данных.
ЛР7 Гипертекстовые технологии. Создание и редактирование гипертекстовых документов.
ЛР8 Корпусная лингвистика. Системы, обеспечивающие доступ к корпусам текстов. Программы WordCruncher, DIALEX, UNILEX. Построение конкордансов.
ЛР9 Порождение текста. Генераторы текста. Грамматики 6.2. Вопросы, выносимы на зачет:
1. Объект и методы прикладной лингвистики 2. Понятие о приложениях лингвистической теории.
3. Метод моделирования и его применение в лингвистике и ее приложениях.
4. Прикладная лингвистика как оптимизация функций языка.
5. Формальная лингвистика и ее инструментарий 6. Понятие структур знаний: фреймы и сценарии.
7. Общее представление об основных направлениях компьютерной лингвистики 8. Гипертекстовые технологии представления текста 9. Компоненты гипертекста, элементы типологии гипертекста.
10. Корпусная лингвистика 11. Типология корпусов текстов 12. Машинный перевод 13. Стратегии машинного перевода.
14. Области использования машинного перевода.
15. Важнейшие системы машинного перевода.
16. Оптимизация общения с ЭВМ 17. Системы обработки естественного языка 18. Базовая структура человеко-машинного взаимодействия.
19. Основные понятия информационного поиска.
20. Поисковый образ документа, поисковое предписание, релевантность и пертинентность документа.
21. Типы информационно-поисковых систем.
22. Информационно-поисковые языки.
23. Языки-классификации и языки дескрипторного типа.
24. Понятие информационно-поискового тезауруса.
25. Базовые параметры типологизации словарей.
26. Типы словарей и сферы лексикографического описания языка.
27. Основные структурные компоненты словарей.
28. Основные структурные компоненты словарной статьи (зоны словарной статьи).
29. Компьютерная лексикография.
30. Лексикографические базы данных.
31. Устройство записи лексикографической базы данных.
32. Автоматические словари.
33. Терминоведение и терминография 34. Понятие термина и терминосистемы.
35. Терминологический стандарт и словари стандартов.
36. Лингвистическая терминология как особая терминосистема.
37. Источники лингвистической терминологии.
38. Проблемы перевода лингвистических терминов.
39. Имеющиеся словари лингвистических терминов.
40. Квантитативная лингвистика с точки зрения прикладной лингвистики 41. Понятие о структурно-вероятностной модели языка.
42. Основные области приложения структурно-вероятностной модели языка.
43. Возможности авторизации текста.
44. Понятие о лингвистической экспертизе 6.3. Рейтинговая система На семинарских занятиях проводится устный опрос с целью контроля уровня освоения дисциплины. По пройденным темам может проводиться тестирование.
В процессе самостоятельной работы студенты отрабатывают теоретические положения, изложенные на лекциях, анализируют решения задач, рассмотренных на семинарских занятиях, рассматривают дополнительные вопросы в рамках каждой темы.
Каждый студент получает тему реферата.
Для успешного освоения дисциплины необходимо посещать все занятия, выполнять все задания преподавателя, изучить все предлагаемые методические материалы по дисциплине. При изучении дисциплины осуществляется промежуточный контроль в форме компьютерного тестирования.
Формой итоговой аттестации является зачет. К зачету допускаются студенты, отчитавшиеся по всем видам работ (промежуточные тесты, реферат). Зачет может проводиться в традиционной форме или в виде тестирования.
самостоятельных и практических работ, защиту реферата, посещение всех занятий, что является допуском к сдаче зачета по теоретическим вопросам.
Итоги посещаемости и успеваемости фиксируются в промежуточных контрольных точках (8, 12, 16 недели обучения) при помощи трех значений:
«0» – студент имеет низкую посещаемость и успеваемость (много пропустил, не сдал и одного задания);
«1» – студент имеет среднюю посещаемость и не все задания сдал;
«2» – студент имеет посещаемость и сдачу заданий на 90-100%.
Результирующая оценка по дисциплине (сдача зачета) формируется следующим образом:
«не зачтено» – студент не сдал все задания и не ответил на вопросы;
7. Учебно-методическое и информационное обеспечение дисциплины 7.1. Рекомендуемая литература Основная:
1 Зубкова, Л. Г. Язык как форма : Теория и история языкознания : учебное пособие для вузов / Л. Г. Зубкова. – М. : Изд-во РУДН, 2002. – 472 с.
2 Михалев, А. Б. Общее языкознание. История языкознания : учебное пособие для вузов / А. Б. Михалев. – М. : Флинта, 2005. – 235 с.
Дополнительная:
1 Бодуэн де Куртенэ, И. А. Избранные труды по общему языкознанию. В 2 т. Т. 2.
Заметка об изменяемости основ склонения, в особенности же, об их сокращении в пользу окончаний / И. А. Бодуэн де Куртенэ. – М. : Изд-во Академии наук СССР, 1963. – 389 с.
2 Гируцкий, А. А. Общее языкознание : учебное пособие для вузов / А. А. Гируцкий. – М. : Высшая школа, 2003. – 374 с.
3 Гринберг, Дж. Квантитативный подход к морфологической типологии языков; пер. с англ. // Новое в лингвистике. – 1963. – № 3. – С. 60 - 94.
4 Индоевропейский язык и индоевропейцы: Реконструкция и историко-типологический анализ праязыка и протокультуры : в 2 т. / Т. В. Гамкрелидзе. – Благовещенск : БГК им.
И.А. Бодуэна де Куртенэ, 1998. – Т. 1-2.
5 Общее языкознание. Внутренняя структура языка / под ред. Б. А. Серебренникова. – М.
: Наука, 1972. – 564 с.
6 Thomason, S. Language Contact. An Introduction / S. Thomason. – Edinburgh : Edinburgh University Press, 2001.
8. Материально-техническое обеспечение дисциплины:
Специализированные компьютерные классы, подключенный к сети Интернет и к локальной сети университета (директория GROUPS для обучающихся).
Программа составлена в соответствии с требованиями ФГОС ВПО с учетом рекомендаций и ПООП ВПО по направлению и профилю подготовки 080500 Бизнесинформатика.
Рецензент: / _/ (ученая степень, ученое звание, Ф.И.О., место работы, должность)