Санкт-Петербургский государственный университет
Факультет прикладной математики - процессов управления
Кафедра высшей математики
Федорова
Елена
Константиновна
Моделирование и краткосрочное
прогнозирование курсов валют
Заведующий кафедрой,
д.ф.-м.н., профессор Камачкин А.М.
Научный руководитель, к.ф.-м.н., доцент Евстафьева В.В.
Рецензент, д.ф.-м.н., профессор Прасолов А.В.
Санкт-Петербург 2008 Оглавление Введение
Глава 1 Построение моделей для курса доллара
1.1 Подбор трендовой модели
1.2 Адаптивные модели
1.2.1 Модель АР(p)
1.2.2 Модель АРПСС(p, d, q)
1.3 Сравнение моделей и построение прогноза
Глава 2 Построение моделей для курса евро
2.1 Трендовая модель
2.2 Идентификация модели АРПСС(p,d,q)
2.3 Выбор лучшей прогнозирующей модели
Заключение
Приложения
Приложение 1 Исходные данные
Приложение 2 Код программы H&LSeries.exe
Приложение 3 Модели для курса доллара
Приложение 4 Модели для курса евро
Приложение 5 Список терминов
Список литературы
Предметный указатель
Введение Данная работа посвящена анализу и моделированию динамики курсов доллара и евро по отношению к рублю. Эта задача представляет огромный интерес и актуальна для российской экономики и России в целом. Тесные экономические и культурные связи, существующие между Россией, Америкой и Европой, дают основание предположить, что «укрепление» курса европейской валюты и резкое падение курса доллара могут иметь достаточно ощутимые последствия для нашей страны [1].
Начиная с 2002 года и по настоящее время евро играет все большую роль на валютном рынке: «инвесторы уходят от доллара», увеличивая оборот и спрос на евро [2], что оказывает давление на курс американской валюты, а также евро становится одной из ведущих валют, используемых в международной торговле [3].
Все популярнее евро и как резервная валюта стран. Например, Центробанк Объединенных Арабских Эмиратов переводит до 10% своих резервов из долларов в евро, а средства Стабилизационного фонда Российской Федерации размещаются согласно следующей валютной структуре: доллар и евро – по 45%, фунт – 10% [4].
В настоящее время большое число экономических исследований проводится с помощью методов корреляционного и регрессионного анализа [5-7], которые используются и для решения поставленной задачи. Существует много книг и учебных пособий по математической статистике и эконометрике, в которых как в теории, так и на примерах описаны основные эконометрические и статистические методы. Центральной проблемой эконометрики является построение моделей, описывающих реальные экономические процессы, и их дальнейшее использование для построения прогноза. Одной из основных проблем, возникающих в подобных исследованиях, является то, что модели оказываются неэффективными для долгосрочного прогноза.
Целью работы является проведение анализа рядов, составленных по ежедневным данным ЦБРФ о курсах доллара и евро по отношению к рублю за период с 01 февраля по 07 декабря 2006 года. Исходные данные представлены в приложении 1. По этим данным требуется построить модели, адекватно описывающие динамику рядов, рассчитать точечные и интервальные прогнозы на несколько рабочих дней, оценить точность построенных моделей, сравнивая прогнозные и фактические значения.
В первой и второй главах проведен анализ рядов, построены их математические модели. Для этого использованы модель АРПСС (авторегрессии проинтегрированного скользящего среднего) [5], авторегрессионная модель [6], а также подобран полиномиальный тренд. Здесь же проверена значимость коэффициентов регрессионных моделей с помощью критерия Стьюдента [8], полученные модели исследованы на адекватность и точность, а также проведена проверка предпосылок регрессионного анализа. Существует множество методов, критериев и тестов для проверки предпосылок, в данной работе используются ранговый коэффициент корреляции Спирмена для проверки наличия гетероскедастичности в остатках [6], тест Дарбина-Уотсона и h-критерий Дарбина на наличие автокорреляции [9], а также критерий «восходящих и нисходящих» серий для проверки случайности выборки остатков [8]. Для облегчения вычислений, последний критерий реализован в среде Borland C++Builder 6, код программы представлен в приложении 2.
Построение моделей проводится в программах STATISTICA 6.0 (модель АРПСС) и Microsoft Excel (авторегрессия, полиномиальная модель, а также тесты и проверка по критериям). Описательные статистики, полученные в ходе построения моделей, представлены в приложениях 3 и 4.
В конце приведен список литературы, использованной для изучения рассматриваемых методов, а также предметный указатель, который поможет ориентироваться в работе.
Результаты дипломной работы докладывались на XXXIX Международной научной конференции аспирантов и студентов «Процессы управления и устойчивость», СПбГУ, ПМ-ПУ, 2008 и опубликованы в [11].
Глава 1 Построение моделей для курса доллара В первую очередь приведем график исходных данных, он имеет вид:
01.02.06 01.03.06 01.04.06 01.05.06 01.06.06 01.07.06 01.08.06 01.09.06 01.10.06 01.11.06 01.12. Рассматриваемый ряд характеризуется убывающей тенденцией, содержащей большое количество скачков, что свойственно курсам валют.
Начнем с подбора тренда для данного ряда.
1.1 Подбор трендовой модели При добавлении линий тренда к графику исходных данных видно (см. рис. 2.), что линейный тренд и полиномиальный тренд четвертой степени наиболее точно соответствуют тенденции исследуемого ряда.
01.02.06 01.03.06 01.04.06 01.05.06 01.06.06 01.07.06 01.08.06 01.09.06 01.10.06 01.11.06 01.12. Используем критерий Стьюдента для проверки значимости коэффициентов моделей.
Критерий Стьюдента: Если для коэффициента ai выполняется неравенство t a > t табл, то гипотеза о незначимости коэффициента ai отвергаетi ся, т.е. коэффициент значим, i = 0, k, где k - количество регрессоров.
которое затем сравнивается с табличным значением при заданном уровне значимости, в ходе исследования будем рассматривать l = 0,05, и числе степеней свободы n - k - 1 ( n - длина выборки, k - порядок регрессии).
(см. приложение 3) и модели имеют вид:
линейная регрессия полиномиальный тренд 4-го порядка Коэффициенты детерминации для моделей (1) и (2) равны соответственно R 2 » 0,8045 и R 2 » 0,9618. Т.е. обе модели хорошо ( R 2 0,75 ) описывают ряд, но полиномиальная модель четвертого порядка имеет гораздо большую точность, что естественно. При рассмотрении полиномов более высокого порядка можно заметить, что с увеличением степени полинома, величина коэффициента детерминации практически не меняется: для полиномиальных моделей 5-й и 6-й степеней коэффициент детерминации равен 0,9618 и 0, соответственно. Таким образом, будем рассматривать модель (2).
После построения модели необходимо проверить 5 предпосылок регрессионного анализа [6]: случайный характер остатков модели, равенство нулю математического ожидания остатков, отсутствие автокорреляционной зависимости в остатках, гомоскедастичность дисперсии остатков, подчинение остатков нормальному закону распределения. При выполнении всех пяти предпосылок оценки коэффициентов регрессии будут обладать свойствами несмещенности, эффективности и состоятельности.
График остатков представлен на рис. 4.
1. Математическое ожидание остатков имеет значение M ( Et ) = -4,7 10 - близкое к нулю. Отличие от нуля обусловлено погрешностью вычислений.
2. Остатки принадлежат интервалу [-3S ; 3S ] = [-0,31; 0,31], где S - стандартная ошибка регрессии [7], следовательно, на данном этапе нельзя отклонить гипотезу о нормальном распределении остатков. Вычислим коэффициM (E 3 ) M (E 4 ) стикой Бера-Жарка, которая выражается следующей формулой:
Статистика W подчиняется распределению c 2 (2) при справедливости гипотезы о нормальности распределения.
Значение статистики принимает значение W = 1,52, что меньше квантили распределения c 2 (2) равной 5,99, следовательно, принимаем гипотезу о нормальном распределении остатков.
3. Для проверки остатков на случайность используем критерий «восходящих и нисходящих» серий.
Критерий «восходящих и нисходящих» серий состоит в проверке двух условий:
где n - длина ряда, n (n) - число серий, t max (n) - максимальная длина серии.
Для того чтобы облегчить вычисления по данному критерию, написана программа H&LSeries.exe в среде Borland C++Builder 6. Код программы приведен в приложении 2.
На рис. 3. приведен результат использования указанной программы для проверки по критерию ряда остатков E, где Et = Yt - Yt.
Таким образом, выборка остатков неслучайна.
4. Для проверки наличия гетероскедастичности используем ранговый коэффициент корреляции Спирмена.
Ранговый коэффициент корреляции Спирмена рассчитывается по формуле:
где d – абсолютная разность между рангами значений Yt и Et, n – длина выборки.
Для рассматриваемого ряда остатков r = -0,0306. Оценим статистическую значимость r с помощью t-критерия: t r = r n - 1 » -0,451. Сравним эту величину с табличной t l при уровне значимости l = 0,05. Получаем t r < t l » 1,97, следовательно, принимается гипотеза об отсутствии гетероскедастичности остатков.
5. Для проверки наличия автокорреляции в остатках воспользуемся критерием Дарбина-Уотсона.
Критерий Дарбина-Уотсона:
Рассчитывается значение критерия по формуле:
Рассчитанное значение DW сравнивается с нижним d н и верхним d в критическими значениями критерия, определяемыми по статистическим таблицам.
Делается вывод об автокорреляции:
- если 0 DW < d - положительная автокорреляция и гипотеза об отсутствии автокорреляции отвергается;
- если d DW < d или 4 - d DW < 4 - d, то нельзя сделать определенный вывод об автокорреляции;
- если d DW < 4 - d, то гипотеза об отсутствии автокорреляции принимается;
- если 4 - d DW 4 - отрицательная автокорреляция, гипотеза об отсутствии автокорреляции отвергается;
- если DW = 2, то автокорреляция отсутствует.
Используя формулу (5) получаем DW » 0,309. Сравнивая рассчитанную величину DW с нижним значением критерия d н » 1,7, делаем вывод – в остатках присутствует положительная автокорреляция.
Для того чтобы избавиться от автокорреляционной зависимости, попробуем улучшить модель (2), построив для ряда E модель авторегрессии АР(р), где p – параметр, определяющий порядок авторегрессии.
Порядок модели АР(p) определяется исходя из внешнего вида графиков автокорреляционной (АКФ) и частной автокорреляционной (ЧАКФ) функций ряда E.
Вычислим коэффициенты автокорреляции уровней ряда по формуле:
А также вычислим коэффициенты частной автокорреляции, по формулам:
АКФ и ЧАКФ ряда E представлены на рис. 5. АКФ экспоненциально убывает и имеет достаточно много положительных значений, но, начиная со второго, коэффициенты автокорреляции незначимы, их величина вероятнее всего обусловлена «распространением» автокорреляции при лаге 1, что подтверждается графиком ЧАКФ, из которого видно, что значимым является лишь значение ЧАКФ при лаге 1. Следовательно, для ряда E будем строить модель АР(1) в виде:
Построение модели проводилось в программе STATISTICA 6.0. Оценка параметров проведена с помощью приближенного метода максимального правдоподобия. Получена следующая модель:
Проверка коэффициентов модели по критерию Стьюдента показала, что свободный коэффициент модели незначим, но, из экономических соображений, не принято удалять из моделей свободный член. Поэтому будем анализировать модель вида (9).
Теперь объединим модели (2) и (9) и построим график получившейся модели (см. рис. 6):
Анализ остатков модели (10) показал, что ряд остатков удовлетворяет всем пяти предпосылкам регрессионного анализа.
Проверим уравнение (10) на значимость по F-критерию Фишера [6].
F-критерий Фишера:
С F - критерием связана величина, называемая числом степеней свободы, которая показывает, сколько независимых отклонений от n возможных требуется для образования данной суммы квадратов.
Формула для вычисления F - распределения со степенями свободы где k – порядок регрессии, n – длина ряда, Q R = (Y - Yi ) 2, Qe = (Yi - Yi ) 2.
Для модели (10) значение критерия Фишера (11) равно F » 3816, что во много раз больше табличного значения Fтабл » 2,256, следовательно, построенное уравнение (10) значимо.
Коэффициент детерминации получившейся модели равен R 2 » 0,99, что говорит о высокой точности приближения построенной модели к исходному ряду данных, всего 1% приходится на ошибку.
1.2 Адаптивные модели Перед построением адаптивных моделей необходимо еще раз обратиться к исходным данным. В нашем ряде отсутствуют значения за выходные дни, то есть построение адаптивных моделей для ряда такого вида невозможно, так как адаптивные модели предполагают наличие зависимости текущего значения от одного и нескольких предыдущих. В качестве недостающих значений будем использовать значения, лежащие на прямой, соединяющей значения курса доллара за последний день текущей недели и первый день следующей недели. Такое решение возникшей проблемы не окажет существенного влияния на уравнение регрессии.
Добавленные значения выделены цветом в приложении 1.
1.2.1 Модель АР(p) Приступая к построению модели АР(p) для исходного ряда, определим ее порядок, используя коэффициенты корреляции (6) и частной автокорреляции (7) уровней ряда. Для наглядности, приведем графические представления АКФ и ЧАКФ на рис. 7.
АКФ медленно монотонно убывает и наибольшее значение принимает на первом лаге. ЧАКФ подтверждает, что значения АКФ, начиная со 2-го лага, обусловлены корреляцией на 1-м лаге. Следовательно, будем строить модель АР(1) в виде:
Несмотря на то, что по критерию Стьюдента свободный член является незначимым ( | t b |=| 0,9269 |< t табл = 1,97, см. приложение 3), мы не удаляем его из уравнения регрессии, и оно имеет вид:
Коэффициенты модели найдены по методу максимального правдоподобия.
График полученной модели представлен на рис. 8.
Коэффициент детерминации для модели (12) имеет очень высокое значение, R 2 » 0,98, следовательно, модель на 98% точно описывает ряд и всего 2% приходится на ошибку. Значение F-распределения для данной модели равно F » 17361, что больше табличного значения Fтабл » 3,88, следовательно, уравнение (12) значимо в целом.
Вычислим значение средней относительной ошибки аппроксимации построенной модели по формуле [6]:
Получаем, что для модели (12) A = 0,16627%, что говорит о хорошей точности уравнения регрессии, так как значение A в пределах 5-7% говорит о хорошем подборе модели к исходным данным.
Проверим, выполняются ли предпосылки регрессионного анализа для остатков модели (12).
остатки 2. Остатки принадлежат промежутку [-3S ;3S ] = [-0,172;0,172], следовательно, нет оснований отвергнуть гипотезу о нормальном распределении остатков. Проверка нормальности остатков с помощью статистики Бера-Жарка показала, что значение W выходит за границы критической области, следовательно, гипотеза о нормальности распределения отвергается.
3. Гипотеза случайности остатков принимается, так как неравенства (3) выполняются и имеют вид 149 > 132,91, 4 < 7.
4. Ранговый коэффициент корреляции Спирмена, рассчитанный по t r < t l » 1,97, следовательно, принимается гипотеза об отсутствии гетероскедастичности остатков.
5. Для проверки наличия автокорреляции в остатках воспользуемся hкритерием Дарбина. Рассматриваемый ранее критерий Дабрина-Уотсона не может использоваться в данном случае, так как его применение предполагает отсутствие лаговых переменных в правой части модели.
В случае, если - 1,96 < h < 1,96, то гипотеза об отсутствии автокорреляции остатков принимается.
В нашем случае, h » -0,956, - 1,96 < h < 1,96, следовательно, в остатках нет автокорреляционной зависимости.
Итак, проверка показала, что одна из предпосылок регрессионного анализа, а именно, предпосылка о нормальности распределения остатков, нарушается. Вообще говоря, для авторегрессионных моделей выполнение этой предпосылки не является обязательным. Необходимым является то, чтобы получившийся ряд остатков являлся «белым шумом». Для того чтобы это проверить, можно протестировать выборочную автокорреляцию с помощью Q-статистики Бокса-Пирса [6]: Qk = n ri 2. Если рассматриваемый ряд явi = ляется «белым шумом», то Q-статистика имеет c 2 -распределение с k степенями свободы.
В нашем случае, Q-статистика принимает значения от 0 до 26 для лагов с 1 по 20. Эти значения не превосходят критических значений статистики c на 5%-ом уровне значимости. Следовательно, процесс является «белым шумом».
1.2.2 Модель АРПСС(p, d, q) Третья модель, которая рассматривается в данной главе – Авторегрессия Проинтегрированного Скользящего Среднего (АРПСС). Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость.
Общая модель АРПСС включает как параметры авторегрессии, так и параметры скользящего среднего. Имеется три типа параметров модели: параметр авторегрессии ( p ), порядок разности ( d ), параметр скользящего среднего ( q ). В обозначениях модель записывается как АРПСС ( p, d, q ). В общем виде эта модель записывается следующим образом:
B mYt = Yt -m, at – случайный импульс или «белый шум» [5].
Основными инструментами идентификации порядка модели являются графики АКФ и ЧАКФ [10].
Проанализируем АКФ и ЧАКФ рассматриваемого ряда. Их графические представления уже были приведены на рис. 7.
При построении модели АРПСС ( p, d, q ) в первую очередь необходимо проверить рассматриваемый ряд на стационарность. Признаками нестационарности являются: наличие тренда, гетероскедастичность, изменяющаяся автокорреляция. График АКФ, представленный на рис. 7, позволяет предположить, что это авторегрессионный процесс с коэффициентом b1 близким к 1, т.е. нестационарный процесс, поскольку АКФ убывает очень медленно [6].
Одним из способов приведения ряда к стационарному виду является дифференцирование ряда [10]. Рассмотрим ряд, полученный из исходного ряда взятием разности 1-го порядка.
0, 0, 0, 0, -0, -0, -0, -0, Глядя на рис. 10 можно заметить, что полученный с помощью дифференцирования ряд уже больше похож на стационарный – в нем отсутствует тренд.
Проверку ряда на стационарность можно провести с помощью интеграционной статистики Дарбина-Уотсона (IDW) [6]. Значение статистики Рассчитанные значения IDW-статистики сравниваются с критическими. Для нашего ряда значение интеграционной статистики равно IDW » 1,91. Сравнивая полученное значение с верхним критическим значением статистики IDWU » 1,6, принимаем гипотезу о стационарности ряда.
Таким образом, исходный ряд приведен к стационарному виду взятием разности первого порядка, следовательно, d = 1.
Внешний вид АКФ и ЧАКФ (рис. 11.) дают основание предположить, что полученный дифференцированием ряд является «белым шумом». проверим это. Q-статистика принимает значения от 1 до 168 для лагов с 1 по 215.
Эти значения не превосходят критических значений статистики c 2 на 5%-ом уровне значимости. Следовательно, процесс является «белым шумом».
Рис. 11. АКФ и ЧАКФ продифференцированного ряда курса доллара Таким образом, исходя из анализа АКФ и ЧАКФ, приходим к выводу, что рассматриваемый ряд можно описать моделью АРПСС(0, 1, 0).
По внешнему графику АКФ и ЧАКФ не всегда удается определить оптимальные параметры модели. Поэтому рассмотрим также модели АРПСС(1, 1, 0), АРПСС(0, 1, 1), АРПСС(2, 1, 2) и сравним построенные модели по информационным критериям Акаики (AIC) и Шварца (SC), которые позволяют определить оптимальную модель и минимизировать количество параметров.
Информационные критерии Акаики и Шварца:
Значения критериев вычисляются по формулам:
Из двух моделей в определенном смысле лучше та, для которой значения критериев ниже.
Построение моделей производим в программе STATISTICA 6.0, коэффициенты моделей оцениваем по приближенному методу максимального правдоподобия. В таблице 1 представлены окончательные уравнения полученных моделей, с уже исключенными незначимыми коэффициентами, и значения критериев Акаики и Шварца.
Табл. 1. Сравнение моделей АРПСС по критериям Акаики и Шварца Анализируя табл. 1., можно сделать вывод, что оптимальной по параметрам моделью является модель АРПСС(1, 1, 0). График модели АРПСС(1, 1, 0) приведен на рис. 12.
Коэффициент детерминации для модели (16) имеет очень высокое значение, R 2 » 0,988, следовательно, модель на 98% точно описывает ряд и всего 2% приходится на ошибку. Значение F-распределения для данной модели равно F » 8575, что больше табличного значения Fтабл » 3,038, следовательно, построенная модель адекватна. Значение средней относительной ошибки аппроксимации A » 0,166% находится в допустимых пределах, что говорит о высокой точности построенной модели.
1.3 Сравнение моделей и построение прогноза В предыдущих пунктах были построены четыре модели: смешанная модель (тренд + АР(1)), модель АР(1), АРПСС(1,1,0) и АРПСС(0,1,1). Теперь необходимо сравнить эти модели между собой и построить прогноз. Для сравнения моделей будем использовать метод абсолютных отклонений (MAD), сравним значения средних ошибок аппроксимации ( A ), суммы квадратов остатков моделей ( Qe ), а также величины остаточных дисперсий ( S 2 ).
Результаты сравнения приведены в табл. 2.
Табл. 2. Сравнение моделей Из таблицы видно, что наибольшее преимущество перед остальными имеет смешанная модель, но также можно заметить, что сравниваемые величины для всех моделей имеют достаточно низкое значение, что свидетельствует о хорошем качестве построенных моделей. Сравнивая между собой модели АРПСС(1,1,0) и АРПСС(0,1,1), заметим, что значение MAD для АРПСС(1,1,0) меньше, чем для АРПСС(0,1,1). Таким образом, исключим из рассмотрения последнюю модель.
Построим прогноз на 5 дней по трем оставшимся моделям и сравним полученные результаты.
Фактические значения Прогноз по модели (10) Рис. 13. Прогноз по смешанной модели Фактические значения Прогноз по модели (12) Рис. 14. Прогноз по модели АР(1) Расчет прогноза проведен по формулам:
для моделей (10), (12) и (16) соответственно.
Сравнивая полученные прогнозные значения с фактическими данными, можно заметить, что прогноз продолжает общую убывающую тенденцию ряда, но достаточно сильно отличается от фактических данных, что неудивительно: построенные модели не являются эффективными для долгосрочного прогноза курсов валют [6]. Скачок фактических значений на 2-м и 3-м дне прогноза является следствием влияния экономических факторов, далее тенденция вновь убывает.
Теперь рассмотрим интервальные прогнозы. Фактические данные принадлежат доверительным интервалам моделей (10) и (12) (см. табл. 3 и 4).
Для модели АРПСС(1,1,0) в виде (16) доверительный интервал оказался достаточно узким и фактические значения в него не попали, но, включив в модель незначимые коэффициенты, получаем более широкий доверительный интервал, который содержит фактические данные (см. табл. 5). Глядя на рис. 13-15 можно также заметить, что первое прогнозное значение во всех трех случаях оказывается достаточно точным. Чтобы сделать вывод о том, какую из моделей лучше использовать для прогнозирования, вычислим средние относительные ошибки прогнозов по формуле (13):
Таким образом, лучший прогноз получен по модели (12). Несмотря на то, что при сравнении моделей наиболее точно описывающей исходный ряд оказалась модель (10), прогноз с ее использованием дал худший результат.
Учитывая то, что на данный момент СМИ дают информацию о значениях курсов валют каждый день, можно с достаточно высокой точностью делать краткосрочный прогноз на 1 день вперед по модели (12), и корректировать дальнейшие прогнозные значения с получением новых значений курса доллара.
Глава 2 Построение моделей для курса евро Рассмотрим график исходных значений курса евро, представленный на рис. 16. По сравнению с ранее рассматриваемым рядом значений курса доллара, можно заметить, что данный ряд имеет более сложную структуру, на графике присутствуют более резкие скачки, особенно в первой половине рассматриваемого периода, это может оказать негативное влияние на точность моделей и прогноза. Для того чтобы уменьшить влияние аномальных скачков, заменим резко выделяющиеся скачки на средние арифметические соседних значений.
Руб/EUR Таким образом, при построении моделей будем использовать исправленный ряд, представленный на рис. 17.
Руб/EUR 2.1 Трендовая модель Как и в предыдущей главе, в первую очередь попробуем подобрать для исходных данных полиномиальный тренд. Исходя из внешнего вида графика (рис. 17), опираясь на предыдущий опыт, можно предположить, что остатки полиномиальной модели не будут удовлетворять всем предпосылкам регрессионного анализа.
Добавление к графику рассматриваемых данных линий тренда показало, что, начиная с полинома 4-й степени, коэффициент детерминации R 2 растет незначительно, а именно, принимает значения 0.626, 0.6326 и 0.6429 соответственно для полиномиальных моделей 4-й, 5-й и 6-й степеней. Построим данные модели в приложении Microsoft Excel (см. приложение 4) и выберем оптимальную степень полиномиальной модели, используя информационный критерий Шварца. Построенные модели с исключенными незначимыми коэффициентами имеют вид:
Учитывая то, что модель (20) оказалась константой, мы исключаем ее из рассмотрения, и по информационному критерию Шварца будем сравнивать только модели (19) и (21). Значения критерия для этих моделей равны:
SC (19) = -0, 283, SC ( 21) = -0,282. Для полиномиальной модели 4-й степени значение критерия Шварца оказалось меньше, следовательно, ее и будем рассматривать более подробно.
Проведем анализ остатков модели (19).
График ряда остатков (E) представлен на рис. 18.
1. Математическое ожидание остатков близко к нулю M = 1,65 10 -14.
2. Остатки принадлежат промежутку [-3S ; 3S ] = [-0,607; 0,607], следовательно, остатки подчиняются нормальному закону распределения.
3. Проверка остатков с помощью критерия «восходящих и нисходящих» серий показала, что выборка остатков не является случайной.
4. Ранговый коэффициент корреляции Спирмена равен r = -0,33, соответствующее ему значение t-статистики равно t r = -4,95, что меньше табличного значения, следовательно, принимается гипотеза об отсутствии гетероскедастичности остатков.
5. Значение критерия Дарбина-Уотсона равно DW = 0,18, следовательно, в остатках присутствует положительная автокорреляция.
Таким образом, как и предполагалось, необходимо улучшить модель, чтобы избавиться от автокорреляции в остатках.
Рассмотрим АКФ и ЧАКФ остатков модели (19). Их графики изображены на рис. 19.
Исходя из внешнего вида АКФ и ЧАКФ, делаем вывод, что ряд E нестационарный и его необходимо продифференцировать. АКФ и ЧАКФ продифференцированного ряда E изображены на рис. 20. Продифференцированный ряд не имеет значимых коэффициентов корреляции и частной корреляции, но можно заметить, что наибольшие по абсолютной величине значения АКФ и ЧАКФ принимают на первом лаге. Следовательно, для ряда E можно попробовать построить модель АРПСС(1,1,0). Рассмотрим также модель АРПСС(2,1,0).
Построение моделей проводим в программе STATISTICA 6.0. В результате, после исключения незначимых коэффициентов, получены уравнения:
Остатки моделей удовлетворяют всем предпосылкам регрессионного анализа.
Сравнивая величины остаточных дисперсий S 2 моделей ( S (222 ) = 0,00745, S (223) = 0,00747 ), а также сравнивая модели по информационному критерию Шварца ( SC ( 22 ) = -2,04, SC ( 23) = -2,02 ), для дальнейшего исследования выбираем модель (22).
Объединяя модели (19) и (22), получаем модель:
или более кратко Yt = Yt + Et, где Yt и Et определяются по формулам (19) и (22) соответственно.
График полученной модели изображен на рис. 21.
Оценим коэффициент детерминации и значение F-критерия Фишера для получившейся модели. R 2 » 0,99, F » 30289, что больше табличного значения Fтабл = 2,256, следовательно, построенная модель адекватна и на 99% точно описывает исходные данные.
2.2 Идентификация модели АРПСС(p,d,q) Как и в предыдущей главе, перед тем, как строить адаптивные модели, добавим недостающие значения, соответствующие выходным дням. В приложении 1 добавленные значения выделены цветом.
Для того чтобы определить параметры модели АРПСС(p,d,q), рассмотрим АКФ и ЧАКФ скорректированного ряда значений курса евро.
По графикам АКФ и ЧАКФ можно предположить, что рассматриваемый ряд не является стационарным, для того чтобы проверить данное предположение воспользуемся интеграционной статистикой Дарбина-Уотсона. Ее значение для ряда значений курса евро близко к нулю IDW » 0,07, следовательно, ряд нестационарен.
Продифференцируем ряд, чтобы привести его к стационарному виду.
АКФ и ЧАКФ продифференцированного ряда представлены на рис. 23.
Рис. 23. АКФ и ЧАКФ продифференцированного ряда значений курса евро Значение IDW-статистики для продифференцированного ряда равно IDW » 1,65, что выше верхнего критического значения IDWU = 1,6, следовательно, полученный ряд стационарен.
Определяя далее параметры модели АРПСС(p,1,q), заметим, что, исходя из внешнего вида АКФ и ЧАКФ продифференцированного ряда, сложно сделать определенный вывод о порядках авторегрессии и скользящего среднего. Попробуем рассмотреть следующие модели: АРПСС(0,1,0), АРПСС(1,1,0), АРПСС(1,1,1), АРПСС(2,1,1), а также некоторые модели более высоких параметров.
При построении моделей АРПСС(1,1,1), АРПСС(2,1,1) и моделей более высокого порядка все коэффициенты моделей, включая свободный член, оказались незначимыми, т.е. модели принимали вид АРПСС(0,1,0). Таким образом, для сравнения остаются модели АРПСС(0,1,0) и АРПСС(1,1,0). Их уравнения и значения критериев Шварца и Акаики представлены в табл.6.
Табл. 6. Сравнение моделей АРПСС(0,1,0) и АРПСС(1,1,0) для курса евро Сравнение моделей по критериям Шварца и Акаики показали, что лучшей является модель АРПСС(1,1,0).
Оценим качество выбранной модели. Значение коэффициента детерминации равно R 2 » 0,93, значение F-распределения для модели равно F » 1501,1, что больше табличного значения Fтабл = 3,037, следовательно, построенная модель адекватна.
Остатки удовлетворяют всем предпосылкам регрессионного анализа, следовательно, построенную модель можно использовать для построения прогноза.
2.3 Выбор лучшей прогнозирующей модели Итак, в результате анализа ряда значений курса евро, было построено две модели: смешанная модель (тренд + АРПСС(1,1,0)), а также адаптивная модель АРПСС(1,1,0). Для того чтобы определить, какая из этих моделей является более точной, проведем сравнение, используя величины R 2, MAD, S2, A.
Табл. 7. Сравнение моделей для курса евро Смешанная модель (тренд + АРПСС(1,1,0)) 0,99 0,00935 0,00015 0,0275% Из табл. 7. видно, что смешанная модель более точно аппроксимирует исходные данные, но, возможно, прогноз по этой модели окажется хуже, чем по модели АРПСС(1,1,0).
Построим точечные и интервальные прогнозы на 5 дней по обеим моделям и сравним полученные результаты.
Фактические значения Прогноз по модели (24) Ф актические значения Прогноз по модели (26) Расчет прогноза проведен на h шагов по следующим формулам:
для моделей (24) и (26) соответственно.
Анализируя полученные прогнозные значения, нельзя сделать однозначный вывод. С одной стороны, прогноз по смешанной модели (24) продолжает тенденцию ряда, с другой стороны, прогноз по модели (26) имеет меньшее значение средней относительной ошибки аппроксимации, для нее оно равно A » 0,205%, а для модели (24) – A » 0,614%.
Величина средней ошибки аппроксимации для модели (24) обусловлена внезапным снижением фактических значений курса евро на 2-м и 3-м шаге прогноза. Можно заметить, что, начиная с 3-го, прогнозные значения полностью соответствуют тенденции фактических значений и располагаются параллельно им. Таким образом, по моему мнению, из рассматриваемых моделей лучшей можно считать модель (24).
На первом шаге прогноза, как и в предыдущей главе, получено значение, достаточно близкое к фактическому.
Исходя из полученных результатов, можно сделать вывод, что корректировка прогнозных значений на 1 день с помощью вновь поступающих (текущих) данных о значениях курсов валют может дать хороший результат по модели (24).
Заключение Итак, в данной работе проведен анализ рядов, составленных по ежедневным данным о курсах доллара и евро по отношению к рублю за период с 01.02.2006 по 07.12.2006, по которым были построены модели. В процессе решения поставленной задачи были рассмотрены как трендовые модели, так и авторегрессионные модели, в том числе модели АРПСС(p,d,q). Анализ остатков и качества моделей показал, что нельзя однозначно сделать вывод о том, какую модель предпочтительнее использовать для прогнозирования курсов валют. Прогнозные значения на 5 дней, рассчитанные с помощью рассматриваемых моделей, дали неоднозначный результат. Модели оказались неэффективными для долгосрочного прогноза. В одном случае лучшая точность прогноза достигается с использованием авторегрессионной модели, в другом – лучшей оказывается модель, сочетающая в себе как трендовую компоненту, так и авторегрессионную модель, построенную для остатков.
Исходя из полученных результатов, можно сделать вывод, что динамика курсов валют на финансовом рынке практически непредсказуема, но построенные модели можно использовать для краткосрочного прогноза на 1 день.
Неточность полученных результатов можно объяснить тем, что, вопервых, выбранные модели являются адаптивными и опираются на последние значения рядов, во-вторых, тенденции рассматриваемых рядов часто нарушаются резкими скачками, обусловленными различными экономическими факторами, которые не учитываются в данном исследовании.
Приложения Приложение 1 Исходные данные Значения курса евро:
1 01.02.06 33,331 55 20.04.06 33,578 110 07.07.06 34,067 165 22.09.06 34, 2 02.02.06 33,574 56 21.04.06 33,536 111 08.07.06 34,014 166 23.09.06 34, 5 07.02.06 33,584 59 26.04.06 33,819 114 13.07.06 33,825 169 28.09.06 33, 6 08.02.06 33,653 60 27.04.06 33,613 115 14.07.06 33,866 170 29.09.06 34, 7 09.02.06 33,526 61 28.04.06 33,462 116 15.07.06 34,015 171 30.09.06 33, 10 14.02.06 33,573 64 03.05.06 34,497 119 20.07.06 34,301 174 05.10.06 34, 11 15.02.06 33,622 65 04.05.06 34,548 120 21.07.06 34,235 175 06.10.06 34, 12 16.02.06 33,824 66 05.05.06 34,539 121 22.07.06 34,365 176 07.10.06 33, 20.02.06 33,851 68 09.05.06 34,676 123 26.07.06 34,282 178 11.10.06 33, 15 21.02.06 33,855 69 10.05.06 34,453 124 27.07.06 34,398 179 12.10.06 33, 16 22.02.06 33,902 70 11.05.06 34,599 125 28.07.06 34,358 180 13.10.06 33, 17 23.02.06 34,039 71 12.05.06 34,51 126 29.07.06 34,238 181 14.10.06 33, 27.02.06 34,078 73 16.05.06 34,617 128 02.08.06 34,172 183 18.10.06 33, 20 28.02.06 34,049 74 17.05.06 34,736 129 03.08.06 34,302 184 19.10.06 33, 21 01.03.06 33,473 75 18.05.06 34,689 130 04.08.06 34,213 185 20.10.06 33, 22 02.03.06 33,393 76 19.05.06 34,478 131 05.08.06 34,251 186 21.10.06 33, 26 08.03.06 33,502 80 25.05.06 34,409 135 11.08.06 34,385 190 27.10.06 33, 09.03.06 33,513 81 26.05.06 34,288 136 12.08.06 34,204 191 28.10.06 33, 28 14.03.06 33,617 84 31.05.06 34,191 139 17.08.06 34,25 194 02.11.06 34, 29 15.03.06 33,683 85 01.06.06 33,976 140 18.08.06 34,363 195 03.11.06 34, 30 16.03.06 33,681 86 02.06.06 34,008 141 19.08.06 34,316 196 04.11.06 34, 20.03.06 33,508 88 06.06.06 33,951 143 23.08.06 34,377 198 08.11.06 34, 33 21.03.06 33,522 89 07.06.06 34,025 144 24.08.06 34,26 199 09.11.06 34, 34 22.03.06 33,486 90 08.06.06 34,16 145 25.08.06 34,217 200 10.11.06 34, 35 23.03.06 33,395 91 09.06.06 34,092 146 26.08.06 34,202 201 11.11.06 34, 38 28.03.06 33,575 94 14.06.06 34,147 149 31.08.06 34,313 204 16.11.06 34, 39 29.03.06 33,437 95 15.06.06 34,121 150 01.09.06 34,318 205 17.11.06 34, 40 30.03.06 33,447 96 16.06.06 34,071 151 02.09.06 34,267 206 18.11.06 34, 03.04.06 34,106 98 20.06.06 34,141 153 06.09.06 34,193 208 22.11.06 34, 43 04.04.06 34,063 99 21.06.06 34,141 154 07.09.06 34,193 209 23.11.06 34, 44 05.04.06 34,007 100 22.06.06 34,337 155 08.09.06 34,189 210 24.11.06 34, 45 06.04.06 33,96 101 23.06.06 34,37 156 09.09.06 34,034 211 25.11.06 34, 48 11.04.06 33,899 104 28.06.06 34,437 159 14.09.06 34,015 214 30.11.06 34, 49 12.04.06 33,93 105 29.06.06 34,537 160 15.09.06 33,998 215 01.12.06 34, 50 13.04.06 33,77 106 30.06.06 34,706 161 16.09.06 34,045 216 02.12.06 34, 17.04.06 33,555 108 04.07.06 34,171 163 20.09.06 34,005 218 06.12.06 34, 53 18.04.06 33,56 109 05.07.06 33,929 164 21.09.06 33,958 219 07.12.06 34, 54 19.04.06 33, Значения курса доллара:
1 01.02.06 28,131 55 20.04.06 27,465 110 07.07.06 26,911 165 22.09.06 26, 2 02.02.06 28,104 56 21.04.06 27,467 111 08.07.06 26,878 166 23.09.06 26, 06.02.06 28,214 58 25.04.06 27,433 113 12.07.06 26,913 168 27.09.06 26, 5 07.02.06 28,235 59 26.04.06 27,424 114 13.07.06 26,867 169 28.09.06 26, 6 08.02.06 28,252 60 27.04.06 27,392 115 14.07.06 26,919 170 29.09.06 26, 7 09.02.06 28,264 61 28.04.06 27,362 116 15.07.06 26,963 171 30.09.06 26, 13.02.06 28,238 63 02.05.06 27,274 118 19.07.06 27,019 173 04.10.06 26, 10 14.02.06 28,237 64 03.05.06 27,242 119 20.07.06 27,055 174 05.10.06 26, 11 15.02.06 28,184 65 04.05.06 27,159 120 21.07.06 26,967 175 06.10.06 26, 12 16.02.06 28,199 66 05.05.06 27,209 121 22.07.06 26,912 176 07.10.06 26, 15 21.02.06 28,145 69 10.05.06 27,08 124 27.07.06 26,988 179 12.10.06 26, 16 22.02.06 28,191 70 11.05.06 27,036 125 28.07.06 26,843 180 13.10.06 26, 17 23.02.06 28,183 71 12.05.06 27,076 126 29.07.06 26,872 181 14.10.06 26, 27.02.06 28,142 73 16.05.06 26,919 128 02.08.06 26,842 183 18.10.06 26, 20 28.02.06 28,122 74 17.05.06 27,021 129 03.08.06 26,761 184 19.10.06 26, 21 01.03.06 28,121 75 18.05.06 26,957 130 04.08.06 26,804 185 20.10.06 26, 22 02.03.06 28,025 76 19.05.06 27,066 131 05.08.06 26,771 186 21.10.06 26, 06.03.06 27,898 78 23.05.06 27,097 133 09.08.06 26,735 188 25.10.06 26, 25 07.03.06 27,881 79 24.05.06 26,988 134 10.08.06 26,739 189 26.10.06 26, 26 08.03.06 27,995 80 25.05.06 27,017 135 11.08.06 26,674 190 27.10.06 26, 09.03.06 28,003 81 26.05.06 27,038 136 12.08.06 26,793 191 28.10.06 26, 13.03.06 28,012 83 30.05.06 27,065 138 16.08.06 26,834 193 01.11.06 26, 28 14.03.06 28,008 84 31.05.06 26,984 139 17.08.06 26,78 194 02.11.06 26, 29 15.03.06 27,993 85 01.06.06 26,936 140 18.08.06 26,723 195 03.11.06 26, 30 16.03.06 27,843 86 02.06.06 27,047 141 19.08.06 26,736 196 04.11.06 26, 20.03.06 27,675 88 06.06.06 26,709 143 23.08.06 26,696 198 08.11.06 26, 33 21.03.06 27,662 89 07.06.06 26,733 144 24.08.06 26,761 199 09.11.06 26, 34 22.03.06 27,703 90 08.06.06 26,858 145 25.08.06 26,786 200 10.11.06 26, 27.03.06 27,798 93 13.06.06 27,008 148 30.08.06 26,745 203 15.11.06 26, 38 28.03.06 27,773 94 14.06.06 27,084 149 31.08.06 26,738 204 16.11.06 26, 39 29.03.06 27,802 95 15.06.06 27,09 150 01.09.06 26,73 205 17.11.06 26, 40 30.03.06 27,804 96 16.06.06 27,037 151 02.09.06 26,754 206 18.11.06 26, 03.04.06 27,749 98 20.06.06 27,038 153 06.09.06 26,641 208 22.11.06 26, 43 04.04.06 27,774 99 21.06.06 27,045 154 07.09.06 26,671 209 23.11.06 26, 44 05.04.06 27,692 100 22.06.06 27,016 155 08.09.06 26,671 210 24.11.06 26, 45 06.04.06 27,56 101 23.06.06 26,974 156 09.09.06 26,763 211 25.11.06 26, 10.04.06 27,675 103 27.06.06 27,102 158 13.09.06 26,776 213 29.11.06 26, 48 11.04.06 27,709 104 28.06.06 27,033 159 14.09.06 26,798 214 30.11.06 26, 49 12.04.06 27,68 105 29.06.06 27,061 160 15.09.06 26,802 215 01.12.06 26, 50 13.04.06 27,663 106 30.06.06 27,079 161 16.09.06 26,767 216 02.12.06 26, 17.04.06 27,656 108 04.07.06 26,874 163 20.09.06 26,772 218 06.12.06 26, 53 18.04.06 27,634 109 05.07.06 26,84 164 21.09.06 26,797 219 07.12.06 26, 54 19.04.06 27, Приложение 2 Код программы H&LSeries.exe #include #include #pragma hdrstop #include "Unit1.h" #include "Unit2.h" #pragma package(smart_init) #pragma resource "*.dfm" TForm1 *Form1;
//--------------------------------------------------------------------------fastcall TForm1::TForm1(TComponent* Owner) : TForm(Owner) //--------------------------------------------------------------------------void fastcall TForm1::N6Click(TObject *Sender) // информация о программе AboutBox->ShowModal();
//--------------------------------------------------------------------------void fastcall TForm1::OpenFileClick(TObject *Sender) // открытие файла if(OpenDialog->Execute()) { Memo->Lines->LoadFromFile(OpenDialog->FileName); } //--------------------------------------------------------------------------void fastcall TForm1::CalculateClick(TObject *Sender) // вывод неравенств for(int i = 0; i < Memo->Lines->Count; i++ ) { Memo->Lines->Strings[i];} int n = Memo->Lines->Count;
float *x = new float[n];
for(int j=0; jLines->Strings[j].ToDouble(); } if (n Count; i++ ) { Memo->Lines->Strings[i]; } int n = Memo->Lines->Count;
float *x = new float[n];
for(int j=0; jLines->Strings[j].ToDouble(); } Приложение 3 Модели для курса доллара Линейный тренд:
Стандартная ошибка 0, Полиномиальная модель 4-й степени:
Множественный R 0, Нормированный R2 0, Модель АР(1):
Регрессионная статистика Дисперсионный анализ Стандартная ошибка 0,057 Итого 217 57, Приложение 4 Модели для курса евро Полиномиальная модель 4-й степени:
Регрессионная статистика Множественный R 0, Нормированный R2 0, Стандартная ошибка 0, Полиномиальная модель 5-й степени:
Регрессионная статистика Множественный R 0, Нормированный R2 0, Стандартная ошибка 0, Полиномиальная модель 6-й степени:
Регрессионная статистика Множественный R 0, Нормированный R2 0, Стандартная ошибка 0, Приложение 5 Список терминов Временной ряд – совокупность наблюдений, выполненных в хронологическом порядке и, как правило, через равные промежутки времени [9].
Корреляция – взаимодействие двух или нескольких величин (или переменных), при котором изменениям одной или нескольких из них соответствуют изменения другой или других в том же или противоположном направлении [9].
Автокорреляция – корреляционная связь (см. Корреляция) между значениями одного и того же случайного процесса X(t) в моменты времени t1 и t2. Функция, характеризующая эту связь, называется автокорреляционной функцией [9].
Частная корреляция – корреляция между двумя переменными, вычисленная после устранения влияния всех других переменных [8].
Тренд – длительная тенденция изменения экономических показателей. Когда строятся экономико-математические модели прогноза, Т. оказывается первой, основной составляющей прогнозируемого временного ряда, на которую уже накладываются другие составляющие, например сезонные колебания [9].
Стационарные ряды (в анализе временных рядов) – ряды, имеющие постоянные по времени среднее, дисперсию и автокорреляцию [8].
Список литературы 1. Орлов А. Евро атакует доллар // Российская Федерация сегодня. 2002. №19.
2. Тимченко М.Н. История введения единой европейской валюты и его последствия // Финансовый менеджмент. 2001. №1.
3. Аскер-Заде Н., Орлов И. Доллар упал в историю // Коммерсант. 2008. №34. с. 1.
4. Официальный сайт министерства финансов РФ. http://www1.minfin.ru/ 5. Бокс Дж., Дженкинс Г. Анализ временных рядов: Прогноз и управление. М.: Мир, 1974. 406 с.
6. Елисеева И.И. Эконометрика. М.: Финансы и статистика, 2007. 576 с.
7. Кендэл М. Временные ряды. М.: Финансы и статистика, 1981. 191 с.
8. Арженовский С.В., Федосова О.Н. Эконометрика. Учебное пособие / Рост. гос.
экон. унив. Ростов н/Д, 2002. 102 с.
9. Новиков А.И. Эконометрика. М.: ИНФРА-М, 2007. 144 с.
10. Электронный учебник по статистике. Москва, StatSoft, 2001.
http://www.statsoft.ru/home/textbook/default.htm.
11. Федорова Е.К. Статистический анализ динамики курсов валют. Процессы управления и устойчивость, Труды XXXIX международной научной конференции / под ред. Смирнова Н.В., Смирновой Т.Е. – СПб.: Изд-во С.-Петерб. ун-та, с. ….
12. Луговская Л.В. Эконометрика в вопросах и ответах. Учебное пособие. М.: ТК Велби, Изд-во Проспект, 2006. 208 с.
Предметный указатель Автокорреляция уровней ряда · Авторегрессия Проинтегрированного Скользящего Среднего Временной ряд · Коэффициент автокорреляции · ранговый коэффициент корреляции Спирмена · "восходящих и нисходящих" серий · 6 интеграционная статистика Дарбина-Уотсона (IDW)