«Работа допущена к защите: зав. кафедрой проф. Рубцов Б. Б. МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ на тему: Прогнозирование валютных курсов с использованием эконометрических моделей и искусственных нейронных сетей Магистрант ...»
ФИНАНСОВАЯ АКАДЕМИЯ ПРИ ПРАВИТЕЛЬСТВЕ РФ
Кафедра «Ценные бумаги и финансовый инжиниринг»
Работа допущена к защите:
зав. кафедрой проф. Рубцов Б. Б.
МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ
на тему:
«Прогнозирование валютных курсов с использованием эконометрических
моделей и искусственных нейронных сетей»
Магистрант направления:
«Финансовые рынки и финансовый инжиниринг»
Дегтярев В. М.
Научный руководитель:
к.э.н. Соловьев П.Ю.
Внешний рецензент:
Колосов А. А.
Москва Содержание ВВЕДЕНИЕ.………………………………………………………………………
ГЛАВА 1.ВВЕДЕНИЕ В МЕЖДУНАРОДНЫЙ ВАЛЮТНЫЙ РЫНОК…..
1.1 Возникновение рынка FOREX и основные тенденции его развития… 1.2 Сущность фундаментально и технического анализа………………… 1.3 Понятие торговой системы и ее практическое значение..…………... 1.4 Проблема прогнозируемости валютного рынка..…………………….ГЛАВА ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПРОГНОЗИРОВАНИЯ
2.ВРЕМЕННЫХ РЯДОВ………………………………………………………… Прогнозирование временных рядом методами линейного 2. подхода……………………………………………………………………… 2.1.1 Анализ временных рядов исследуемых процессов и описание их свойств……………………………………………………………... 2.1.2 Модели авторегрессии и скользящего среднего…………….... 2.1.3 Метод «Гусеница»-SSA………………………………………... 2.2 Прогнозирование временного ряда при помощи теории нейронных сетей………………………………………………………………………... 2.2.1 Введение в теорию нейронных сетей…………………………. 2.2.2 Алгоритм работы с нейронными сетями……………………...
ГЛАВА ПРАКТИЧЕСКИЕ ПРИМЕРЫ ПРОГНОЗИРОВАНИЯ
3.ВАЛЮТНОГО КУРСА………………………………………………..……….. 3.1 Линейный подход……………………………………………………… 3.1.1 Прогнозирование курса USDCHF эконометрическим методом………………………………………………………………... 3.1.2 Прогнозирование курса USDCHF методом «Гусеница»-SSA.. 3.2 Нелинейный подход. Искусственные нейронные сети……………… 3.2.1 Прогнозирование курса USDCHF с использованием программного пакета NeuroSolution…………………………………. 3.2.2 Прогнозирование курса USDCHF с использованием программного пакета NeuroShell…………………………………… 3.2.3 Решение задачи классификации с использованием программного пакета NeuroShell Classifier………………………… ЗАКЛЮЧЕНИЕ………………………………………………………………... СПИСОК ЛИТЕРАТУРЫ…………………………………………………….. Введение.
История развития человечества неразрывно связана с развитием его взаимоотношений с окружающей средой. Собственно говоря, сама история человека разумного во многом и есть история развития его взаимодействия с окружающей средой.
Начав неспешное движение с подчинения своей воле огня и создания первых примитивных орудий труда, человечество, постоянно ускоряя шаг, пришло к началу XXI века к активному использованию «огня» атомного и нано технологий. Совершенствование средств связи привело к тому, что радиус общения людей увеличился с нескольких десятков метров до тысяч километров. Прогресс в вычислительной технике позволил от возможности пересчитать членов общины перейти к способности моделировать процессы на молекулярном уровне и созданию искусственного интеллекта. Указанные достижения изменили до неузнаваемости практически все аспекты жизни современного человека.
Способность изменять характер взаимодействия с окружающей средой является не только уникальным качеством человека разумного, отличающим его от остальных представителей животного мира, но и фундаментальным фактором, оказывающим сильнейшее влияние на его развитие. Подтверждением тому служит распространенная в современной исторической науке система классификации этапов развития человечества, в основе которой лежит разделение эпох в зависимости от преобладающего на тот исторический момент времени способа преобразования материи, а впоследствии и информации. Наиболее известными категориями данной классификации являются, к примеру, каменный/ бронзовый века, индустриальная/ постиндустриальная эпохи.
С точки зрения теории управления, прогресс, выражающийся во все более разностороннем и эффективном использовании человеком окружающей среды, выглядит как постепенное приближение текущего вектора состояния системы к вектору целей. Под системой в данном случае понимается совокупность человечество - окружающая среда в их взаимодействии. В силу ограниченности физиологических возможностей человек не в состоянии изменять большинство процессов, протекающих в среде, поэтому указанное взаимодействие в значительной степени протекает в информационной плоскости.
Выражается это в том, что человек сначала старается получить максимальное количество информации об интересующем его явлении, а затем пытается выработать решение, как данную информацию использовать для достижения поставленной цели. В более общем виде можно сказать, что человек взаимодействует с окружающей средой путем всестороннего изучение ее законов и последующего их использования для достижения собственных целей. Таким образом, информационное взаимодействие является одним из наиболее важных аспектов взаимодействия человека со средой.
«Тот, кто владеет информацией- владеет Миром»- гласит известная пословица. В свете приведенных выше рассуждений смысл ее становится очевиден: чем большим количеством информации о явлении или процессе владеет человек, тем больше у него шансов достичь цели в отношении данного явления или процесса. Постигнув физические законы, человечество создало корабли, самолеты и машины; получив информацию о законах физиологии, научилось лечить неизлечимые ранее болезни; освоенные законы кибернетики позволили подойти вплотную к перспективе полной автоматизации процесса производства материальных благ.
Однако, несмотря на впечатляющие успехи, есть области, в которых современная научная мысль до сих пор не может почувствовать себя полновластной хозяйкой.
Достаточно вспомнить довольно скромные успехи науки в прогнозировании погоды, сейсмических аномалий, различных социальных явлений, в том числе экономических кризисов.
К таким «плохо подчиняющимся» усилиям научной мысли явлениям относится и поведение временных финансовых рядов. Подтверждением тому служит неиссякаемый уже не одно десятилетие поток работ на тему финансовых рынков, в которых доказываются подчас противоположные точки зрения, а также огромное разнообразие методов и подходов, используемых для их исследования. Несомненно, финансовые рынки, являясь воплощением стихийных процессов, пробуждают в человеке одно из самых древних и удивительных его качеств: стремление к покорению и подчинению собственным целям процессов окружающей среды. Данное обстоятельство в совокупности с перспективой практически неограниченного заработка являются, по видимости, основной причиной столь высокого интереса к теме финансовых рынков.
Как было отмечено ранее, вероятность успеха в достижении цели, преследуемой в отношении того или иного процесса или явления, тем выше, чем больше информации о данном процессе или явлении имеется в распоряжении субъекта, формирующего цель. Для достижения цели на финансовых рынках необходимой информацией является прогноз будущего поведения финансового временного ряда.
Данная работа является попыткой разобраться в принципиальном существовании или отсутствии возможности прогнозирования финансовых рынков, а также сущности классических и современных методов прогнозирования.
Таким образом, целью данной работы является получение теоретических и практических навыков эффективного прогнозирования финансовых рынков. Для достижения поставленной цели в работе решаются следующие задачи:
1) раскрытие сущности осуществления операций на финансовом рынке на примере валютного рынка FOREX, определение основных понятий, ознакомление с основами технического и фундаментального анализа 2) раскрытие основных зависимостей между котировками валют и другими показателями 3) описание методов прогнозирования при помощи статистики (в основном, зависимости, дисперсионный анализ и так далее) 4) описание методов прогнозирования при помощи эконометрики (в основном, теория временных рядов, модель ARIMA и так далее) 5) описание методов прогнозирования при помощи теории нейронных сетей (обучение персептронов, создание мнения многих сетей, построение собственного показателя) Работа построена следующим образом.
Работа поделена на теоретическую и практическую части. В главе I теоретической части содержатся общие сведения о международном валютном рынке FOREX, описывается история его возникновения и основные тенденции развития. Далее раскрывается сущность фундаментального и технического анализа, приводится понятие торговой системы ее практическое значение, обсуждаются общие проблемы прогнозирования валютного рынка.
Глава II посвящена теоретическим аспектам прогнозирования временных рядов. В данном разделе в рамках линейного подхода рассматриваются параметрические и непараметрические типы моделей, обсуждается проблема стационарности ряда. В рамках нелинейного подхода рассматриваются теоретические аспекты построения нейросетевых моделей прогноза.
В главе III разбирается практическая сторона прогнозирования временных рядов.
На примере валютной пары USDCHF отрабатываются навыки построения прогнозных моделей. В первой части главы III отрабатываются навыки прогнозирования временного ряда линейными методами: параметрическим и непараметрическим, дается оценка качества прогнозных моделей и делается вывод об их применимости. Вторая часть главы III посвящена прогнозированию временного ряда с использование нелинейных моделей (искусственных нейронных сетей). В рамках данного подхода решаются различные оптимизационные задачи (максимизация прибыли, минимизация ошибки, классификация образов).
В заключительной части подводится итог проделанной работы.
ГЛАВА 1.ВВЕДЕНИЕ В МЕЖДУНАРОДНЫЙ ВАЛЮТНЫЙ РЫНОК
1.1 Возникновение рынка FOREX и основные тенденции его развития Международный валютный рынок в той форме, что мы видим его сегодня, существует сравнительно недавно. Глобальные изменения начались в 30-е годы XX века, когда разразился мировой финансовый кризис. Вместе с началом кризиса уходит в прошлое господство золотомонетного стандарта, рушатся многие торгово-экономические связи.В 1944 прошла Бреттон-Вудская конференция. В результате данной конференции Международный валютный фонд становится важнейшим институтом, контролирующим международные финансово-экономические отношения. Были установлены регулируемые паритеты валют, привязанные к доллару США (возможное отклонение могло составлять не более 1%), доллар же, в свою очередь, был привязан к золоту. Изменения обменного курса могли иметь место, но для этого необходимо было согласие МВФ. В результате планировалось через некоторое время все валюты сделать конвертируемыми. К 1958 году многие европейские страны объявляют о свободной конвертируемости своих валют, в 1964 это сделала Япония. В 1967 году произошла девальвация английского фунта, что нанесло последний удар по Бреттон-Вудской системе.
Все это сопровождалось экономическим кризисом в США, которые уже не могли поддерживать прежнюю цену на унцию золота.
Как результат, в августе 1971 рост дефицита платежного баланса вынудил президента Р. Никсона приостановить конвертируемость долларов в золото. В результате, в 1973-1974 годах прежняя система прекратила свое существование.
В 1976 году состоялась Ямайская конференция в г. Кингстон. Представители ведущих мировых государств сформировали новые принципы Мировой валютной системы. Государства отказались от использования золота в качестве средства покрытия дефицита при международных платежах. Основными элементами новой системы выступают межгосударственные организации, регулирующие валютные отношения, конвертируемость валют. Платежными средствами выступают национальные валюты.
Главным механизмом, посредством которого осуществляются международные валютные операции, выступают коммерческие банки.
Рассмотрим теперь более подробно понятие «свободно конвертируемая валюта»
(СКВ). СКВ – это национальная валюта тех государств, которые ратифицировали статью Устава Международного валютного фонда. Эти валюты без ограничений обмениваются на другие виды валют и широко используются для осуществления платежей на международных рынках.
Устав МВФ (Articles of agreement of the IMF) был разработан в июле 1944 года.
Статья 8 Устава МВФ гласит, что страны, ратифицировавшие данный устав, обязуются:
a. Устранить преграды текущим платежам (avoidance of restrictions on current discriminatory currency practices) (convertibility of foreign trade balances) d. Обеспечить фонд информацией, необходимой для его деятельности e. Обязанность сотрудничать с фондом и другими членами соглашения согласно политики резервных активов (obligation to collaborate regarding policies on reserve assets). Это означает, что страны должны согласовывать активы фонда, чтобы поддерживать его работоспособность.
Таким образом, сделав свои денежные знаки свободно конвертируемыми, мировая экономика перешла на новый этап развития. Мировой валютный рынок чаще всего называют FOREX (FOReigh EXchange – «иностранный обмен»). Ежедневный объем операций по валютному рынку намного превышает аналогичный показатель по другим рынкам. Ежедневный объем рынка FOREX составляет 3-4 триллиона долларов США. С каждым годом эта цифра растет.
На данном рынке коммерческие, государственные организации и физические лица продают и покупают валюту одной страны в обмен на валюту другой. Для удобства расчетов было введено такое понятие, как минимальный «лот» покупки. Он был положен равным одному миллиону долларов. Только начиная с этой суммы физическому лицу или организации можно выходить на Международный валютный рынок.
Для поддержания ликвидности и мобильности данного рынка было введено понятие «маркет-мейкеров» (market-maker). Ими являются крупные транснациональные банки, которые взяли на себя обязательство постоянно обновлять курсы, по которым они готовы покупать и продавать те или иные валюты. Отказаться от сделки по заявленной цене маркет-мейкеры права не имеют. Рассмотрим теперь остальных участников рынка FOREX.
Для тех организаций и физических лиц, чья заявка меньше, чем минимально возможная, предусмотрен следующий вариант. Они могут заключить договор о предоставлении услуг с тем банком или организацией, у которой есть соглашение с кемлибо из маркет-мейкеров. Тогда операции, которые хотят проводить более мелкие игроки, будут проходить через посредника, и, укрупняясь, формировать полноценные заявки. Эти заявки поступают на рынок FOREX. Мелкие операции ограничиваются одной сотой лота, то есть $10,000. Обычно посредники, возникающие на данном рынке, предлагают своим клиентам «кредитное плечо». Кредитное плечо – это дополнительная сумма, которую посредник дает взаймы для увеличения покупательской способности при совершении сделок. Кредитное плечо – безразмерная величина, на которую умножается заявка клиента.
Если посредник предлагает кредитное плечо в размере 100, то при наличии у клиента $ он может совершать операции на рынке FOREX на сумму $10,000.
Существование данного рынка жизненно необходимо рынку товарному и другим рынкам, поскольку сделки в каждой стране осуществляются в национальной валюте. Для покупки товаров заграницей необходима ее валюта, которую можно получить, обменяв на нее свою валюту. Это одна из многих причин существования Международного валютного рынка. Поскольку относительные стоимости валют постоянно изменяются, представляется возможным получать прибыль от покупки той или иной валюты в момент, когда цена ее снизилась, и продажи в период подъема цены.
Среди основных причин популярности рынка FOREX можно выделить следующие:
Во-первых, это ликвидность. Именно деньги имеют наивысшую ликвидность из всех возможных активов. Поэтому рынок FOREX, на котором в качестве активов обращаются деньги, привлекает многих инвесторов. Ведь именно ликвидность и позволяет им свободно работать на рынке, совершать сделки любого объема.
Во-вторых, это оперативность. Рынок FOREX работает круглосуточно, что очень удобно для участников рынка, так как им не приходиться ждать, чтобы отреагировать на то или иное событие на рынке.
В-третьих, это стоимость. Рынок FOREX традиционно не имеет никаких комиссионных расходов, кроме естественной рыночной разницы, спреда (spread), между ценами спроса и предложения.
В-четвертых, это однозначность котировок. Из-за высокой ликвидности рынка продажа практически неограниченного количество лотов может быть выполнена по единой рыночной цене. Это позволяет избежать проблемы неустойчивости, существующей во фьючерсах и других фондовых инвестициях, где в одно время и по определенной цене могут быть проданы только ограниченное количество контрактов.
В-пятых, это размер маржи. Дилинговый рычаг (кредитное "плечо") на рынке FOREX устанавливается дилинговой компанией и, как уже было сказано выше, определяет соотношение между суммой залога и выделяемым под нее залоговым капиталом: 1:20;
1:40; 1:50; 1:100 и так далее. Использование таких больших кредитных "плеч" делает этот рынок высокодоходным и одновременно высоко рискованным.
Международный валютный рынок можно классифицировать с разных сторон. С одной стороны, он может быть классифицирован по виду операций. Например, существует мировой рынок конверсионных операций (в нем можно выделить рынки конверсионных операций типа доллар США / японская йена или доллар США / канадский доллар и тому подобное). С другой стороны, можно провести классификацию по территориальному признаку. В настоящее время мировой валютный рынок FOREX образует систему постоянно взаимодействующих между собой с помощью новейших компьютерных технологий валютных рынков, которые находятся в различных уголках мира, в разных часовых поясах. Наиболее значительными рынками можно считать Азиатский (Токио, Сингапур, Гонконг), Европейский (Лондон, Франкфурт на Майне, Цюрих) и Американский (Нью-Йорк, Чикаго, Лос-Анджелес).
Основными участниками валютного рынка являются коммерческие банки, фирмы, осуществляющие международные валютные операции, компании, осуществляющие зарубежные вложения активов, центральные банки, валютные биржи, валютные брокерские фирмы, а также частные лица.
Коммерческие банки. Основные объемы (90-95%) сделок на рынке FOREX совершают крупнейшие коммерческие банки. Они проводят наибольший объем операций.
Помимо работы от лица клиентов банки также совершают операции самостоятельно за счет собственных средств. Ежедневный объем таких операций достигает нескольких миллиардов долларов.
Это такие банки, как Deutsche Bank, Barclays Bank, Union Bank of Switzerland, Citibank, Standard Chartered Bank и другие. Их основным отличием являются крупные объемы сделок, которые могут привести к значительным изменениям в котировках валютных пар.
Фирмы, осуществляющие внешнеторговые операции. Здесь имеются в виду компании, которые участвуют в международной торговле, предъявляют устойчивый спрос на иностранную валюту и предложение иностранной валюты. Такие компании обычно не имеют прямого доступа на валютный рынок и проводят все операции через коммерческие банки.
Компании, осуществляющие зарубежные вложения активов. Данные компании, представленные различного рода международными инвестиционными фондами, осуществляют политику диверсифицированного управления портфелем активов, размещая средства в ценных бумагах правительств и корпораций различных стран.
К данному виду фирм относятся также крупные международные корпорации, осуществляющие иностранные производственные инвестиции: создание иностранных филиалов, совместных предприятий и тому подобного. В качестве примера можно привести Xerox, Nestle, General Motors, BP и другие.
Центральные банки. В задачу центральных банков входит регулирование валюты на внешнем рынке, иными словами, они предотвращают резкие скачки курсов во избежание экономических кризисов, поддержания баланса экспорта и импорта и тому подобное.
Центральные банки оказывают прямое влияние на валютный рынок. Их нельзя относить ни к медведям, ни к быкам, потому что они могут играть как на понижение, так и на повышение, исходя из поставленных перед ними задач.
Валютные биржи. В ряде стран с переходной экономикой функционируют валютные биржи, в функции которых входит осуществление обмена валют для юридических лиц и формирование рыночного валютного курса. Государство обычно активно регулирует уровень обменного курса, пользуясь компактностью биржевого рынка.
Валютные брокерские фирмы. Их задачей является сведение покупателя и продавца иностранной валюты и осуществление между ними конверсионной операции. За свое посредничество брокерские фирмы взимают комиссию в виде процента от суммы сделки.
Частные лица. Физические лица проводят большое количество неторговых операций в части зарубежного туризма, переводов заработной платы, пенсий, гонораров, покупки и продажи наличной валюты. С упрощением валютной торговли, физические лица получили возможность инвестировать денежные средства на рынке FOREX с целью получения прибыли. Таких людей называют трейдерами.
Приведем определения основных понятий, используемых на рынке FOREX.
Маржа – это сумма гарантийного залога, под которую предоставляется кредитное «плечо».
Под маржевой торговлей понимают сделки на валютном рынке, которые осуществляются при помощи выделения гарантийного залога под предоставление кредитного «плеча».
Дилинговый рычаг («плечо») – это система предоставления кредита под залог для проведения операций на международном рынке. Дилинговый рычаг устанавливается дилинговой компанией и определяет соотношение между суммой залога и выделяемыми под нее заемным капиталом: 1:20, 1:40, 1:50, 1:100 и так далее.
Валютный курс – это цена денежной единицы одной страны, выраженная в денежной единице другой страны.
Лот – фиксированная стандартная сумма валюты, выделяемая для операций по куплепродаже валюты. Иногда также называется размером контракта. Размер одного лота равен 1 000 000 USD.
Всего в мире существует более 50 видов валют. Теоретически, торговать можно каждой из них, однако на практике это не так. Большинство валют не являются свободно конвертируемыми, обменный курс многих валют жестко привязан к доллару или к другой валюте сильного государства. Чаще всего дилинговые центры предлагают котировки по следующим основным валютным парам:
EURUSD, GBPUSD, USDCHF, USDJPY, USDCAD, AUDUSD, EURGBP, EURCHF,
EURJPY, GBPCHF, GBPJPY (EUR – евро, GBP – фунт стерлингов, CHF – швейцарский франк, JPY – японская йена, CAD – канадский доллар, AUD – австралийский доллар).Последние пять валютных пар, не связанных с USD (долларом США) называются кросскурсами.
Попытаемся теперь провести классификацию различных валютных пар по нескольким признакам с тем, чтобы выявить плюсы и минусы работы с каждой из них. В качестве критериев для оценки валютных пар были выбраны: волатильность, среднее изменение за день, стоимость одного пункта, сила государственного влияния на обменный курс, соотношение реального обменного курса и номинального, динамика макроэкономических показателей, к которым относится валюта, в том числе инфляция и процентные ставки.
1) Под волатильностью понимается стандартное отклонение доходности.
Классы внутри признака:
2) Среднее изменение за день вычисляется как сумма всех изменений за все дни, деленная на количество дней.
Классы внутри признака:
1. Изменение за день в среднем меньше 50 пунктов 2. Изменение за день больше 50 пунктов, но меньше 3. Изменение за день в среднем больше 150 пунктов Данная классификация очень схожа с волатильностью, но более конкретна.
3) Стоимость одного пункта вычисляется в долларах и показывает, на сколько увеличивается прибыль при повышении/уменьшении курса на 1 пункт.
долгосрочным характеристикам валютной пары, которые могут проявляться не сразу в нашем краткосрочном мире.
4) Во всех странах, помимо сил спроса и предложения, существует еще регулирующий орган в лице государства. Ратификация договора о конвертируемости валюты ограничивает вмешательство государства в процесс установления курсов валют, однако в той или иной степени вмешательство остается и варьируется от страны к Классы внутри признака:
1. Государство почти не совершает крупных операций на рынке FOREX 2. Государство вступает в игру при значительном отклонении курса от 3. Государство устанавливает курс по своему разумению (в этом случае валюта не может быть отнесена к разряду свободно конвертируемых валют).
5) Соотношение номинального обменного курса и реального.
Реальный валютный курс можно определить как отношение цен товаров двух стран, взятых в соответствующей валюте.
где er – реальный валютный курс;
Ph – цены на внутреннем рынке;
Pf – цены на зарубежном рынке.
Номинальный валютный курс показывает обменный курс валют, действующий в настоящий момент времени на валютном рынке страны.
Классы внутри признака:
1. Реальный курс равен номинальному курсу.
6) Темпы инфляции и валютный курс. Здесь анализируется динамика инфляции и инфляционных ожиданий для нескольких стран, чтобы определить возможный запас мощности для роста или падения обменного курса.
7) Динамика других макроэкономических показателей страны, к которой относится Классы внутри признака:
1. Тенденция к укреплению валюты.
2. Тенденция к ослаблению валюты.
Попытаемся провести классификацию основных валютных пар по приведенным выше критериям. В тех случаях, когда в конце названия валютной пары значится USD (EURUSD, GBPUSD, AUDUSD), один пункт полученной прибыли или убытков (при покупке 0,01 лота с кредитным плечом 100) стоит 1$. Это довольно дорогой случай.
Самой агрессивной политикой в отношении своей валюты отличается центральный банк Японии, который часто проводит интервенции на рынке FOREX с целью ослабить укрепляющуюся йену. Федеральная Резервная Система (США) больше оперирует процентными ставками, которые имеют большое влияние на цену доллара, выраженную в других валютах. К сожалению, предсказать проведение подобной политики государством на основании исторической информации представляется затруднительным.
Что же касается других макроэкономических показателей, таких, как инфляция, темп роста ВВП, безработица и тому подобное, то их влияние во многом условно и часто трудно определить, учтено ли уже их влияние на рыночный курс или нет.
Наиболее удобной для рассмотрения валютной парой можно считать USDCHF. Вопервых, данная валютная пара обладает высокой волатильностью, благодаря которой можно получить большую прибыль. Во-вторых, правительство Швейцарии в основном ориентируется на евро (корреляция между EURUSD и USDCHF равна -1) и редко проводит активную интервенцию на валютном рынке. В-третьих, один пункт данной валютной пары относительно дешев, поэтому даже сильное обратное движение не приведет к большим убыткам при торговле.
Рассмотрим теперь принципы торговли частных лиц на рынке FOREX. Чаще всего анализ валютного рынка делят на технический и фундаментальный анализ. Более общее понятие, которое будет освещено несколько позже, называется «торговая система».
1.2 Сущность фундаментально и технического анализа Для того чтобы успешно торговать на рынке FOREX, необходимо постоянно анализировать поступающую информацию. Обычно различают два вида анализа:
фундаментальный и технический.
Фундаментальным называется анализ международного валютного рынка с целью выявления взаимосвязи между изменяющимися макроэкономическими показателями и котировками валютных пар.
Техническим называется анализ международного валютного рынка с целью выявления взаимосвязи между последующими котировками ряда и историческими данными.
Соответственно, и торговые системы различают на фундаментальные, технические и смешанные. Остановимся более подробно на содержании каждого из видов анализа рынка FOREX.
Фундаментальный анализ.
В работе на рынке FOREX, основанной на фундаментальном анализе, делается предположение, что котировки валютных пар учитывают в себе основные экономические и политические события. К примеру, эмпирически установлено, что на рынок влияют громкие отставки и назначения глав государств, начало военных действий, неожиданный рост инфляции и тому подобное. К сожалению, чаще всего предсказать изменение макроэкономических показателей довольно трудно. Даже если это удается, всегда надо учитывать ожидания участников рынка.
Предположим, что рост процентной ставки однозначно влияет на укрепление стоимости одной валюты по отношению к остальным. Вызвано это может быть тем, что одновременно с ростом ставки рефинансирования увеличиваются ставки по депозитам, в результате чего иностранная валюта течет в страну, курс укрепляется, чтобы удовлетворить возросший спрос. Допустим, что это произошло сейчас. Сразу после объявления в прямом эфире новости об изменении ставки стоимость валюты по отношению к другим может как возрасти, так и упасть, а может и не измениться. Разница между событиями состоит в ожиданиях участников рынка. Если ожидания оправдались, то состояние рынка не изменится, поскольку рынок уже впитал в себя данную информацию.
При чрезмерных ожиданиях рынка эффект может быть прямо противоположным ожидаемому эффекту.
Именно по этой причине сторонники технического анализа призывают умеренно обращать внимание на те или иные новости. Часто в смешанную торговую стратегию входит правило о закрытии всех позиций при приближении новостей, касающихся фундаментального анализа.
Другой трудностью в использовании фундаментального анализа является его трудная предсказуемость. Чаще всего, истинные намерения центральных банков или ФРС США завуалированы с целью получения максимального эффекта. Оставим на этом рассмотрение фундаментального анализа и перейдем к техническому анализу.
Технический анализ.
Технический анализ – это общепринятый подход к изучению рынка, имеющий целью прогнозирование движения валютного курса. Технический анализ предполагает, что рынок обладает памятью. Это значит, что на будущее движение курса существенно влияют закономерности его прошлого поведения. Иными словами, рынок может «запомнить», как себя вести в определенной ситуации, в следующий раз это может повториться.
Объектом исследования в техническом анализе являются графики (charts), отображающие поведение цен. В техническом анализе принято выделять на графиках определенный набор типовых элементов. На их основе строится описание поведения графиков.
Прежде всего, это линия тренда (trend line), указывающая направление и темп роста/падения цен. Также важным элементом является канал (channel) – диапазон колебаний цены (курса валюты). Нижнюю границу канала образует линия поддержки, а верхнюю – линия сопротивления.
Из этих элементов составляются так называемые фигуры: треугольник, клин, «голова и плечи», двойная вершина и двойное дно, вымпелы, флаги и другие. Они служат трейдеру ориентирами в построении прогнозов будущего поведения рынка.
На графиках свечей образуются различные характерные конфигурации. Возможно, вершиной философии технического анализа является концепция волн Элиота. Согласно ей, любому движению цен присуща своеобразная цикличность. Причем каждый цикл состоит из трех стадий подъема, разделенных двумя стадиями падения.
С помощью компьютера трейдер осуществляет математическую обработку графиков, получая дополнительную информацию для выявления тенденций рынка, можно автоматизировать построение нескольких десятков статистических показателей динамики цен – индикаторов. Под индикаторами понимаются специальные графики, построенные на основе исторических данных.
Основные предпосылки, на которых основан технический анализ, принято формулировать в виде следующих трех постулатов.
• Рынок учитывает все. Иными словами, цена является следствием и исчерпывающим отражением всех движущих сил рынка.
чередующихся периодов роста и падения цен, так что внутри каждого периода происходит развитие господствующей тенденции. Она действует до тех пор, пока не начнется движение рынка в обратном направлении.
• История повторяется. Часто ключ к пониманию будущего кроется в изучении прошлого. Действует этот постулат следующим образом. Давно было замечено, что определенные конфигурации на графиках цен имеют свойство появляться устойчиво и многократно. Повторение происходит на разных рынках и в разных масштабах времени. Оно является следствием действия некоторых стереотипов поведения, свойственных человеческой В итоге, можно заключить, что обоснование работоспособности методов технического анализа кроется в особенностях психологии людей и существовании стереотипов их поведения на рынке. Приблизительно одинаковый набор факторов, влияющих на принятие решений о покупке и продаже валюты, приводит каждый раз к сходному результату – появлению повторяющихся закономерностей движения курса.
Основное свойство поведения рынка состоит в том, что движение цены всегда происходит волнообразно, повышение сменяется понижением и наоборот. На основе технического и фундаментального анализа строится «торговая система», речь о которой пойдет далее.
1.3 Понятие торговой системы и ее практическое значение У каждого трейдера, эффективно работающего на рынке FOREX, есть своя торговая система. Торговая система – это набор правил (часто разработанный самим трейдером), которыми пользуется дилер при принятии решений на рынке. Иными словами, торговая система говорит что покупать, когда покупать, сколько покупать и когда совершать обратную сделку.
Эффективная торговая система должна быть достаточно подробной, чтобы учесть многие нюансы современного рынка, но, в то же время, достаточно краткой, чтобы не противоречить самой себе. Среди гуру валютного рынка бытует мнение, что самая лучшая торговая система может уместиться на обратную сторону почтовой марки.
Торговая система включает в себя некий набор правил, согласно которым выполняются следующие действия:
• Открытие/закрытие длинной позиции • Открытие/закрытие короткой позиции Обычно необходимым фактом существования торговой системы считают четкую формулировку (лучше в письменном виде) всех правил, с которыми работает трейдер.
Рассмотрим, на чем должна быть основана торговая система:
1. Прежде всего, необходимо определить, торговля каким инструментом будет осуществляться. У каждого инструмента есть свои особенности, присущие только ему, поэтому от ответа на первый вопрос зависят ответы на все остальные вопросы. Часто торговые системы, построенные для рынка ценных бумаг, не работают на валютном рынке, и наоборот.
2. На втором этапе необходимо ответить, на что в первую очередь следует ориентироваться трейдеру – на технический или на фундаментальный анализ. Принято считать, что фундаментальный анализ лучше использовать при работе на долгосрочных рынках (от 1 месяца и больше), а технический 3. Далее следует ответить на вопрос, на каком временном интервале будет работать трейдер. Можно использовать дневные изменения котировок, 4. Затем определяется, какие индикаторы будут использованы в работе.
Необходимо помнить, что разные индикаторы были разработаны для разных рынков, поэтому к ответу на данный вопрос практику следует отнестись со 5. Необходимо определить, по какому принципу будет работать система: по тренду, против тренда или в канале. Работа по тренду предполагает следование движению тренда при его выявлении. Работа против тренда (на откатах) очень опасна, поэтому носит не массовый, как в работе по тренду, 6. Далее следует ответить на вопрос, будут ли использоваться фигуры технического анализа. Если будут, необходимо указать, какие именно.
7. Будут ли использоваться комбинации свечей.
8. Трейдеру необходимо определить, с каким лотом он будет работать. Будет ли лот меняться в ходе торгов или будет всегда постоянным. Необходимо определить, будет ли допускаться добавление, частичное закрытие или 9. Еще один важный вопрос: по каким правилам открывать и закрывать использоваться для вхождения на рынок или для выхода из него, когда лучше открывать позиции и когда эффективнее их закрыть.
10. Отсюда вытекает следующий вопрос: какие критерии выхода из позиции подходят для трейдера (временные, по мере получения определенной 11. Сколько времени может быть открыта позиция.
12. Будут ли использоваться ордера, в частности stop-loss и take-profit. Если будут, необходимо определить, на каком уровне от точки открытия позиции 13. Последний вопрос, на который надо дать ответ трейдеру: будут ли использоваться опыт комментаторов. Существует множество агентств, которые на своих сайтах каждый день публикуют прогнозы рынка. К сожалению, чаще всего данные прогнозы оказываются ошибочными и приводят людей, их использующих, к убыткам.
Все вышеприведенные вопросы, конечно, не являются исчерпывающим списком тех, на которые необходимо ответить при создании торговой системы. Однако, без них торговая система вряд ли будет эффективной.
1.4 Проблема прогнозируемости валютного рынка На рынке FOREX одновременно присутствуют миллионы игроков из разных стран разных континентов. Каждый из них работает с одной или несколькими валютными парами. Таким образом, в каждый момент времени на рынке есть участники, открывающие длинные позиции (сделка на покупку), и те, кто открывает короткие позиции (сделка на продажу). Изменение цены развивается в зависимости от соотношения между этими двумя категориями игроков. Тех, кто играет на повышение (пытается купить дешевле и продать дороже), называют «быками». Тех же, кто играет на понижение (сначала продает дороже, потом покупает дешевле), называют «медведями». Присвоение животных аналогий может быть объяснено с точки зрения здравого смысла: свою жертву бык подбрасывает (играет на повышение), а медведь привстает и прибивает лапами к земле (играет на понижение).
Поведение рынка зависит от соотношения между быками и медведями в конкретный момент времени. Если преобладают быки, то рынок называется «бычьим», в противном случае – «медвежьим». Если на рынке царят бычьи настроения, то больше сделок совершается на покупку той или иной валюты, чем сделок на продажу. Отсюда следует, что спрос превышает предложение, что поднимет цену. Иными словами, цена одной валюты в единицах другой будет увеличиваться. Если на рынке преобладают медвежьи настроения, то есть заключается больше сделок на продажу, чем на покупку, цена снижается. На рынке всегда есть быки и медведи, причем попеременно ими могут быть одни и те же участники рынка. Подведя итог описанной ситуации, приходим к тому, что поведение цены на рынке FOREX зависит от агрегированного решения всех субъектов, состоящего из множества частных решений.
Можно сделать предположение о том, что каждое частное решение принимается отдельно, вне зависимости от решения остальных. В таком случае получается следующая картина: каждый участник рынка анализирует имеющуюся у него информацию о рынке, принимает решение (совершает сделку на покупку или продажу); далее рынок сопоставляет агрегированный спрос и предложение, маркет-мейкеры снижают или повышают цену.
Можно, однако, предположить (это будет ближе к действительности), что решения участниками принимаются не одновременно, а в разное время. При достаточно большом количестве участников можно также предположить, что решения о покупке или продаже принимаются на рынке постоянно. Тогда, проанализировав характеристики рынка, игрок на рынке видит, какие настроения превалируют на рынке, то есть бычий это рынок или медвежий. В результате, в дополнение к его личным соображениям касательно изменения цены валюты в будущем у него будет иметься представление о соотношении быков и медведей на рынке. Это значит, что решение он примет не независимое от остальных участников рынка, а принимая во внимание решения, принятые до него на рынке.
Если принять последнюю гипотезу (о взаимозависимости принимаемых решений), можно трактовать колебание рыночных цен исходя также из коллективной психологии.
Бытует распространенное мнение, что международный валютный рынок представляет собой случайный процесс или что-то близкое к нему. Также утверждается, что процесс изменения цены на коротких промежутках времени (от тиковых графиков до часовых свечей) носят исключительно случайный характер. Приведем в опровержение данной позиции несколько теорий, доказывающих нестохастический характер рынка FOREX.
Действительно, с первого взгляда может показаться, что рынок мало или вообще не предсказуем. Однако эмпирически доказано, что существуют фундаментальные показатели, изменение которых влияет на валютные котировки, однако их изменения носят непредсказуемый характер. Примером к такой точке зрения может служить взаимосвязь между курсом доллара к остальным валютам и изменением учетной ставки Федеральной Резервной Системой. Учетная ставка – это тот процент, под который Федеральный Резервный Банк кредитует коммерческие банки. Этот макроэкономический показатель корректирует совокупный спрос на доллар США. При повышении учетной ставки капитал становится более дорогим (а депозиты более привлекательными). Иностранные инвесторы стремятся разместить свои средства в банках. Больше валюты обменивается на доллары, из-за чего доллары становятся более дорогими. Аналогичным образом можно расписать ситуацию со снижением учетной ставки.
У рынка также есть некоторые ожидания касательно того, как изменится учетная ставка ФРС и другие макроэкономические показатели. Однако точно предсказать такие изменения представляется мало возможным из-за сильной примеси политики в данных вопросах.
Можно сделать предположение (аналогично одному из постулатов технического анализа) о том, что рынок достаточно емкий, чтобы обработать и прореагировать на всю информацию, которая может иметь отношение к FOREX. В таком случае практически каждая новость, которая выбрасывается на рынок, оказывает на него влияние. Разные новости имеют разное влияние на рынок и могут действовать одновременно. Более наглядно это предположение можно объяснить на рынке акций, где громкие отставки и назначения могут повлиять как на компанию, фигурирующую в данной новости, так и на всю отрасль и весь рынок в целом.
Соединяя первоначальные рассуждения о коллективности принятия решений и факторах, которые влияют на рынок, можно сделать следующие заключения. Новости, появляющиеся на рынке, оцениваются его участниками и порождают у них бычьи или медвежьи настроения. Таким образом, рынок отражает не сами новости, а отношение к ним участников рынка, которые принимают свои решения.
Остановимся более подробно на процессе изменения цен на рынке FOREX. Если на рынке больше быков, чем медведей, то цена пойдет вверх. Если это будет продолжаться достаточное время, то можно говорить о наличии тренда. Бесконечно такое движение продолжаться не может, потому что рано или поздно те трейдеры, у кого были открыты позиции на покупку, закроют их. Таким образом, после некоторого роста (восходящего тренда) рост этот прекратится, потому что будет совершено много сделок на продажу и валюта перестанет дорожать. С момента начала падения цены в игру включатся медведи, которые увидят начало разворота тренда и начала падения. Одновременно с трейдерами, которые закрывают свои длинные позиции после роста, медведи также заключат достаточное количество сделок на продажу валюты, что и определит нисходящий тренд.
Иными словами, рост и падение в данной трактовке рынка происходит из-за ожиданий трейдеров руками самих трейдеров.
Если следовать той предпосылке, что решения принимаются с учетом доминирующего мнения на рынке, предположим также, что перепад настроения рынка с одного на другое происходит не сразу, а постепенно. Действительно, эти рассуждения не лишены смысла при достаточно большом количестве участников рынка. Если условно разделить игроков на четыре категорий, по критерию скорости оценки изменения ситуации на рынке (очень адекватно реагирующий, адекватно реагирующий, средне адекватно реагирующий, слабо адекватно реагирующий), можно заключить, что каждая группа будет принимать решение об открытии или закрытии позиции (варианты поведения при смене тренда) на разном этапе. Например, первая, наиболее быстрая категория может увидеть скорый конец тренда при замедлении роста, менее быстрые поймут это при прекращении роста, остальные – при развороте рынка и так далее. Рассмотрим упрощенный пример (Рисунок 1.4.1), чтобы проиллюстрировать сделанные выше выводы.
Допустим, что на рисунке выше представлена реальная ситуация (с определенной степенью точности это действительно так) изменения тренда с положительного на отрицательный. В таком случае можно условно выделить на временной оси пять интервалов. Наиболее адекватным здесь было бы фиксирование прибыли на 3 интервале (красный участок), так и поступят наиболее адекватно реагирующие участники рынка.
Менее адекватно реагирующим удастся закрыть сделку во 2 и 4 интервалах (синий участок), средним – в 1 и 5 интервалах (голубой участок). Наименее проницательным участникам рынка получится закрыть позицию вне рассматриваемых пяти интервалов.
Проанализировав модель поведения участников рынка, приведенную выше, можно сделать вывод о том, что рынок не может сразу сменить свои настроения с бычьих на медвежьи и наоборот. Отсюда введем такое понятие как «инерция рынка». Условно назовем это явление «эффектом танкера».
Танкеры – огромные по своим размерам и грузоподъемности суда. Их огромная масса не позволяет им быстро маневрировать. Любые маневры должны быть начаты заблаговременно, иначе они просто не получатся. Рынок FOREX можно сравнить с таким танкером. Постоянно выполняя «повороты», рынок может плыть куда угодно. Однако это движение может быть спрогнозировано благодаря «эффекту танкера».
Другая аналогия, которая может быть применена к международному валютному рынку – «эффект наблюдения тени». Если считать рынок человеком, то исторические данные по котировкам – это та тень, которую этот человек отбрасывает, когда куда-либо идет. Куда конкретно движется рынок в данный момент, предсказать может быть довольно сложно. Вернемся опять к образу воображаемого человека. Все, что мы видим, - это его тень. Видя тень, можно увидеть, что одна нога у человека стоит на земле, а другая находится в воздухе. Когда человек идет в непонятном направлении, его следующий шаг может показаться неразрешимой задачей. Задача становится легче, если предположить, что наш воображаемый человек бежит. Тогда с определенной долей точности можно понять, где окажется его нога в следующий момент времени. Резкий маневр в данном случае возможен, но для его реализации нужно вдобавок затормозить. Это также может объяснить инерцию, присущую рынку FOREX.
На основе приведенных в данном разделе рассуждений можно заключить, что международный валютный рынок является результатом множества одиночных решений, связанных между собой. Остановимся теперь на методах прогнозирования, которые могут быть применены к рынку FOREX. Эти методы помогут доказать или опровергнуть заключения данного раздела.
ГЛАВА 2. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПРОГНОЗИРОВАНИЯ
ВРЕМЕННЫХ РЯДОВ
2.1 Прогнозирование временных рядов методами линейного подхода Линейный подход выявляет закономерности, необходимые для построения Основополагающим определением в теории временных рядов является понятие стационарности.Работа с временными рядами при помощи эконометрического аппарата связана с некоторыми трудностями. В отличие от пространственных выборок, временные ряды должны обладать определенными свойствами для того, чтобы с ними можно было работать. Одним из таких требований является требование стационарности от ряда. Если рассматриваемый ряд оказывается нестационарным, то при его анализе велика вероятность построения «мнимой регрессии», то есть определение статистически значимой связи там, где ее на самом деле нет.
2.1.1 Анализ временных рядов исследуемых процессов и описание их свойств Введем определение стационарного ряда. Ряд yt называется строго стационарным (strictly stationary) или стационарным в узком смысле, если совместное распределение m распределением yt1 + t, yt 2 + t,..., yt m + t для любых m и t. Обычно нас интересуют средние значения и ковариации, а не все распределение. Поэтому часто используется понятие слабой стационарности (weak stationarity) или стационарности в широком смысле, которое состоит в том, что среднее, дисперсия и ковариации yt не зависят от момента времени t:
Как можно видеть, из строгой стационарности следует слабая стационарность. В дальнейшем везде под «стационарным» рядом будет пониматься слабо стационарный ряд.
Введем понятие автокорреляционной функции (autocorrelation function), ACF:
ACF играет важную роль в задаче идентификации моделей временных рядов. В этом можно убедиться, увидев ряд примеров, приведенных ниже.
Примером нестационарного ряда является «случайное блуждание» (random walk):
Иными словами, ряд действует по принципу «сегодня как вчера», искажаясь на случайную величину с нулевым средним и постоянной дисперсией. Такое блуждание нестационарно, потому что дисперсия от наблюдения к наблюдению только возрастает.
Графическая иллюстрация приведена ниже.
В отличие от случайного блуждания процесс AR(1) (авторегрессионная модель порядка 1) отличается от стационарного AR(1) процесса тем, что влияние случайных составляющих в первом случае не затухает, в то время как во втором случае влияние возмущений затухает В своей работе Магнус Я.Р1. показывает также, что процесс вида | |> 1 не является стационарным и не встречается в реальных экономических примерах.
Рассмотрим некоторые примеры нестационарных рядов и определим порядок действий при обнаружении ряда того или иного типа. Будут рассмотрены тренд и сезонность.
Тренд. Если временной ряд содержит тренд, то его вид можно представить следующим образом:
детерминированной составляющей + f (t ) и случайной составляющей, являющейся стационарным временным рядом с нулевым средним. Часто встречаются такие примеры тренда: квадратичный, экспоненциальный и тому подобное.
Для того чтобы выделить тренд в модели с линейным трендом (и ей подобных), можно применить обычную технику оценивания параметров регрессионных уравнений, считая t независимой переменной. После этого мы получим ряд, остатков, для описания которого можно будет применить модели стационарных временных рядов.
Сезонность. В экономических данных часто встречается сезонная компонента.
Например, в квартальных данных может наблюдаться сезонная компонента с периодом 4:
Магнус Я.Р.Эконометрика. Начальный курс. Москва, М: Дело, Здесь ряд представлен в виде композиции периодической детерминированной составляющей S (t ) (сезонная компонента) и случайной составляющей, являющейся стационарным временным рядом с нулевым средним. Сезонную компоненту можно представить в виде суммы фиктивных (бинарных) переменных. В этом случае сезонная модель принимает следующий вид:
К рассмотренным выше рядам (тренд, сезонность и случайное блуждание) может быть применена методика взятия последовательной разности.
Как уже было определено выше, случайное блуждание является примером нестационарного временного ряда. Однако если к нему применить операцию взятия последовательной разности, получим стационарный временной ряд:
Взятие разности также приводит к стационарному процессу ряд с линейным трендом: y t = + u t, где u t = t t 1. В случае с квадратичным трендом взятие первой разности не приводит к стационарному ряду, но если взять вторую разность, то получившийся ряд является стационарным.
В случае наличия сезонной компоненты устранить ее можно при помощи оператора сезонной последовательной разности 4 y t = (1 L4 ) yt = y t y t 4 (при условии, взятия если период сезонной компоненты равен 4).
Заметим, что применение оператора последовательной разности не обязательно коэффициентом при лагированной переменной больше 1 не является стационарным.
Применив к данному ряду оператор разности, мы получим все тот же нестационарный ряд.
Повторное применение оператора разности также не приводит к стационарному ряду.
последовательной разности, часто можно получить из исходного временного ряда стационарный.
Проверка ряда на стационарность.
Существует несколько способов выявления стационарности рассматриваемого ряда.
Первым способом является визуальный анализ графика ряда с целью выявления трендов, сезонности, резких скачков рассматриваемых данных. Все это является аргументом для принятия гипотезы о нестационарности временного ряда.
автокорреляционную (ACF) и частную автокорреляционную функции (PACF). В процедуре вычисления выборочного частного коэффициента корреляции оказывается, что в случае стационарного ряда значение выборочной частной автокорреляционной функции PACF(k) вычисляется как МНК-оценка последнего коэффициента в AR(k) регрессионном уравнении:
Коррелограмма стационарного временного ряда «быстро убывает» с ростом k после нескольких первых значений. Если же график убывает достаточно медленно, то есть основания предположить нестационарность ряда. График PACF должен также быстро убывать для стационарного ряда.
У коррелограммы есть еще одно очень полезное свойство: с ее помощью можно определять зависимость между членами ряда. Иными словами, по коррелограмме можно определить вид авторегрессионной модели.
Если и после этого метода остаются сомнения насчет стационарности ряда, можно использовать формальные тесты на наличие в операторе сдвига единичного корня (признак нестационарности). Обычно используют тест Дики-Фуллера (DF), расширенный тест Дики-Фуллера (ADF), и другие.
Нулевой гипотезой теста Дики-Фуллера и его расширения является наличие случайного блуждания, то есть отсутствия стационарности ряда. В своей работе2 Д.А. Дики и В.А. Фуллер доказали, что если ряд нестационарен, то обычный способ проверки асимптотически нормальное распределение) не могут быть использованы. Основой для проверки гипотезы служит разработанная этими учеными статистика.
Если вместо членов временного ряда рассматриваются их разности различного порядка, то тест называется расширенным.
2.1.2 Модели авторегрессии и скользящего среднего Рассмотрим следующий класс моделей стационарных временных рядов:
В более короткой записи модель можно переписать так (через операторы сдвига):
Dickey, D. A and W. A. Fuller, “Distributions of the estimators for autoregressive time series with a union root ”, Journal of American Statistical Association, 75 (1979), 427- сдвига. Такая модель называется моделью авторегрессии и скользящего среднего (autoregressive moving average) или ARMA(p,q). Наиболее часто встречаются простые модели типа AR(1), AR(2), MA(1), MA(2), ARMA(1,1).
Ранее уже было показано, почему нежелательно работать с нестационарными рядами. Однако порой работать с такими рядами все-таки возможно. Одними из первых подход к регрессии нестационарных рядов предложили Энгель и Гранжер3 (Engel and Granger) в 1987 году.
Предположим, что у нас есть нестационарных ряд yt. возьмем его первые разности y t = y t y t 1. Если ряд y t является стационарным, то yt называется интегрируемым порядка 1 (integrated order 1), I(1). Соответственно, стационарный ряд y t называется I(0).
Вообще, ряд называется интегрируемым порядка k, I(k), если его разности порядка k- включительно нестационарны, а k-я разность стационарна.
Теперь пусть у нас есть два I(1) ряда yt и xt. Пусть, кроме того, их линейная комбинация yt xt является стационарной, I(0). В этом случае ряды yt и xt называются коинтегрированными (cointegrated). Оказывается, в этом случае можно получить состоятельную оценку.
Асимптотические свойства оценки будут при этом другие. Если обычно имеет предельное нормальное распределение, то в данном случае n( ) имеет некоторое предельное распределение. Такая оценка называется суперсостоятельной, так как сходится к истинному значению быстрее, чем в случае классической регрессии.
Таким образом, чтобы проверить наличие коинтеграции, надо рассмотреть остатки, полученные при МНК-оценивании коинтегрирующего уравнения. Нулевой гипотезой является отсутствие коинтеграции, то есть наличие единичного корня в ряде остатков.
Модели Бокса-Дженкинса (ARIMA).
Модель Бокса-Дженкинса рассматривает модели временных рядов в узком смысле, то есть поведение временного ряда объясняется исключительно из его значений в предыдущие моменты времени.
Engle, R. F. and C. W. J. Granger, “Co-integration and error correction representation, estimation and testing” Econometrica, 55 (1987),455- Как было показано выше, статистические свойства стационарных и нестационарных временных рядов существенно отличаются, и для их моделирования должны применяться различные методы.
Как было показано выше, некоторые нестационарные временные ряды могут быть приведены к стационарным при помощи оператора взятия последовательной разности.
Предположим, что временной ряд yt после того, как к нему применили d раз оператор последовательной разности, стал стационарным рядом удовлетворяющим авторегрессии и скользящего среднего ARIMA(p,d,q).
Прогнозирование с использованием эконометрических методов.
При исследовании ряда на стационарность и определении вида авторегрессионной модели достаточно просто построить прогноз данного временного ряда. Все, что для этого необходимо сделать, это подставить последние значения ряда с тем, чтобы получить следующее значение, прогнозное.
Рекомендуется строить прогноз на небольшое количество промежутков вперед, так как с все большим погружением в будущее совокупная ошибка модели накапливается.
Иными словами, каждое следующее прогнозное значение содержит все больше погрешностей, чем предыдущее.
На этом мы оставим рассмотрение параметрического метода линейного подхода и перейдем к непараметрическому методу.
2.1.3 Метод «Гусеница»-SSA В данном разделе исследования будет рассмотрен непараметрический метод прогнозирования, получивший название «Гусеница»-SSA. Данный метод развивался параллельно в России и в Великобритании и США, отсюда и двойное название метода. С России метод был назван «гусеницей» (caterpillar), а в Великобритании и США – Singular Spectrum Analysis (SSA). Данный метод используется для анализа и прогнозирования временных рядов. Кратко опишем принцип работы данного метода.
Для анализа временного ряда выбирается параметр L ; назовем его «длина окна».
Параметр L может выбираться достаточно произвольно. При достаточно большой длине ряда и достаточно большом значении L результаты не будут зависеть от длины окна. Затем на основе ряда строится траекторная матрица, столбцами которой являются скользящие отрезки ряда длиной L ; с первой точки по L -тую, со второй по ( L +1)-ую и так далее.
Добавим несколько слов о выборе длины окна для эффективного анализа ряда.
Для выделения тренда и периодик из достаточно длинного временного ряда (с которым и предполагается работать на практике), если длина ряда равна N, рекомендуется брать длину окна L = N / 2. Данная рекомендация может быть выполнена при достаточно большой вычислительной мощности используемого компьютера.
Следующий шаг – это сингулярное разложение траекторной матрицы в сумму элементарных матриц. Каждая элементарная матрица задается набором из собственного числа и двух сингулярных векторов – собственного и факторного.
Предположим, что исходный временной ряд является суммой нескольких рядов.
Теоретические результаты позволяют при некоторых условиях определить по виду собственных чисел, собственных и факторных векторов, что это за слагаемые и какой набор элементарных матриц соответствует каждому из них. Суммируя элементарные матрицы внутри каждого набора и затем, переходя от результирующих матриц к ряду, мы получаем разложение ряда на аддитивные слагаемые, например, на сумму тренда, периодики и шума или на сумму низкочастотной и высокочастотной составляющей.
Возможность разбить совокупность элементарных матриц на группы, соответствующие интерпретируемым аддитивным составляющим ряда, тесно связана с понятием разделимости рядов.
Таким образом, целью метода является разложение временного ряда на интерпретируемые аддитивные составляющие. При этом в условиях применимости ряда нет требования к его стационарности. Напомним, что применение методологии БоксаДженкинса модель) в эконометрике исключает анализ ряда при его нестационарности. Также не требуется знание модели тренда, а также сведения о наличии в ряде периодических составляющих и их периодах. При таких слабых предположениях метод «Гусеница»-SSA может решать различные задачи, такие как, например, выделение тренда, обнаружение периодик, сглаживание ряда, построение полного разложения ряда в сумму тренда, периодик и шума.
предположениях является, во-первых, существенно неавтоматическая группировка компонент сингулярного разложения траекторной матрицы ряда для получения составляющих исходного ряда. Во-вторых, отсутствие модели не позволяет проверить гипотезы о наличии в ряде той или иной составляющей (этот недостаток объективно присущ всем непараметрическим методам). Для проверки подобных гипотез требуется построение модели, которое, в свою очередь, может быть проведено на основе информации, получаемой с помощью метода «Гусеница»-SSA. Отметим также, что рассматриваемый непараметрический метод позволяет получить результаты, часто лишь незначительно менее точные, чем многие параметрические методы при анализе ряда с известной моделью.
Группировка для нахождения полного разложения ряда.
Задача нахождения полного разложения ряда эквивалентна идентификации собственных троек сингулярного разложения траекторной матрицы ряда, соответствующих тренду, соответствующим колебательным компонентам и шуму.
Что касается шума, то мы всегда должны иметь в виду присущую этому понятию неопределенность при недостатке строгой математической модели. С практической точки зрения, естественный путь выделения шума – это отнесение к нему тех собственных троек, которые не содержат ни тренда, ни колебаний. Действия по выделению случайных компонент направлены на снижение уровня шума в исходном ряде и концентрацию на трендовых и сезонных компонентах.
Прогнозирование временных рядов методом «Гусеница»-SSA.
При помощи метода «Гусеница»-SSA можно строить прогнозы двух типов:
рекуррентные и векторные. Остановимся на каждом их них более подробно.
Рекуррентное SSA-прогнозирование.
Входными данными алгоритма является временной ряд F (N ), длина окна L, линейное пространство размерности r (пространство для аппроксимации ряда), число M точек прогноза. Задачей прогноза является получение ряда G ( N + M ), состоящего из N + M точек. После разложения матрицы ряда на сингулярные матрицы и его аппроксимации можно построить его прогноз.
а во втором случае для i = N,..., N + M 1. Отметим здесь, что f i является аппроксимацией, а не истинной функцией процесса.
Числа g N,..., g N +M 1 образуют M членов рекуррентного прогноза. Для краткости будем называть рекуррентный прогноз R-прогнозом.
Векторное SSA-прогнозирование.
Алгоритм R-прогноза является основным прогнозирующим элементом в силу его непосредственной связи с линейными рекуррентными формулами. Здесь мы приведем одну его модификацию, которая в ряде случаев может давать более точные результаты прогноза.
Сначала объясним происхождение этого алгоритма. Вернемся к базовому методу SSA как к базовому методу анализа временных рядов и предположим, что нашей целью является извлечение некоторой аддитивной компоненты FN1) из ряда FN (предположим, что она приближенно разделима с остатком). Тогда, выбрав подходящую длину окна L, мы получим сингулярное разложение траекторной матрицы временного ряда FN и можем выбрать собственные тройки ( i,U i,Vi ), i I = ( j1,..., j r ) из одного собственного числа и двух сингулярных векторов, соответствующие ряду FN1). Результирующая матрица будет иметь вид:
и, после диагонального усреднения, придем к восстановленному ряду FN1), который является приближением к FN1).
Коротко идея «векторного прогноза» может быть описана следующим образом.
Допустим, что последовательность векторов X 1,..., X K на M шагов вперед таким образом:
На основе рекуррентного и векторного прогнозирования в практической части будет предпринята попытка сделать прогноз валютного рынка. Как плюс к использованию данного метода можно выделить «достаточность» одного исследуемого временного ряда для построения качественного прогноза.
На данном разделе заканчивается рассмотрение методов прогнозирования в рамках линейного подхода. В следующем разделе будет рассмотрен нелинейный подход на основе теории нейронных сетей.
2.2 Прогнозирование временного ряда при помощи теории нейронных сетей 2.2.1 Введение в теорию нейронных сетей Обратимся к рассмотрению нелинейного подхода к прогнозированию валютного рынка. Методы данного раздела исследования были взяты из теории нейронных сетей.
Под нейронными сетями подразумеваются вычислительные структуры, которые моделируют простые биологические процессы, обычно ассоциируемые с процессами человеческого мозга. Адаптируемые и обучаемые, они представляют собой распараллеленные системы, способные к обучению путем анализа положительных и отрицательных воздействий. Элементарным преобразователем в данных сетях является искусственный нейрон или просто нейрон, названный так по аналогии с биологическим прототипом.
К настоящему времени предложено и изучено большое количество моделей нейроподобных элементов и нейронных сетей, ряд из которых рассмотрен в настоящем разделе.
Термин «нейронные сети» (neural networks) сформировался в 40-х годах XX века в среде исследователей, изучавших принципы организации и функционирования биологических нейронных сетей. Основные результаты, полученные в этой области, связаны с именами американских исследователей У. Маккалоха, Д. Хебба, Ф. Розенблатта, М. Минского, Дж. Хопфилда и др.
В пятидесятые и шестидесятые годы группа исследователей, объединив эти биологические и физиологические подходы, создала первые искусственные нейронные сети. Выполненные первоначально как электронные сети, они были позднее перенесены в более гибкую среду компьютерного моделирования, сохранившуюся и в настоящее время.
Первые успехи вызвали взрыв активности и оптимизма. Минский, Розенблатт, Уидроу и другие разработали сети, состоящие из одного слоя искусственных нейронов. Часто называемые персептронами, они были использованы для такого широкого класса задач, как предсказание погоды, анализ электрокардиограмм и искусственное зрение. В течение некоторого времени казалось, что ключ к интеллекту найден, и воспроизведение человеческого мозга является лишь вопросом конструирования достаточно большой сети.
Но эта иллюзия скоро рассеялась. Сети не могли решать задачи, внешне весьма сходные с теми, которые они успешно решали. С этих необъяснимых неудач начался период интенсивного анализа. Минский, используя точные математические методы, строго доказал ряд теорем, относящихся к функционированию сетей.
Его исследования привели к написанию книги «Персептроны», в которой он вместе с Пайпертом доказал, что используемые в то время однослойные сети теоретически неспособны решить многие простые задачи, в том числе реализовать функцию «Исключающее ИЛИ». Минский также не был оптимистичен относительно потенциально возможного здесь прогресса.
Персептрон показал себя заслуживающим изучения, несмотря на жесткие ограничения (и даже благодаря им). У него много привлекательных свойств: линейность, занимательная теорема об обучении, простота модели параллельных вычислений. Нет оснований полагать, что эти достоинства сохраняться при переходе к многослойным системам. Тем не менее, мы считаем важной задачей для исследования подкрепление (или опровержение) нашего интуитивного убеждения, что такой переход бесплоден. Возможно, будет открыта какая-то мощная теорема о сходимости или найдена глубокая причина неудач дать интересную «теорему обучения» для многослойных машин.
Блеск и строгость аргументации Минского, а также его престиж породили огромное доверие к книге – ее выводы были неуязвимы. Разочарованные исследователи оставили поле исследований ради более обещающих областей, а правительства перераспределили свои субсидии, и искусственные нейронные сети были забыты почти на два десятилетия.
Тем не менее, несколько наиболее настойчивых ученых, таких как Кохонен, Гроссберг, Андерсон продолжили исследования. Наряду с плохим финансированием и недостаточной оценкой ряд исследователей испытывал затруднения с публикациями.
Поэтому исследования, опубликованные в семидесятые и начале восьмидесятых годов, разбросаны в массе различных журналов, некоторые из которых малоизвестны.
Постепенно появился теоретический фундамент, на основе которого сегодня конструируются наиболее мощные многослойные сети. Оценка Минского оказалась излишне пессимистичной, многие из поставленных в его книге задач решаются сейчас сетями с помощью стандартных процедур.
За последние несколько лет теория стала применяться в прикладных областях, и появились новые корпорации, занимающиеся коммерческим использованием этой технологии. Нарастание научной активности носило взрывной характер. В 1987 г. было проведено четыре крупных совещания по искусственным нейронным сетям и опубликовано свыше 500 научных сообщений – феноменальная скорость роста.
Урок, который можно извлечь из этой истории, выражается законом Кларка, выдвинутым писателем и ученым Артуром Кларком. В нем утверждается, что, если крупный уважаемый ученый говорит, что нечто может быть выполнено, то он (или она) почти всегда прав. Если же ученый говорит, что это не может быть выполнено, то он (или она) почти всегда не прав. История науки является летописью ошибок и частичных истин.
То, что сегодня не подвергается сомнениям, завтра отвергается. Некритическое восприятие «фактов» независимо от их источника может парализовать научный поиск. С одной стороны, блестящая научная работа Минского задержала развитие искусственных нейронных сетей. Нет сомнений, однако, в том, что область пострадала вследствие необоснованного оптимизма и отсутствия достаточной теоретической базы. И возможно, что шок, вызванный книгой «Персептроны», обеспечил необходимый для созревания этой научной области период.
Представим некоторые проблемы, решаемые в контексте нейронных сетей и представляющие интерес для пользователей.
Классификация образов. Задача состоит в указании принадлежности входного образа (например, речевого сигнала или рукописного символа), представленного вектором признаков, одному или нескольким предварительно определенным классам. К известным приложениям относятся распознавание букв, распознавание речи, классификация сигнала электрокардиограммы, классификация клеток крови.
Кластеризация/категоризация. При решении задачи кластеризации, которая известна также как классификация образов «без учителя», отсутствует обучающая выборка с метками классов. Алгоритм кластеризации основан на подобии образов и размещает близкие образы в один кластер. Известны случаи применения кластеризации для извлечения знаний, сжатия данных, исследования свойств данных.
Аппроксимация функций. Предположим, что имеется обучающая выборка ((x1,y1),( x2,y2),…,( xN,yN)) (пары данных вход-выход), которая генерируется неизвестной функцией F(x), искаженной шумом. Задача аппроксимации состоит в нахождении оценки неизвестной функции Аппроксимация функций необходима при решении многочисленных инженерных и научных задач моделирования.
Предсказание/прогноз. Пусть заданы n дискретных отсчетов {y(1),y(2),…,y(k)} в последовательные моменты времени. Задача состоит в предсказании значения y(k+1) в некоторый будущий момент времени k+1. Предсказание/прогноз имеет значительное влияние на принятие решений в бизнесе, науке и технике. Предсказание цен на фондовой предсказания/прогноза.
Оптимизация. Многочисленные проблемы в математической статистике, технике, науке, медицине и экономике могут рассматриваться как проблемы оптимизации. Задачей алгоритма оптимизации является нахождение такого решения, которое удовлетворяет системе ограничений и максимизирует или минимизирует целевую функцию. Известная задача коммивояжера является классическим примером задачи оптимизации.
Память, адресуемая по содержанию. В модели вычислений фон Неймана обращение к памяти доступно только посредством адреса, который не зависит от содержания памяти. Более того, если допущена ошибка в вычислении адреса, то может быть найдена совершенно иная информация. Ассоциативная память, или память, адресуемая по содержанию, доступна по указанию заданного содержания. Содержимое памяти может быть вызвано даже частичному входу или искаженному содержанию.
Ассоциативная память чрезвычайно желательна при создании мультимедийных информационных баз данных.
{u(t),y(t)}, где u(t) является входным управляющим воздействием, а y(t) – выходом системы в момент времени t. В системах управления с эталонной моделью целью управления является расчет такого входного воздействия u(t), при котором система следует по желаемой траектории, диктуемой эталонной моделью. Примером является оптимальное управление двигателем.
Нейронные сети сегодня:
нейронных сетей: сеть научили превращать текст в фонетическое представление, которое затем с помощью уже иных методов превращалось в речь; другая сеть может распознавать рукописные буквы; сконструирована система сжатия изображений, основанная на нейронной сети. Все они используют сеть обратного распространения – наиболее успешный, по-видимому, из современных алгоритмов. Обратное распространение, независимо предложенное в трех различных работах Вербоса, Паркера и Румельхарта, является систематическим методом для обучения многослойных сетей, и тем самым преодолевает ограничения, указанные Минским.
Однако, обратное распространение не свободно от проблем. Прежде всего, нет израсходованных на обучение, пропадает напрасно после затрат большого количества машинного времени. Когда это происходит, попытка обучения повторяется – без всякой уверенности, что результат окажется лучше. Нет также уверенности, что сеть обучится наилучшим возможным образом. Алгоритм обучения может попасть в «ловушку» так называемого локального минимума и будет получено худшее решение.
Разработано много других сетевых алгоритмов обучения, имеющих свои специфические преимущества. Следует подчеркнуть, что никакая из сегодняшних сетей не является панацеей, все они страдают от ограничений в своих возможностях обучаться и вспоминать.
Нейронные сети представляют собой область знаний, продемонстрировавшая свою работоспособность, имеющая уникальные потенциальные возможности, много ограничений и множество открытых вопросов. Такая ситуация настраивает на умеренный оптимизм. Авторы склонны публиковать свои успехи, но не неудачи, создавая тем самым впечатление, которое может оказаться нереалистичным. Те, кто ищет капитал, чтобы рискнуть и основать новые фирмы, должны представить убедительный проект последующего осуществления и прибыли. Существует, следовательно, опасность, что искусственные нейронные сети начнут продавать раньше, чем придет их время, обещая функциональные возможности, которых пока невозможно достигнуть. Если это произойдет, то область в целом может пострадать от потери кредита доверия и вернется к застойному периоду семидесятых годов. Для улучшения существующих сетей требуется много основательной работы. Должны быть развиты новые технологии, улучшены существующие методы и расширены теоретические основы, прежде чем данная область сможет полностью реализовать свои потенциальные возможности.
Перспективы на будущее:
Искусственные нейронные сети предложены для решения задач, простирающихся от управления боем до присмотра за ребенком. Потенциальными приложениями являются те, где человеческий интеллект малоэффективен, а обычные вычисления трудоемки или неадекватны. Этот класс приложений, во всяком случае, не меньше класса, обслуживаемого обычными вычислениями, и можно предполагать, что искусственные нейронные сети займут свое место наряду с обычными вычислениями в качестве дополнения такого же объема и важности.
Искусственные нейронные сети и экспертные системы:
В последние годы над искусственными нейронными сетями доминировали логические и символьно-операционные дисциплины. Например, широко пропагандировались экспертные системы, у которых имеется много заметных успехов, так же, как и неудач. Кое-кто говорит, что искусственные нейронные сети заменят собой современный искусственный интеллект, но многое свидетельствует о том, что они будут существовать, объединяясь в системах, где каждый подход используется для решения тех задач, с которыми он лучше справляется.
Эта точка зрения подкрепляется тем, как люди функционируют в нашем мире.
Распознавание образов отвечает за активность, требующую быстрой реакции. Так как действия совершаются быстро и бессознательно, то этот способ функционирования важен для выживания во враждебном окружении.
Когда наша система распознавания образов не в состоянии дать адекватную интерпретацию, вопрос передается в высшие отделы мозга. Они могут запросить добавочную информацию и займут больше времени, но качество полученных в результате решений может быть выше.
Можно представить себе искусственную систему, подражающую такому разделению труда. Искусственная нейронная сеть реагировала бы в большинстве случаев подходящим образом на внешнюю среду. Так как такие сети способны указывать доверительный уровень каждого решения, то сеть «знает, что она не знает» и передает данный случай для разрешения экспертной системе. Решения, принимаемые на этом более высоком уровне, были бы конкретными и логичными, но они могут нуждаться в сборе дополнительных фактов для получения окончательного заключения. Комбинация двух систем была бы более мощной, чем каждая из систем в отдельности, следуя при этом высокоэффективной модели, даваемой биологической эволюцией.
Соображения надежности:
Прежде чем искусственные нейронные сети можно будет использовать там, где поставлены на карту человеческая жизнь или ценное имущество, должны быть решены вопросы, относящиеся к их надежности.
Подобно людям, структуру мозга которых они копируют, искусственные нейронные сети сохраняют в определенной мере непредсказуемость. Единственный способ точно знать выход состоит в испытании всех возможных входных сигналов. В большой сети такая полная проверка практически неосуществима и должны использоваться статистические методы для оценки функционирования. В некоторых случаях это недопустимо. Например, что является допустимым уровнем ошибок для сети, управляющей системой космической обороны? Большинство людей скажет, любая ошибка недопустима, так как она ведет к огромному числу жертв и разрушений. Это отношение не меняется от того обстоятельства, что человек в подобной ситуации также может допускать ошибки.
Проблема возникает из-за допущения полной безошибочности компьютеров. Так как искусственные нейронные сети иногда будут совершать ошибки даже при правильном функционировании, то, как ощущается многими, это ведет к ненадежности – качеству, которое мы считаем недопустимым для наших машин.
Сходная трудность заключается в неспособности традиционных искусственных нейронных сетей "объяснить", как они решают задачу. Внутреннее представление, получающееся в результате обучения, часто настолько сложно, что его невозможно проанализировать, за исключением самых простых случаев. Это напоминает нашу неспособность объяснить, как мы узнаем человека, несмотря на различие в расстоянии, угле, освещении и на прошедшие годы. Экспертная система может проследить процесс своих рассуждений в обратном порядке, так что человек может проверить ее на разумность.
Искусственные нейронные сети являются важным расширением понятия вычисления. Они обещают создание автоматов, выполняющих функции, бывшие ранее исключительной прерогативой человека. Машины могут выполнять скучные, монотонные и опасные задания, и с развитием технологии возникнут совершенно новые приложения.
Теория искусственных нейронных сетей развивается стремительно, но в настоящее время она недостаточна, чтобы быть опорой для наиболее оптимистических проектов. В ретроспективе видно, что теория развивалась быстрее, чем предсказывали пессимисты, но медленнее, чем надеялись оптимисты, – типичная ситуация. Сегодняшний взрыв интереса привлек к нейронным сетям тысячи исследователей. Резонно ожидать быстрого роста нашего понимания искусственных нейронных сетей, ведущего к более совершенным сетевым парадигмам и множеству прикладных возможностей.
2.2.2 Алгоритм работы с нейронными сетями Для многих экономистов, хорошо знакомых с эконометрикой и поверхностно знакомых с теорией нейросетевых вычислений, нейронная сеть представляется подобием «черного ящика», в который необходимо загрузить входящую информацию (вход), чтобы получить некий желаемый результат (выход). Сам процесс преобразования данных в процессе вычислений для исследователей-экономистов не играет большой роли. Главное, чтобы результат был приемлемым. С такой точки зрения нейронная сеть может быть отождествлена с волшебной палочкой, которая может сделать все, что угодно исследователю. К сожалению, процесс нейровычислений на самом деле несколько сложнее, чем может показаться.
Представление входных данных.
При прогнозировании валютных рынков при помощи нейронных сетей в качестве входной информации могут выступать: ценовая динамика и ее производные (значение индикаторов, значимые уровни и тому подобное), а также другие рыночные показатели.
Часто для прогнозирования ценовой динамики используют тот же ряд, но с временным лагом, в эконометрике это называется авторегрессионной моделью.
Следует отметить, что абсолютные значения валютных котировок нельзя использовать как вход для нейронной сети. Совокупностью параметров, которая будет подана на вход, будем называть «образом». Выходные сигналы будут лежать в рамках значений активационной функции, выбранной для нейронной сети. Следовательно, образ на входе должен лежать в том же интервале, что и выход. Чаще всего рекомендуется преобразовать входные данные таким образом, чтобы значения каждого ряда лежали в пределах отрезка [0,1].
Рассмотрим простейший способ формирования входных образов для обучения нейронной сети. Основным понятием при работе по принципу авторегрессионной модели является «глубина погружения», то есть то количество лагов, которое будет рассматриваться нейронной сетью. Например, при работе с дневной динамикой курсов валют, глубина погружения размером 7 будет означать, что исследователя интересует динамика курса за последнюю неделю и ее влияние на будущую котировку. Количество входов для нейронной сети должно равняться количеству параметров, которые будут поданы на вход. Количество же нейронов на выходе определяется размерностью вектора выходов в задаче.
Суть метода формирования входных образов заключается в следующем.
Допустим, что значения каждого ряда входов лежат в некотором интервале, для каждого ряда можно найти его минимум и максимум. В таком случае процесс преобразования входных образов будет описываться следующим уравнением:
После такого преобразования каждый образ, ранее принадлежавший интервалу [Min, Max], теперь лежит в интервале [0,1]. Как можно легко убедиться, после проведения такого преобразования над входными данными, теряется часть информации. Однако при решении задачи значения Min и Max могут быть сохранены, чтобы возможно было потом вернуться к исходному временному ряду. Рассмотрим теперь другие варианты преобразования входных данных.
Одним из наиболее логичных преобразований, позволяющих избежать прямой работы с абсолютными значениями котировок, является переход к первым разностям. Как правило, изменения котировок менее велики по амплитуде и обладают инвариантностью.
Иными словами, при работе с первыми разностями рост в 5 процентных пунктов может быть отложен от любого первоначального состояния системы. При всей удобности и логичности данного метода он не удовлетворяет основному требованию входного образа нейронной сети: первые разности (когда за единицу измерения берутся процентные пункты) не лежат в единичном отрезке. Если же первые разности взять по абсолютной величине, где 1 процентный пункт для валютной пары USDCHF равен 0,0001 франка, то главное условие будет соблюдено. Проблема тогда будет заключаться в том, что входной образ будет слишком мал и нейронная сеть может показать плохие результаты. Идеальным вариантом является набор входных образов, в котором одинаково равномерно представлены как величины, близкие к единицы, так и близкие к нулю. Очень удачным здесь может оказаться первое преобразование, которое нормализует входные образы.
Первый вариант, использующий образы нормализованных котировок, мог бы быть использован для решения задачи прогнозирования, однако здесь возникает проблема со статистической зависимостью элементов входного образа между собой. В эконометрической части данного исследования было установлено, что наиболее верной моделью для объяснения котировок валютного рынка является модель «случайного блуждания», нестационарного ряда, смоделированного по принципу «сегодня как вчера».
В таком случае первый вариант нормализации данных не может быть использован в решении задачи прогнозирования, потому что смежные котировки ~ будут зависимы между собой.
Первые разности являются статистически независимыми друг с другом, кореллограмма ряда больше всего напоминает процесс «белого шума» (white noise).
Можно заключить, что статистической зависимости между элементами входного образа нет.
Другие варианты представления входных образов основываются не на росте и изменении котировок, а на их приросте, то есть процентном изменении к предыдущему периоду. В таком случае формула перехода будет иметь следующий вид:
Если при анализе статистической зависимости данных входного образа выяснится, что приросты также влияют друг на друга, то взятие логарифма от отношения настоящей котировки и предыдущей, как правило, обладает наибольшей статистической независимостью.
Существует еще один способ представления входных данных, построенный по принципу экспертных оценок или нечеткой логики. При методе экспертных оценок исследователь вправе сам входным образам ставить в соответствие числа от 0 до 1, согласно принятым им правилам. Данный метод может оказаться довольно точным при квалифицированном подходе, однако требует больших временных затрат, ведь целью исследователя остается передача наиболее ресурсоемких задач технике. Отсюда возникает вопрос о вводе транзитивной функции, которая смогла бы отобразить множество входных образов в единичный гиперкуб. Для решения данной задачи подходит теория нечеткой логики. Скажем несколько слов о самой теории перед тем, как перейти к ее применению для преобразования входных данных.
Современные вычислительные машины построены по принципу четкой логики, в то время как человеческая мыслительная система действует по принципу нечеткой логики.
Смысл ее заключается в способности суждений, отнесению объектов и явлений к классам, в которых нет четких границ. Когда компьютер хранит информацию о возрасте человека, человек может судить о том, что этот человек скорее молод, чем стар. Аппарат нечеткой логики может научить компьютер выдавать суждения о том, что некий объект скорее маленький, чем большой, возможность оценивать при недостатке точных данных об объекте.
Возвращаясь к стоящей перед нами задаче, отметим, что экспертные оценки о каждом объекте могут быть заменены преобразованиями из раздела нечеткой логики. При анализе котировок в виде часовых свечей можно ввести понятие большая белая свеча, средняя белая свеча, маленькая белая свеча, около нулевая свеча, маленькая черная свеча, средняя черная свеча, большая черная свеча. Как можно убедиться, эти понятия сугубо индивидуальны, хотя между суждениями различных исследователей могут иметь много схожего. Для того чтобы компьютер смог провести процесс преобразования из свечей с точными показателями в условные свечи, необходимо определить, что будем включать в каждое понятие. Логичным будет ввести не только абсолютные критерии, но и значения предыдущих свечей, чтобы учесть относительность понятий. На выходе можно получить семимерный вектор, каждый элемент которого будет лежать от 0 до 1. каждое число будет мерой (или вероятностью) отнесения конкретной свечи к тому или иному классу. Путем несложных преобразований (лучше всего ввести весовые коэффициенты, которые помогут преобразовать данные для нейронной сети) получаем данные для входа нейронной сети.
Рассмотрим простой пример.
(0,48;0,97;0,34;0,12;0,01;0,01;0,01), то данная свеча с весом 0.48 большая белая, 0. средняя белая, 0.34 маленькая белая, 0.12 около нулевая, 0.1 что черная всех видов соответственно. Теперь сопоставим весовые коэффициенты к каждому элементу вектора так, чтобы большой белой свечке соответствовало число, близкое к единице, а большой черной – близкое к нулю (если использовать другую активационную функцию, например, тангенса, то входы можно заключить в отрезок от 1 до -1, и большой черной свече будет соответствовать число, близкое к -1).
На данный момент существует много способов перекодировки данных входных образов, которые используются в задачах прогнозирования. Один из таких методов состоит из двух шагов. На первом шаге первые разности котировок умножаются на константу, например, на 10000, чтобы изменение стало целым числом. Иными словами:
x новый = xt 10000. На втором шаге данные преобразуются функцией сигмоидом, обычно используемой в слоях нейронной сети: ~ = Разобьем задачу для нейросети на пункты:
Рисунок 2.2.2.1.Иллюстрация алгоритма работы с нейросетью.
Нейронная сеть не может решать задачу, поставлес нейросетьюнную в представленных в определенной форме. Сильно упростив процесс постановки задачи, можно считать, что необходимо определить, что следует дать на вход сети, а что на выход.
Число входов лучше взять с запасом, будет даже лучше, если список окажется избыточным. Связано это с тем, что нельзя заранее определить, какая из зависимых переменных лучше всего объясняет выход.
После определения структуры задачи, выявив, какие данные необходимы для входа и для выхода будущей нейронной сети, исследователь должен собрать ряды данных для последующего анализа. Также важно отметить, что данные различных рядов должны быть сопоставимы друг с другом. Здесь выбирается размер выборки, с которой будет в дальнейшем работать исследователь.
Преобразование данных под нейронную сеть.
К сожалению, данные в их обычном представлении не могут быть поданы на вход нейронной сети. Обычно на вход могут быть поданы числа, лежащие в отрезке [0,1].
Отсюда возникает инвариантность представления входных данных, даже если речь первоначально шла лишь об одном ряде входных данных. Существует множество методов нормализации данных, которые позволяют терять минимум информации о первоначальном ряде. Ввиду наличия большого количества вариантов, как традиционных, так и менее традиционных, данный пункт дает исследователю большое пространство для творчества и индивидуализации исследовательской работы.
Выбор конфигурации нейронной сети.
После преобразования данных под возможности нейронной сети, исследователь переходит к выбору конфигурации самой нейронной сети. На данный момент изучено большое количество нейросетевых конфигураций (парадигм), каждая из которых приспособлена к решению той или иной задачи. Внутри каждой парадигмы также существует множество вариантов для построения нейронной сети. На данном этапе выбирается преимущественно количество слоев нейронов, количество нейронов в одном слое. Успешное выполнение этого пункта зависит от опыта исследователя, а также от времени, которое он потратит на анализ способностей каждой из выбранных конфигураций. К сожалению, на данный момент существуют руководства к выбору конфигураций нейронных сетей, базирующиеся не на теоретических, а на эмпирических результатах.
В большинстве случаев, как уже было замечено ранее, для решения задачи прогнозирование больше всего подходит класс нейронных сетей типа «многослойный персептрон».
Существует несколько способов обучения нейронной сети. Наиболее распространенный из них – обучение с учителем. Данный метод построен по следующему принципу: на вход подаются некоторые данные, в результате преобразований получаются некоторый выход. Этот выход сравнивается с эталоном (с реальным выходом, который должен получиться в результате обучения), вычисляется отклонение результата от эталона (просчитывается ошибка нейронной сети). После вычисления ошибки веса изменяются, чтобы выход был больше похож на идеал, после чего процедура повторяется достаточное количество раз, чтобы минимизировать ошибку.
В результате пунктов 1-5 исследователь располагает несколькими нейронными сетями, которые показали себя наиболее успешно в решении поставленной задачи. В пункте при помощи нейронной сети решают задачу, поставленную в первом пункте. Если перед исследователем стоит задача прогнозирования, то результатом является значение ряда в следующий момент времени. Анализ же заключается в том, чтобы оценить качество полученного прогноза.