Реферат: Модели стационарных временных рядов и их индефикация. Яковлева А.В. Эконометрика Линейные модели стационарного временного ряда Модели нестандартных временных рядов и их идентификация
Стохастический временной ряд называется стационарным, если его математическое ожидание, дисперсия, автоковариация и автокорреляция будут неизменными во времени.
К основным линейным моделям стационарных временных рядов ᴏᴛʜᴏϲᴙтся:
- модели авторегрессии;
- модели скользящего среднего;
- модели авторегрессии скользящего среднего.
Уровень временного ряда, представленного моделью авторегрессии порядка р , можно представить следующим образом:
y t =δ 1 y t-1 +δ 2 y t-2 +…+δ p y t–p +ν t ,
ν t – белый шум (случайная величина с нулевым математическим ожиданием)
На практике чаще всего могут быть использованы модели авторегрессии первого, второго, максимум третьего порядков.
Модель авторегрессии первого порядка АР(1) называется “Марковским процессом”, потому что значения переменной y в текущий момент времени t зависят только от значений переменной y в предыдущий момент времени (t–1) Данная модель имеет вид:
y t =δy t–1 +ν t .
Для модели АР(1) действует ограничение |δ|<1 .
y t =δ 1 y t-1 +δ 2 y t-2 +ν t .
- (δ 1 +δ 2)<1;
- (δ 1 –δ 2)<1;
- |δ 2 |<1 .
Модели скользящего среднего ᴏᴛʜᴏϲᴙтся к простому классу моделей временных рядов с конечным числом параметров, кᴏᴛᴏᴩые можно получить, представив уровень временного ряда как алгебраическую сумму членов ряда белого шума с числом слагаемых q .
Общая модель скользящего среднего порядка q имеет вид:
y t =ν t –φ 1 ν t–1 –φ2ν t–2 –…–φqν t –q,
где q – порядок модели скользящего среднего;
φ t – неизвестные коэффициенты модели, подлежащие оцениванию;
ν t – белый шум.
Модель скользящего среднего порядка q обозначается как CC(q) или MA(q)
На практике чаще всего могут быть использованы модели скользящего среднего первого CC(1) и второго порядков CC(2)
Коэффициенты модели скользящего среднего порядка q не обязательно должны в сумме давать единицу и не обязательно должны быть положительными.
Для достижения большей гибкости модели временных рядов при эконометрическом моделировании в неё включают как члены авторегрессии, так и члены скользящего среднего. Подобные модели получили название смешанных моделей авторегрессии скользящего среднего и также ᴏᴛʜᴏϲᴙтся к линейным моделям стационарных временных рядов.
Чаще всего на практике используется смешанная модель АРСС(1) с одним параметром авторегрессии p=1 и одним параметром скользящего среднего q=1 . Данная модель имеет вид:
y t =δy t–1 +ν t –φν t–1 ,
φ – параметр процесса скользящего среднего;
ν t – белый шум.
На коэффициенты данной модели накладываются следующие ограничения:
- |δ|<1 – условие, обеспечивающее стационарность смешанной модели;
- | φ|‹1 – условие, обеспечивающее обратимость смешанной модели.
Свойство обратимости смешанной модели АРСС(p,q) означает, что модель скользящего среднего можно обратить или переписать в виде модели авторегрессии неограниченного порядка, и наоборот.
Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов.
Временной ряд y t (t= 1,2,…,n) называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей n наблюдений y 1 ,y 2 ,…..,y n такое же, как и n наблюдений y 1+ t ,y 2+ t ,....y n + t при любых n, t и t. Другими словами, свойства строго стационарных рядов y t не зависит от момента t, т.е. закон распределения и его числовые характеристики не зависят от t. Следовательно, математическое ожидание a y (t) = a, среднее квадратическое отклонение s у (t) = s могут быть оценены по наблюдениям y t (t= 1,2,…,n) по формулам:
(6.3)
Простейшим примером стационарного временного ряда , у которого математическое ожидание равно нулю, а ошибок e t некоррелированы , является «белый шум» . Следовательно, можно сказать, что возмущения (ошибки) e t в классической линейной регрессионной модели образуют белый шум , а в случае их нормального распределения – нормальный (гауссовский ) белый шум.
Степень тесноты связи между последовательностями наблюдений временного ряда y 1 ,y 2 ,…..,y n и y 1+ t ,y 2+ t ,....y n + t (сдвинутых относительно друг от друга на e единиц, или, как говорят, с лагом t) может быть определена с помощью коэффициента корреляции
(6.4)
ибо
Так как коэффициент r(t) измеряет корреляцию между членами одного и того же ряда, его называют коэффициентом автокорреляции , а зависимость r(t) – автокорреляционной функцией . В силу стационарности временного ряда y t (t= 1,2,…,n) автокорреляционная функция r(t) зависит только от лага t, причем корреляционная функция r(- t) = r(t) , т.е. при изучение r(t) можно ограничиться рассмотрением только положительных значений t.
Статистической оценкой r(t) является выборочный коэффициент автокорреляции r(t), определяемый по формуле коэффициента корреляции (3.20), в которой x i = y t , y i = y t + t , a n заменяется на n - t:
Функцию r(t) называют выборочной автокорреляционной функцией , а ее график - коррелограммой .
При расчете r(t) следует помнить, что с увеличением t число n - t пар наблюдений y t ,y t + t уменьшается, поэтому лаг t должен быть таким, чтобы число n - t было достаточным для определения r(t). Обычно ориентируются на соотношение t £ n/4.
Для стационарного временного ряда с увеличением лага t взаимосвязь членов временного ряда y t и y t + t ослабевает и автокорреляционная функция r(t) должна убывать (по абсолютной величине). В тоже время для ее выборочного (эмпирического) аналога r(t), особенно при небольшом числе пар наблюдений n - t , свойство монотонного убывания, (по абсолютной величине) при возрастании t может нарушаться.
Наряду с автокорреляционной функцией при исследовании стационарных временных рядов рассматривается частная автокорреляционная функция r част (t), где r част (t) есть частный коэффициент корреляции между членами временного ряда y t и y t + t при устранении (элиминировании) влияния промежуточных (между y t и y t + t) членов.
Статистической оценкой r част (t) является выборочная частная автокорреляционная r част (t) где r част (t) – выборочный частный коэффициент корреляции, определяемый по формуле (5.21) или (5.22).Например, выборочный частный коэффициент автокорреляции 1-го порядка между членами временного ряда y t и y t + t при устранении влияния y t +1 может быть вычислен по формулу (5.22):
Где r(1) , r (1,2) ,r(2) – выборочные коэффициенты автокорреляции между y t и y t +1 , y t +1 и y t +2 , y t и y t +2 , t = 1,….,n.
Пример 6.1. По данным табл. 6.1 для временного ряда y t найти среднее значение, среднее квадратическое отклонение, коэффициенты автокорреляции 1-го порядка.
Решение. Среднее значение временного ряда находим по формуле (6.2):
Дисперсию и среднее квадратическое отклонение можно вычислить по формуле (6.3), но в данном случае проще использовать соотношение
где
Найдем коэффициент автокорреляции r(t) временного ряда (для лага t = 1), т.е. коэффициент корреляции между последовательностями семи пар наблюдений y t и y t + t (t = 1,2….,7).
Алгоритм построения модели временного ряда на примере аддитивной и мультипликативной моделей
Алгоритм построения модели временного ряда, включающего циклические колебания, состоит из основных этапов, содержание которых несколько отличается для аддитивной и мультипликативной моделей.
Упростим модель, введя одно обозначение для циклической составляющей ряда, независимо от длительности цикла, или от ее сезонной или конъюнктурной природы. Обозначим ее s t . Тогда аддитивная модель примет вид y t = u t + s t + e t , а мультипликативная - y t = u t * s t * e t .
Итак, основные этапы построения модели:
1) Сглаживание исходного ряда на основе средних, которые рассчитываются за промежуток времени, соответствующий длительности цикла.
2) Определение значений циклической или сезонной компоненты (более подробно см. Елисеева И.И., Курышева С.В., Костеева Т.В. и др. Эконометрика: Учебник. – М.: Финансы и статистика, 2001. – С. 242-251). Для аддитивной модели сумма значений этой компоненты за все периоды одного цикла должна равняться нулю, а в мультипликативной модели – числу периодов в цикле. За счет этого обеспечивается взаимопогашаемость циклической компоненты.
3) Устранение из модели циклических компонент. В аддитивной модели оно осуществляется путем вычитания, после чего модель примет вид y t = u t + e t . В мультипликативной модели оно осуществляется путем деления, после чего модель примет вид y t = u t * e t .
4) Аналитическое выравнивание полученного ряда y t = u t + e t или y t = u t * e t на основе построения уравнения тренда y t = f(t).
5) К полученным уровням ряда прибавляют циклическую компоненту (в случае аддитивной модели) или умножают их на нее (в случае мультипликативной модели): y t = f(t) + s t или y t = f(t) * s t .
6) Сравнение расчетных значений уровней ряда, полученных с помощью построенной модели, с фактическими значениями. Оценка полученной модели, расчет ошибок.
Временные ряды имеют стохастическую природу и, соответственно, для них могут быть рассчитаны различные вероятностные характеристики.
Стационарный временной ряд – это временной ряд, для которого все вероятностные характеристики постоянны.
Это означает, что какой бы фрагмент временного ряда мы не взяли, вероятностные характеристики значений показателя будут такими же, как и для любого другого временного промежутка этого ряда. Трендовая компонента в стационарном ряду отсутствует.
Нестационарный временной ряд этим свойством не обладает.
Наглядно стационарный и нестационарный временные ряды представлены на рисунке 5.1.
Различают понятия слабой и строгой стационарности . Чтобы считать ряд слабо стационарным, или стационарным в широком смысле слова, достаточно, чтобы он имел постоянные математическое ожидание, дисперсию и коэффициенты автокорреляции. Для более строгого определения стационарности необходимо постоянство и других вероятностных характеристик (функция распределения должна быть одинаковой), которые подробно изучаются в курсе теории вероятностей.
Следует помнить, что любой строго стационарный ряд является и слабо стационарным, но не наоборот. Таким образом, пересечение (общая часть) множества слабо стационарных рядов и множества строго стационарных рядов представляет собой множество строго стационарных рядов. Объединение множества слабо стационарных рядов и множества строго стационарных рядов – множество слабо стационарных рядов (потому что строго стационарные ряды входят в слабо стационарные).
Примером стационарного временного ряда может быть «белый шум» в регрессионных моделях (т.е. упорядоченные во времени значения случайной компоненты, для которых математическое ожидание и дисперсия постоянны (в этом случае ожидаемое значение остатка равно нулю), и эти значения некоррелированы друг с другом).
Эргодические ряды. Важным свойством некоторых стационарных рядов является свойство эргодичности . Суть этого свойства заключается в том, что для эргодического ряда математическое ожидание его уровней в пространстве совпадает с математическим ожиданием его уровней во времени.
Пусть для слабо стационарного процесса в любой момент времени t математическое ожидание значения М(y t) = µ (это математическое ожидание в пространстве). Математическое ожидание во времени представляет собой среднее из n значений временного ряда при n ® ¥. Если , то такой ряд – эргодический.
Иными словами, для стационарного временного ряда среднее значение по множеству реализаций для заданных моментов времени равно среднему по времени, вычисленному по одной реализации.
ВВЕДЕНИЕ
Существующие модели временных рядов широко используются в процессе изучения динамики реальных явлений различной природы. Они зачастую применяются в исследованиях динамики грузо - и пассажиропотоков, товарных и складских запасов, миграционных процессов, анализе химических процессов, моделировании разнообразных природных событий. Наиболее активно модели временных рядов применяются в анализе финансовых рынков, при оценке изменений финансовых показателей, прогнозировании цен на различные товары, курсов акций, соотношений курсов валют и т. п.
Широкий круг реальных общественных и естественных процессов обычно может быть представлен набором последовательных значений оцениваемого показателя у 1 , у 2 ,..., у t ,..., у Т, которые фиксируются в определенные моменты времени t=1,2,... Т, так что интервал (t, t+1) является постоянным. Указанный набор значений у t , t=1,2,... обычно называется временным рядом (временной серией). Такой ряд представляет собой дискретный временной процесс.
Изменения значений у t во времени в реальной жизни обычно происходят под воздействием каких-либо причин, факторов. Однако их многообразие, сложность измерения, неопределенность в предположениях о существовании взаимосвязей с переменной у значительно затрудняет обоснование и построение «подходящей» для описания процесса у t , t=1,2,... многофакторной эконометрической модели классического типа. Поэтому часто выдвигается предположение о том, что совокупное влияние этих факторов формирует внутренние закономерности в отношении процесса у t .
Такое предположение направлено на применение для описания реальных временных процессов эконометрических моделей из специфического класса моделей временных рядов.
МОДЕЛИ СТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ
Особенности стационарных временных рядов и тесты на стационарность
Все модели временных рядов имеют общее свойство, которое основано на предположении значительной зависимости текущего значения уровня показателя y t от его предыстории. Иными словами уровень показателя y t генерируется значениями y t-1 , y t-2 ,... на базе характерных для данного временного ряда закономерностях.
Указанное допущение выражается общим уравнением:
y t = f(y t-1 , y t-2 , …) + t (1.1)
где t - ошибка модели в момент t.
Здесь функция f отражает характер взаимосвязей, существующих в рассматриваемом временном ряду у t , t=1,2,... Удачный подбор функции f обусловливает высокую степень приближения правой «детерминированной» части выражения (1.1) к реальным значениям ряда. Степень этого приближения обычно характеризуется оценками и свойствами ошибки ряда t , t=1,2,... в данном случае имеется в виду, прежде всего минимальная дисперсия, соответствие белому шуму и т. п.
Для широкого круга процессов функция f имеет линейный вид. Например,
y t = а 1 y t-1 + а n y t-n + t .
Линейные модели временных рядов применяются, как правило, для описания стационарных процессов, при этом имеются в виду стационарные процессы второго порядка. У стационарного процесса n-го порядка значения всех своих моментов порядка n и ниже на всех временных отрезках, входящих в интервал t=1,2,..., Т отличаются постоянством. Строго стационарные процессы отличаются тем, что у них моменты всех порядков постоянны. Из сказанного следует, что для любых двух интервалов времени (Т 1 , Т 2) и (Т 3 , Т 4) для стационарного процесса второго порядка у t должны выполняться условия:
равенство математических ожиданий;
Равенство дисперсий;
Равенство однопорядковых коэффициентов автокорреляций.
Математически данные условия выражаются соотношениями:
где - оценки математических ожиданий;
D 1 (y), D 2 (y) - оценки дисперсий;
Оценки коэффициентов автокорреляции i-го порядка процесса у t на 1-ом и на 2-ом интервалах соответственно;
Среднее значение процесса (оценка математического ожидания) на интервале (1,Т);
D(y) - оценка дисперсии процесса на интервале (1,Т).
При реальном изучении стационарных временных рядов равенства (1.2)-(1.4) рассматриваются в статистическом смысле. Это дает основания утверждать, что даже при неполном соответствии равенство гипотеза о постоянстве математического ожидания процесса у t может быть принята в случае удовлетворения значений и определенному статистическому критерию.
С целью проверки соответствия временного ряда у t , t=1,2,... стационарному процессу и выполнимости условий (1.2)-(1.4) применяются различные тесты. Если результаты одного из них не дают возможности утверждать об истинности или ложности выдвинутой гипотезы, то может возникнуть необходимость использовать несколько тестов для проверки одного и того же условия.
Всю совокупность тестов на стационарность временных рядов можно разделить на три основные группы: непараметрические, полупараметрические и параметрические тесты.
Непараметрические тесты не выдвигают заранее каких-либо сведений о законе распределения тестируемого временного ряда, его параметрах. Они основаны на изучении взаимосвязей между порядками следования образующих его значений, позволяют выявить наличие или отсутствие закономерностей в продолжительности и (или) чередовании их серий, образованных, например, последовательностями единиц совокупности с одинаковыми знаками, сменой знаков у этих единиц и т.п.
В полупараметрических тестах используются относительно слабые предположения о характере распределения значений временного ряда. Они отражают общие свойства функции распределения приростов значений ряда - симметричности, расположения квантилей.
При использовании методов этой группы оценки параметров распределения оцениваются по порядковым статистикам: среднее по медиане, среднеквадратическое отклонение - по размаху уровней ряда и т. п.
Параметрические тесты используют при относительно строгих предположениях о законе распределения временного ряда и его параметров. Данные тесты позволяют оценить степень приближенности эмпирических (наблюдаемых) характеристик распределения временного ряда к рассчитанным теоретическим уровням.
Именно эта степень приближенности позволяет принять или отвергнуть гипотезу о соответствии свойств рассматриваемого ряда стационарному процессу.
Достаточно часто экономические показатели, представленные в виде временного ряда, имеют сложную структуру. Моделирование таких рядов путем построения модели тренда, сезонности и периодической составляющей не приводит к удовлетворительным результатам. Ряд остатков часто имеет статистические закономерности. Наиболее распространенными моделями стационарных рядов являются модели авторегрессии и модели скользящего среднего.
Будем рассматривать класс стационарных временных рядов. Задача состоит в построении модели остатков временного ряда u t и прогнозирования его значений.
Авторегрессионная модель предназначена для описания стационарных временных рядов. Стационарный процесс удовлетворяет уравнению авторегрессии бесконечного порядка с достаточно быстро убывающими коэффициентами. В частности поэтому авторегрессионная модель достаточно высокого порядка может хорошо аппроксимировать почти любой стационарный процесс. В связи с этим модель авторегрессии часто применяется для моделирования остатков в той или иной параметрической модели, например регрессионной модели или модели тренда.
Марковскими называются процессы, в которых состояние объекта в каждый следующий момент времени определяется только состоянием в настоящий момент и не зависит от того, каким путем объект достиг этого состояния. В терминах корреляционного анализа для временных рядов марковский процесс можно описать следующим образом: существует статистически значимая корреляционная связь исходного ряда с рядом, сдвинутым на один временной интервал, и отсутствует с рядами, сдвинутыми на два, три и т. д. временных интервала. В идеальном случае эти коэффициенты корреляции равны нулю.
u (t )=m u (t -1)+e (t ) , (5.1)
где m - числовой коэффициент |m |<1, e (t ) – последовательность случайных величин, образующих «белый шум» (E(e (t ))=0, E(e (t )e (t +t))=).
Модель (5.1) называется также марковским процессом.
E (u (t ))º0. (5.2)
r (u (t )u (t ±t ))=m t . (5.3)
D u (t )=s 2 /(1-m 2). (5.4)
cov(u (t )u (t ±t))=m t D u (t ). (5.5)
Из (5.3) следует, что при |m | близком к единице дисперсия u (t ) будет намного больше дисперсии e t . Это значит (учитывая (5.2) m =r (u (t )u (t ±1))=r (1), т.е. параметр m может быть интерпретирован как значение автокорреляции первого порядка), что в случае сильной корреляции соседних значений ряда u (t ) ряд слабых возмущений e t будет порождать размашистые колебания остатков u (t ).
Условие стационарности ряда (5.1) определяется требованием |m |<1.
Автокорреляционная функция (АКФ) r (t ) марковского процесса определяется соотношением (5.3).
Частная автокорреляционная функция
r част (t )=r (u (t )u (t +t )) | u (t+ 1)=u (t+ 2)=…=u (t+t -1)=0
может быть вычислена по формуле: r част (2)=(r (2)-r 2 (1))/(1-r 2 (1)). Для второго и выше порядков (см. , с. 413, 414) должно быть r част (t )=0 "t =2,3,… . Это удобно использовать для подбора модели (5.1): если вычисленные по оцененным невязкам u (t )=y t -выборочные частные корреляции статистически незначимо отличаются от нуля при t =2,3,…, то использование модели AR (1) для описания случайных остатков не противоречит исходным данным.
Идентификация модели. Требуется статистически оценить параметры m и s 2 модели (5.1) по имеющимся значениям исходного ряда y t .