Реферат: Модели стационарных временных рядов и их индефикация. Яковлева А.В. Эконометрика Линейные модели стационарного временного ряда Модели нестандартных временных рядов и их идентификация

Стохастический временной ряд называется стационарным, если его математическое ожидание, дисперсия, автоковариация и автокорреляция будут неизменными во времени.

К основным линейным моделям стационарных временных рядов ᴏᴛʜᴏϲᴙтся:

  1. модели авторегрессии;
  2. модели скользящего среднего;
  3. модели авторегрессии скользящего среднего.

Уровень временного ряда, представленного моделью авторегрессии порядка р , можно представить следующим образом:

y t =δ 1 y t-1 +δ 2 y t-2 +…+δ p y t–p +ν t ,

ν t белый шум (случайная величина с нулевым математическим ожиданием)

На практике чаще всего могут быть использованы модели авторегрессии первого, второго, максимум третьего порядков.

Модель авторегрессии первого порядка АР(1) называется “Марковским процессом”, потому что значения переменной y в текущий момент времени t зависят только от значений переменной y в предыдущий момент времени (t–1) Данная модель имеет вид:

y t =δy t–1 +ν t .

Для модели АР(1) действует ограничение |δ|<1 .

y t =δ 1 y t-1 +δ 2 y t-2 +ν t .

  1. (δ 1 +δ 2)<1;
  2. (δ 1 –δ 2)<1;
  3. |δ 2 |<1 .

Модели скользящего среднего ᴏᴛʜᴏϲᴙтся к простому классу моделей временных рядов с конечным числом параметров, кᴏᴛᴏᴩые можно получить, представив уровень временного ряда как алгебраическую сумму членов ряда белого шума с числом слагаемых q .

Общая модель скользящего среднего порядка q имеет вид:

y t =ν t –φ 1 ν t–1 –φ2ν t–2 –…–φqν t –q,

где q – порядок модели скользящего среднего;

φ t – неизвестные коэффициенты модели, подлежащие оцениванию;

ν t – белый шум.

Модель скользящего среднего порядка q обозначается как CC(q) или MA(q)

На практике чаще всего могут быть использованы модели скользящего среднего первого CC(1) и второго порядков CC(2)

Коэффициенты модели скользящего среднего порядка q не обязательно должны в сумме давать единицу и не обязательно должны быть положительными.

Для достижения большей гибкости модели временных рядов при эконометрическом моделировании в неё включают как члены авторегрессии, так и члены скользящего среднего. Подобные модели получили название смешанных моделей авторегрессии скользящего среднего и также ᴏᴛʜᴏϲᴙтся к линейным моделям стационарных временных рядов.

Чаще всего на практике используется смешанная модель АРСС(1) с одним параметром авторегрессии p=1 и одним параметром скользящего среднего q=1 . Данная модель имеет вид:

y t =δy t–1 +ν t –φν t–1 ,

φ – параметр процесса скользящего среднего;

ν t – белый шум.

На коэффициенты данной модели накладываются следующие ограничения:

  1. |δ|<1 – условие, обеспечивающее стационарность смешанной модели;
  2. | φ|‹1 – условие, обеспечивающее обратимость смешанной модели.

Свойство обратимости смешанной модели АРСС(p,q) означает, что модель скользящего среднего можно обратить или переписать в виде модели авторегрессии неограниченного порядка, и наоборот.

Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов.

Временной ряд y t (t= 1,2,…,n) называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей n наблюдений y 1 ,y­ 2 ,…..,y n такое же, как и n наблюдений y 1+ t ,y 2+ t ,....y n + t при любых n, t и t. Другими словами, свойства строго стационарных рядов y t не зависит от момента t, т.е. закон распределения и его числовые характеристики не зависят от t. Следовательно, математическое ожидание a y (t) = a, среднее квадратическое отклонение s у (t) = s могут быть оценены по наблюдениям y t (t= 1,2,…,n) по формулам:

(6.3)

Простейшим примером стационарного временного ряда , у которого математическое ожидание равно нулю, а ошибок e t некоррелированы , является «белый шум» . Следовательно, можно сказать, что возмущения (ошибки) e t в классической линейной регрессионной модели образуют белый шум , а в случае их нормального распределения – нормальный (гауссовский ) белый шум.

Степень тесноты связи между последовательностями наблюдений временного ряда y 1 ,y­ 2 ,…..,y n и y 1+ t ,y 2+ t ,....y n + t (сдвинутых относительно друг от друга на e единиц, или, как говорят, с лагом t) может быть определена с помощью коэффициента корреляции

(6.4)

ибо

Так как коэффициент r(t) измеряет корреляцию между членами одного и того же ряда, его называют коэффициентом автокорреляции , а зависимость r(t) – автокорреляционной функцией . В силу стационарности временного ряда y t (t= 1,2,…,n) автокорреляционная функция r(t) зависит только от лага t, причем корреляционная функция r(- t) = r(t) , т.е. при изучение r(t) можно ограничиться рассмотрением только положительных значений t.

Статистической оценкой r(t) является выборочный коэффициент автокорреляции r(t), определяемый по формуле коэффициента корреляции (3.20), в которой x i = y t , y i = y t + t , a n заменяется на n - t:

Функцию r(t) называют выборочной автокорреляционной функцией , а ее график - коррелограммой .

При расчете r(t) следует помнить, что с увеличением t число n - t пар наблюдений y t ,y t + t уменьшается, поэтому лаг t должен быть таким, чтобы число n - t было достаточным для определения r(t). Обычно ориентируются на соотношение t £ n/4.

Для стационарного временного ряда с увеличением лага t взаимосвязь членов временного ряда y t и y t + t ослабевает и автокорреляционная функция r(t) должна убывать (по абсолютной величине). В тоже время для ее выборочного (эмпирического) аналога r(t), особенно при небольшом числе пар наблюдений n - t , свойство монотонного убывания, (по абсолютной величине) при возрастании t может нарушаться.

Наряду с автокорреляционной функцией при исследовании стационарных временных рядов рассматривается частная автокорреляционная функция r част (t), где r част (t) есть частный коэффициент корреляции между членами временного ряда y t и y t + t при устранении (элиминировании) влияния промежуточных (между y t и y t + t) членов.

Статистической оценкой r част (t) является выборочная частная автокорреляционная r част (t) где r част (t) – выборочный частный коэффициент корреляции, определяемый по формуле (5.21) или (5.22).Например, выборочный частный коэффициент автокорреляции 1-го порядка между членами временного ряда y t и y t + t при устранении влияния y t +1 может быть вычислен по формулу (5.22):

Где r(1) , r (1,2) ,r(2) – выборочные коэффициенты автокорреляции между y t и y t +1 , y t +1 и y t +2 , y t и y t +2 , t = 1,….,n.

Пример 6.1. По данным табл. 6.1 для временного ряда y t найти среднее значение, среднее квадратическое отклонение, коэффициенты автокорреляции 1-го порядка.

Решение. Среднее значение временного ряда находим по формуле (6.2):

Дисперсию и среднее квадратическое отклонение можно вычислить по формуле (6.3), но в данном случае проще использовать соотношение

где

Найдем коэффициент автокорреляции r(t) временного ряда (для лага t = 1), т.е. коэффициент корреляции между последовательностями семи пар наблюдений y t и y t + t (t = 1,2….,7).

Алгоритм построения модели временного ряда на примере аддитивной и мультипликативной моделей

Алгоритм построения модели временного ряда, включающего циклические колебания, состоит из основных этапов, содержание которых несколько отличается для аддитивной и мультипликативной моделей.

Упростим модель, введя одно обозначение для циклической составляющей ряда, независимо от длительности цикла, или от ее сезонной или конъюнктурной природы. Обозначим ее s t . Тогда аддитивная модель примет вид y t = u t + s t + e t , а мультипликативная - y t = u t * s t * e t .

Итак, основные этапы построения модели:

1) Сглаживание исходного ряда на основе средних, которые рассчитываются за промежуток времени, соответствующий длительности цикла.

2) Определение значений циклической или сезонной компоненты (более подробно см. Елисеева И.И., Курышева С.В., Костеева Т.В. и др. Эконометрика: Учебник. – М.: Финансы и статистика, 2001. – С. 242-251). Для аддитивной модели сумма значений этой компоненты за все периоды одного цикла должна равняться нулю, а в мультипликативной модели – числу периодов в цикле. За счет этого обеспечивается взаимопогашаемость циклической компоненты.

3) Устранение из модели циклических компонент. В аддитивной модели оно осуществляется путем вычитания, после чего модель примет вид y t = u t + e t . В мультипликативной модели оно осуществляется путем деления, после чего модель примет вид y t = u t * e t .

4) Аналитическое выравнивание полученного ряда y t = u t + e t или y t = u t * e t на основе построения уравнения тренда y t = f(t).

5) К полученным уровням ряда прибавляют циклическую компоненту (в случае аддитивной модели) или умножают их на нее (в случае мультипликативной модели): y t = f(t) + s t или y t = f(t) * s t .

6) Сравнение расчетных значений уровней ряда, полученных с помощью построенной модели, с фактическими значениями. Оценка полученной модели, расчет ошибок.

Временные ряды имеют стохастическую природу и, соответственно, для них могут быть рассчитаны различные вероятностные характеристики.

Стационарный временной ряд – это временной ряд, для которого все вероятностные характеристики постоянны.

Это означает, что какой бы фрагмент временного ряда мы не взяли, вероятностные характеристики значений показателя будут такими же, как и для любого другого временного промежутка этого ряда. Трендовая компонента в стационарном ряду отсутствует.

Нестационарный временной ряд этим свойством не обладает.

Наглядно стационарный и нестационарный временные ряды представлены на рисунке 5.1.

Различают понятия слабой и строгой стационарности . Чтобы считать ряд слабо стационарным, или стационарным в широком смысле слова, достаточно, чтобы он имел постоянные математическое ожидание, дисперсию и коэффициенты автокорреляции. Для более строгого определения стационарности необходимо постоянство и других вероятностных характеристик (функция распределения должна быть одинаковой), которые подробно изучаются в курсе теории вероятностей.



Следует помнить, что любой строго стационарный ряд является и слабо стационарным, но не наоборот. Таким образом, пересечение (общая часть) множества слабо стационарных рядов и множества строго стационарных рядов представляет собой множество строго стационарных рядов. Объединение множества слабо стационарных рядов и множества строго стационарных рядов – множество слабо стационарных рядов (потому что строго стационарные ряды входят в слабо стационарные).

Примером стационарного временного ряда может быть «белый шум» в регрессионных моделях (т.е. упорядоченные во времени значения случайной компоненты, для которых математическое ожидание и дисперсия постоянны (в этом случае ожидаемое значение остатка равно нулю), и эти значения некоррелированы друг с другом).

Эргодические ряды. Важным свойством некоторых стационарных рядов является свойство эргодичности . Суть этого свойства заключается в том, что для эргодического ряда математическое ожидание его уровней в пространстве совпадает с математическим ожиданием его уровней во времени.

Пусть для слабо стационарного процесса в любой момент времени t математическое ожидание значения М(y t) = µ (это математическое ожидание в пространстве). Математическое ожидание во времени представляет собой среднее из n значений временного ряда при n ® ¥. Если , то такой ряд – эргодический.

Иными словами, для стационарного временного ряда среднее значение по множеству реализаций для заданных моментов времени равно среднему по времени, вычисленному по одной реализации.

ВВЕДЕНИЕ

Существующие модели временных рядов широко используются в процессе изучения динамики реальных явлений различной природы. Они зачастую применяются в исследованиях динамики грузо - и пассажиропотоков, товарных и складских запасов, миграционных процессов, анализе химических процессов, моделировании разнообразных природных событий. Наиболее активно модели временных рядов применяются в анализе финансовых рынков, при оценке изменений финансовых показателей, прогнозировании цен на различные товары, курсов акций, соотношений курсов валют и т. п.

Широкий круг реальных общественных и естественных процессов обычно может быть представлен набором последовательных значений оцениваемого показателя у 1 , у 2 ,..., у t ,..., у Т, которые фиксируются в определенные моменты времени t=1,2,... Т, так что интервал (t, t+1) является постоянным. Указанный набор значений у t , t=1,2,... обычно называется временным рядом (временной серией). Такой ряд представляет собой дискретный временной процесс.

Изменения значений у t во времени в реальной жизни обычно происходят под воздействием каких-либо причин, факторов. Однако их многообразие, сложность измерения, неопределенность в предположениях о существовании взаимосвязей с переменной у значительно затрудняет обоснование и построение «подходящей» для описания процесса у t , t=1,2,... многофакторной эконометрической модели классического типа. Поэтому часто выдвигается предположение о том, что совокупное влияние этих факторов формирует внутренние закономерности в отношении процесса у t .

Такое предположение направлено на применение для описания реальных временных процессов эконометрических моделей из специфического класса моделей временных рядов.

МОДЕЛИ СТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ

Особенности стационарных временных рядов и тесты на стационарность

Все модели временных рядов имеют общее свойство, которое основано на предположении значительной зависимости текущего значения уровня показателя y t от его предыстории. Иными словами уровень показателя y t генерируется значениями y t-1 , y t-2 ,... на базе характерных для данного временного ряда закономерностях.

Указанное допущение выражается общим уравнением:

y t = f(y t-1 , y t-2 , …) + t (1.1)

где t - ошибка модели в момент t.

Здесь функция f отражает характер взаимосвязей, существующих в рассматриваемом временном ряду у t , t=1,2,... Удачный подбор функции f обусловливает высокую степень приближения правой «детерминированной» части выражения (1.1) к реальным значениям ряда. Степень этого приближения обычно характеризуется оценками и свойствами ошибки ряда t , t=1,2,... в данном случае имеется в виду, прежде всего минимальная дисперсия, соответствие белому шуму и т. п.

Для широкого круга процессов функция f имеет линейный вид. Например,

y t = а 1 y t-1 + а n y t-n + t .

Линейные модели временных рядов применяются, как правило, для описания стационарных процессов, при этом имеются в виду стационарные процессы второго порядка. У стационарного процесса n-го порядка значения всех своих моментов порядка n и ниже на всех временных отрезках, входящих в интервал t=1,2,..., Т отличаются постоянством. Строго стационарные процессы отличаются тем, что у них моменты всех порядков постоянны. Из сказанного следует, что для любых двух интервалов времени (Т 1 , Т 2) и (Т 3 , Т 4) для стационарного процесса второго порядка у t должны выполняться условия:

равенство математических ожиданий;

Равенство дисперсий;

Равенство однопорядковых коэффициентов автокорреляций.

Математически данные условия выражаются соотношениями:


где - оценки математических ожиданий;

D 1 (y), D 2 (y) - оценки дисперсий;

Оценки коэффициентов автокорреляции i-го порядка процесса у t на 1-ом и на 2-ом интервалах соответственно;

Среднее значение процесса (оценка математического ожидания) на интервале (1,Т);

D(y) - оценка дисперсии процесса на интервале (1,Т).

При реальном изучении стационарных временных рядов равенства (1.2)-(1.4) рассматриваются в статистическом смысле. Это дает основания утверждать, что даже при неполном соответствии равенство гипотеза о постоянстве математического ожидания процесса у t может быть принята в случае удовлетворения значений и определенному статистическому критерию.

С целью проверки соответствия временного ряда у t , t=1,2,... стационарному процессу и выполнимости условий (1.2)-(1.4) применяются различные тесты. Если результаты одного из них не дают возможности утверждать об истинности или ложности выдвинутой гипотезы, то может возникнуть необходимость использовать несколько тестов для проверки одного и того же условия.

Всю совокупность тестов на стационарность временных рядов можно разделить на три основные группы: непараметрические, полупараметрические и параметрические тесты.

Непараметрические тесты не выдвигают заранее каких-либо сведений о законе распределения тестируемого временного ряда, его параметрах. Они основаны на изучении взаимосвязей между порядками следования образующих его значений, позволяют выявить наличие или отсутствие закономерностей в продолжительности и (или) чередовании их серий, образованных, например, последовательностями единиц совокупности с одинаковыми знаками, сменой знаков у этих единиц и т.п.

В полупараметрических тестах используются относительно слабые предположения о характере распределения значений временного ряда. Они отражают общие свойства функции распределения приростов значений ряда - симметричности, расположения квантилей.

При использовании методов этой группы оценки параметров распределения оцениваются по порядковым статистикам: среднее по медиане, среднеквадратическое отклонение - по размаху уровней ряда и т. п.

Параметрические тесты используют при относительно строгих предположениях о законе распределения временного ряда и его параметров. Данные тесты позволяют оценить степень приближенности эмпирических (наблюдаемых) характеристик распределения временного ряда к рассчитанным теоретическим уровням.

Именно эта степень приближенности позволяет принять или отвергнуть гипотезу о соответствии свойств рассматриваемого ряда стационарному процессу.

Достаточно часто экономические показатели, представленные в виде временного ряда, имеют сложную структуру. Моделирование таких рядов путем построения модели тренда, сезонности и периодической составляющей не приводит к удовлетворительным результатам. Ряд остатков часто имеет статистические закономерности. Наиболее распространенными моделями стационарных рядов являются модели авторегрессии и модели скользящего среднего.

Будем рассматривать класс стационарных временных рядов. Задача состоит в построении модели остатков временного ряда u t и прогнозирования его значений.

Авторегрессионная модель предназначена для описания стационарных временных рядов. Стационарный процесс удовлетворяет уравнению авторегрессии бесконечного порядка с достаточно быстро убывающими коэффициентами. В частности поэтому авторегрессионная модель достаточно высокого порядка может хорошо аппроксимировать почти любой стационарный процесс. В связи с этим модель авторегрессии часто применяется для моделирования остатков в той или иной параметрической модели, например регрессионной модели или модели тренда.

Марковскими называются процессы, в которых состояние объекта в каждый следующий момент времени определяется только состоянием в настоящий момент и не зависит от того, каким путем объект достиг этого состояния. В терминах корреляционного анализа для временных рядов марковский процесс можно описать следующим образом: существует статистически значимая корреляционная связь исходного ряда с рядом, сдвинутым на один временной интервал, и отсутствует с рядами, сдвинутыми на два, три и т. д. временных интервала. В идеальном случае эти коэффициенты корреляции равны нулю.

u (t )=m u (t -1)+e (t ) , (5.1)

где m - числовой коэффициент |m |<1, e (t ) – последовательность случайных величин, образующих «белый шум» (E(e (t ))=0, E(e (t )e (t +t))=).

Модель (5.1) называется также марковским процессом.

E (u (t ))º0. (5.2)

r (u (t )u (t ±t ))=m t . (5.3)

D u (t )=s 2 /(1-m 2). (5.4)

cov(u (t )u (t ±t))=m t D u (t ). (5.5)

Из (5.3) следует, что при |m | близком к единице дисперсия u (t ) будет намного больше дисперсии e t . Это значит (учитывая (5.2) m =r (u (t )u (t ±1))=r (1), т.е. параметр m может быть интерпретирован как значение автокорреляции первого порядка), что в случае сильной корреляции соседних значений ряда u (t ) ряд слабых возмущений e t будет порождать размашистые колебания остатков u (t ).

Условие стационарности ряда (5.1) определяется требованием |m |<1.


Автокорреляционная функция (АКФ) r (t ) марковского процесса определяется соотношением (5.3).

Частная автокорреляционная функция

r част (t )=r (u (t )u (t +t )) | u (t+ 1)=u (t+ 2)=…=u (t+t -1)=0

может быть вычислена по формуле: r част (2)=(r (2)-r 2 (1))/(1-r 2 (1)). Для второго и выше порядков (см. , с. 413, 414) должно быть r част (t )=0 "t =2,3,… . Это удобно использовать для подбора модели (5.1): если вычисленные по оцененным невязкам u (t )=y t -выборочные частные корреляции статистически незначимо отличаются от нуля при t =2,3,…, то использование модели AR (1) для описания случайных остатков не противоречит исходным данным.

Идентификация модели. Требуется статистически оценить параметры m и s 2 модели (5.1) по имеющимся значениям исходного ряда y t .