Модели нестационарных временных рядов идентификация. Модели стационарных и нестационарных временных рядов. адаптивное прогнозирование. Системы эконометрических уравнений

Достаточно часто экономические показатели, представленные в виде временного ряда, имеют сложную структуру. Моделирование таких рядов путем построения модели тренда, сезонности и периодической составляющей не приводит к удовлетворительным результатам. Ряд остатков часто имеет статистические закономерности. Наиболее распространенными моделями стационарных рядов являются модели авторегрессии и модели скользящего среднего.

Будем рассматривать класс стационарных временных рядов. Задача состоит в построении модели остатков временного ряда u t и прогнозирования его значений.

Авторегрессионная модель предназначена для описания стационарных временных рядов. Стационарный процесс удовлетворяет уравнению авторегрессии бесконечного порядка с достаточно быстро убывающими коэффициентами. В частности поэтому авторегрессионная модель достаточно высокого порядка может хорошо аппроксимировать почти любой стационарный процесс. В связи с этим модель авторегрессии часто применяется для моделирования остатков в той или иной параметрической модели, например регрессионной модели или модели тренда.

Марковскими называются процессы, в которых состояние объекта в каждый следующий момент времени определяется только состоянием в настоящий момент и не зависит от того, каким путем объект достиг этого состояния. В терминах корреляционного анализа для временных рядов марковский процесс можно описать следующим образом: существует статистически значимая корреляционная связь исходного ряда с рядом, сдвинутым на один временной интервал, и отсутствует с рядами, сдвинутыми на два, три и т. д. временных интервала. В идеальном случае эти коэффициенты корреляции равны нулю.

u (t )=m u (t -1)+e (t ) , (5.1)

где m - числовой коэффициент |m |<1, e (t ) – последовательность случайных величин, образующих «белый шум» (E(e (t ))=0, E(e (t )e (t +t))=).

Модель (5.1) называется также марковским процессом.

E (u (t ))º0. (5.2)

r (u (t )u (t ±t ))=m t . (5.3)

D u (t )=s 2 /(1-m 2). (5.4)

cov(u (t )u (t ±t))=m t D u (t ). (5.5)

Из (5.3) следует, что при |m | близком к единице дисперсия u (t ) будет намного больше дисперсии e t . Это значит (учитывая (5.2) m =r (u (t )u (t ±1))=r (1), т.е. параметр m может быть интерпретирован как значение автокорреляции первого порядка), что в случае сильной корреляции соседних значений ряда u (t ) ряд слабых возмущений e t будет порождать размашистые колебания остатков u (t ).

Условие стационарности ряда (5.1) определяется требованием |m |<1.


Автокорреляционная функция (АКФ) r (t ) марковского процесса определяется соотношением (5.3).

Частная автокорреляционная функция

r част (t )=r (u (t )u (t +t )) | u (t+ 1)=u (t+ 2)=…=u (t+t -1)=0

может быть вычислена по формуле: r част (2)=(r (2)-r 2 (1))/(1-r 2 (1)). Для второго и выше порядков (см. , с. 413, 414) должно быть r част (t )=0 "t =2,3,… . Это удобно использовать для подбора модели (5.1): если вычисленные по оцененным невязкам u (t )=y t -выборочные частные корреляции статистически незначимо отличаются от нуля при t =2,3,…, то использование модели AR (1) для описания случайных остатков не противоречит исходным данным.

Идентификация модели. Требуется статистически оценить параметры m и s 2 модели (5.1) по имеющимся значениям исходного ряда y t .

Стохастический временной ряд называется стационарным, если его математическое ожидание, дисперсия, автоковариация и автокорреляция будут неизменными во времени.

К основным линейным моделям стационарных временных рядов ᴏᴛʜᴏϲᴙтся:

  1. модели авторегрессии;
  2. модели скользящего среднего;
  3. модели авторегрессии скользящего среднего.

Уровень временного ряда, представленного моделью авторегрессии порядка р , можно представить следующим образом:

y t =δ 1 y t-1 +δ 2 y t-2 +…+δ p y t–p +ν t ,

ν t – белый шум (случайная величина с нулевым математическим ожиданием)

На практике чаще всего могут быть использованы модели авторегрессии первого, второго, максимум третьего порядков.

Модель авторегрессии первого порядка АР(1) называется “Марковским процессом”, потому что значения переменной y в текущий момент времени t зависят только от значений переменной y в предыдущий момент времени (t–1) Данная модель имеет вид:

y t =δy t–1 +ν t .

Для модели АР(1) действует ограничение |δ|<1 .

y t =δ 1 y t-1 +δ 2 y t-2 +ν t .

  1. (δ 1 +δ 2)<1;
  2. (δ 1 –δ 2)<1;
  3. |δ 2 |<1 .

Модели скользящего среднего ᴏᴛʜᴏϲᴙтся к простому классу моделей временных рядов с конечным числом параметров, кᴏᴛᴏᴩые можно получить, представив уровень временного ряда как алгебраическую сумму членов ряда белого шума с числом слагаемых q .

Общая модель скользящего среднего порядка q имеет вид:

y t =ν t –φ 1 ν t–1 –φ2ν t–2 –…–φqν t –q,

где q – порядок модели скользящего среднего;

φ t – неизвестные коэффициенты модели, подлежащие оцениванию;

ν t – белый шум.

Модель скользящего среднего порядка q обозначается как CC(q) или MA(q)

На практике чаще всего могут быть использованы модели скользящего среднего первого CC(1) и второго порядков CC(2)

Коэффициенты модели скользящего среднего порядка q не обязательно должны в сумме давать единицу и не обязательно должны быть положительными.

Для достижения большей гибкости модели временных рядов при эконометрическом моделировании в неё включают как члены авторегрессии, так и члены скользящего среднего. Подобные модели получили название смешанных моделей авторегрессии скользящего среднего и также ᴏᴛʜᴏϲᴙтся к линейным моделям стационарных временных рядов.

Чаще всего на практике используется смешанная модель АРСС(1) с одним параметром авторегрессии p=1 и одним параметром скользящего среднего q=1 . Данная модель имеет вид:

y t =δy t–1 +ν t –φν t–1 ,

φ – параметр процесса скользящего среднего;

ν t – белый шум.

На коэффициенты данной модели накладываются следующие ограничения:

  1. |δ|<1 – условие, обеспечивающее стационарность смешанной модели;
  2. | φ|‹1 – условие, обеспечивающее обратимость смешанной модели.

Свойство обратимости смешанной модели АРСС(p,q) означает, что модель скользящего среднего можно обратить или переписать в виде модели авторегрессии неограниченного порядка, и наоборот.

Характеристики временных рядов. Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X(t) рассматривается как случайный процесс (с дискретным временем) основными характеристиками являются математическое ожидание X(t), т.е.

дисперсия X(t), т.е.

и автокорреляционная функция временного ряда X(t)

т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X(t) и X(s).

В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k, а потому и все перечисленные выше характеристики временного ряда не меняются со временем. В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s. Временные ряды, не являющиеся стационарными, называются нестационарными.

Под временным рядом понимают упорядоченную во времени последовательность значений одной или конечного множества случайных величин. В первом случае говорят об одномерном временном ряде, во втором - о многомерном временном ряде. Здесь будут рассматриваться только одномерные временные ряды. Одномерный временной ряд называется стационарным, если его вероятностные характеристики постоянны. Временной ряд называется нестационарным, если хотя бы одна из вероятностных характеристик непостоянна. Последовательность случайных величин у 1 , у 2 , . . . или у -1 , у 0 , у 1 , . . называется случайным процессом с дискретным параметром времени.

Поскольку важна последовательность во времени появления следующего значения временного ряда, а не конкретное значение времени появления, то во временных рядах в качестве аргумента используют номер отсчета значения временного ряда. Например:

x(1), x(2), ... ,x(k), ...

где x(k) - значение временного ряда в k-том по порядку наблюдении; k - номер наблюдения.

В большинстве практических приложений рассматривают стационарные и нестационарные по математическому ожиданию временные ряды с нормальным законом распределения значений ряда. Это означает, что:

стационарный ряд: x(k) є (µ, у 2) , µ = const, у 2 = const;

нестационарный ряд: x(k) є (µ, у 2) , µ = var, у 2 = const.

Ниже приведена реализация стационарного временного ряда:

Прогнозируемость временного ряда.

Для прогнозирования временного ряда необходимо построить его модель. Прогнозируемость ряда возможна лишь тогда, когда существует вероятностная (аналитическая) связь последующих значений ряда от предыдущих. Прогнозируемость стационарного временного ряда определяется с помощью автокорреляционной функции (АКФ):

с(m) = M[(x(k) - µ)*(x(k + m) - µ)]/у 2

где: с(m) - значение автокорреляционной функции на сдвиге m временного ряда x(k)

Оценки АКФ ряда имеют вид:

Очевидно, что с(0) = 1, поскольку это корреляция временного ряда на самого себя.

Стационарный временной ряд прогнозируем, если m>0 существует с(m) ? 0.

Стационарный временной ряд непрогнозируем, если для любого m>0 с(m) = 0. Такой ряд называют "белым шумом".

Поскольку, АКФ это значения коэффициентов корреляции, то она является функцией неслучайных значений.

Оценивание АКФ осуществляется по реализации временного ряда. Если реализация содержит n значений, то оценка автокорреляционной функции имеет вид:

где: r(m) - оценка АКФ; x - среднее значение реализации временного ряда; S 2 - оценка дисперсии реализации временного ряда.

При проверке прогнозируемости временного ряда длина реализации должна быть не менее 20 - 30 наблюдений.

Следует обратить внимание, что прогнозирование временных рядов рассмотренным методом предполагает выполнение двух условий:

  • 1. Случайная величина е(k) "белого шума", как составляющая моделей, должна подчиняться нормальному закону распределению с нулевым математическим ожиданием и конечной дисперсией у е 2 .
  • 2. Дисперсия "белого шума" у е 2 должна быть величиной постоянной.

Формула вычисления прогноза имеет вид:

x(k) = 27,2661 - 0,900766*

где x(k) - прогноз по модели k-го значения временного ряда.

Идентификация модели стационарного временного ряда

Идентификация модели. Для прогнозирования будущих показателей на основе имеющихся временных рядов необходимо идентифицировать модель, которая наилучшим образом описывает процесс порождения выборочного временного ряда. Для идентификации такой модели можно воспользоваться расчетной автокорреляционной функцией. Из множества моделей для описания динамики временных рядов чаще всего используются три: модель белого шума, авторегрессионная модель первого порядка и авторегрессионная модель второго порядка. Если расчетная автокорреляционная функция представляет собой совокупность незначимых автокорреляций, это явное указание на то, что изменчивость данного времени n-ого ряда лучше всего охарактеризовать как "белый шум", или случайные флуктуации.

Основная идея, лежащая в основе идентификации модели временного ряда, остается одной и той же и для простых, и для сложных моделей: соответствие структуры наблюдаемых данных известной структуре, связываемой с определенным классом моделей. После того как модель предварительно идентифицирована, производится оценка ее параметров.

Диагностическая проверка. Так как в основе идентификации модели временного ряда лежит до некоторой степени субъективная процедура, иногда рекомендуется оценить адекватность идентифицированной модели путем проверки значимости автокорреляционной функции остатков данной модели. Это целесообразно, поскольку остатки модели временного ряда не являются автокоррелированными.

Однако автокорреляционная функция стационарного временного ряда не позволяет однозначно идентифицировать модель ряда. Это возможно с использованием второй дополнительной функции - частной автокорреляционной функции (ЧАКФ). Значения ЧАКФ - это значение m-го коэффициента в представлении временного ряда процессом авторегрессии порядка m. Пусть имеется стационарный временной ряд x(k). Рассмотрим следующие представления временного ряда через процесс авторегрессии:

x(k) - м = a 11 *

x(k) - м = a 12 * + a 22 *

x(k) - м = a 13 * + a 23 * + a 33 *

... ... ... ... ... ... ... ... ...

x(k) - м = a 1 * + a 2 * + a 33 * + ... + a mm *

Значениями ЧАКФ для сдвигов 1, 2, 3, ..., m являются значения коэффициентов: a 11 , a 22 , a 33 , ..., a mm . График ЧАКФ может иметь вид:

После оценивания ЧАКФ необходимо для каждого m проверить гипотезу о равенстве нулю соответствующего коэффициента частной автокорреляции. В программах статистической обработки данных для каждого из коэффициентов вычисляются критические значения, которые на графике оценки ЧАКФ приобретают вид контрольных границ.

При идентификации модели как правило пользуются следующими правилами:

  • 1. Если h первых значений АКФ отличны от нуля, а ЧАКФ по модулю асимптотически стремится к нулю, то имеет место процесс АРСС(0,h) - скользящего среднего порядка h.
  • 2. Если h первых значений ЧАКФ отличны от нуля, а АКФ по модулю асимптотически стремится к нулю, то имеет место процесс АРСС(h,0) - авторегрессии порядка h.
  • 3. Если значения АКФ и ЧАКФ по модулю асимптотически стремятся к нулю, то имеет место смешанный процесс АРСС(p,q).

Введение……………………………………………………….2

1. Основные задачи анализа временных рядов…………….4

2. Анализ временных рядов………………………………….9

2.2 Неслучайная составляющая временного ряда и методы его сглаживания…………………………………………………11

2.3 Модели стационарных временных рядов и их индефикация…13

2.3.2. Модели скользящего среднего порядка q (MA (q) –модели)….17

Заключение………………………………………………………21

Литература………………………………………………………..23

Введение

В последние годы в эконометрической литературе большое внимание уделяется исследованию рядов динамики временных показателей. Разнообразные содержательные задачи экономического анализа требуют использования статистических данных, характеризующих исследуемые экономические процессы и развернутых во времени в форме временных рядов. При этом нередко одни и те же временные ряды используются для решения разных содержательных проблем.

Далеко не всегда значения временного ряда формируются только под воздействием каких-либо факторов. Нередко бывает, что развитие того или иного процесса обусловлено его внутренними закономерностями, а отклонения от детерминированного процесса вызваны ошибками измерений или случайными флуктуациями. Особый интерес представляют процессы, находящиеся в «переходном» режиме, т.е. процессы, являющиеся по существу «стационарными», но на исследуемом промежутке времени проявляющие свойства нестационарного временного ряда, что объясняется далекими от стационарного режима начальными условиями. В ситуациях, когда временной ряд формируется под воздействием некоторого набора случайных и неслучайных факторов, анализ отдельных временных рядов, как результирующих, так и факторных, имеет огромное значение. Это необходимо для правильной идентификации моделей, которые строятся по информации об исследуемых процессах (векторные авторегрессии, модели коррекции ошибок, динамические модели с распределенными запаздываниями и т.п.).

При анализе временных рядов основное внимание уделяется исследованию, описанию и/или моделированию их структуры. Цель таких исследований, как правило, шире просто моделирования исследования соответствующих процессов. Построенная модель обычно используется для экстраполяции или прогнозирования временного ряда, и тогда качество прогноза может служить полезным критерием при выборе среди нескольких альтернативных моделей. Построение хороших моделей ряда необходимо и для других приложений, таких, как корректировка сезонных эффектов и сглаживание. Наконец, построенные модели могут использоваться для статистического моделирования длинных рядов наблюдений при исследовании больших систем, для которых временной ряд рассматривается как входная информация.

В связи с наличием ошибок измерения экономических показателей, наличием случайных флуктуаций, свойственных наблюдаемым системам, при исследовании временных рядов широко применяется вероятностно-статистический подход. В рамках такого подхода наблюдаемый временной ряд понимается как реализация некоторого случайного процесса. При этом неявно предполагается, что временной ряд имеет какую-то структуру, отличающую его от последовательности независимых случайных величин, так что наблюдения не являются набором совершенно независимых числовых значений. (Некоторые элементы структуры ряда иногда можно выявить уже на основании простого визуального анализа графика ряда. Это относится, например, к таким компонентам ряда, как тренд и циклы.) Обычно предполагается, что структуру ряда можно описать моделью, содержащей небольшое число параметров по сравнению с количеством наблюдений, это практически важно при использовании модели для прогнозирования. Примерами таких моделей служат модели авторегрессии, скользящего среднего и их комбинации - модели AR(p), MA(q), ARMA(p, q), ARIMA(p, k, q).

При построении моделей связей в долгосрочной перспективе необходимо учитывать факт наличия или отсутствия у анализируемых макроэкономических рядов стохастического (недетерминированного) тренда. Иначе говоря, приходится решать вопрос об отнесении каждого из рассматриваемых рядов к классу рядов, стационарных относительно детерминированного тренда (или просто стационарных) - TS (trend stationary) ряды, или к классу рядов, имеющих стохастический тренд (возможно, наряду с детерминированным трендом) и приводящихся к стационарному (или стационарному относительно детерминированного тренда) ряду только путем однократного или k-кратного дифференцирования ряда - DS (difference stationary) ряды. Принципиальное различие между этими двумя классами рядов выражается в том, что в случае TS ряда вычитание из ряда соответствующего детерминированного тренда приводит к стационарному ряду, тогда как в случае DS ряда вычитание детерминированной составляющей ряда оставляет ряд нестационарным из-за наличия у него стохастического тренда.

Глава 1. Основные задачи анализа временных рядов.

Принципиальные отличия временного ряда от последовательности наблюдений, образующих случайную выборку, заключаются в следующем:

во-первых, в отличие от элементов случайной выборки члены временного ряда не являются независимыми;

во-вторых, члены временного ряда не обязательно являются одинаково распределенными, так что P{xt < x} P{xt < x} при t t.

Это означает, что свойства и правила статистического анализа случайной выборки нельзя распространять на временные ряды. С другой стороны, взаимозависимость членов временного ряда создает свою специфическую базу для построения прогнозных значений анализируемого показателя по наблюденным значениям.

Генезис наблюдений, образующих временной ряд (механизм порождения данных). Речь идет о структуре и классификации основных факторов, под воздействием которых формируются значения временного ряда. Как правило, выделяются 4 типа таких факторов.

Долговременные, формирующие общую (в длительной перспективе) тенденцию в изменении анализируемого признака xt. Обычно эта тенденция описывается с помощью той или иной неслучайной функции fтр(t) (аргументом которой является время), как правило, монотонной. Эту функцию называют функцией тренда или просто - трендом.

Сезонные, формирующие периодически повторяющиеся в определенное время года колебания анализируемого признака. Поскольку эта функция (е) должна быть периодической (с периодами, кратными «сезонам»), в ее аналитическом выражении участвуют гармоники (тригонометрические функции), периодичность которых, как правило, обусловлена содержательной сущностью задачи.

Циклические (конъюнктурные), формирующие изменения анализируемого признака, обусловленные действием долговременных циклов экономической или демографической природы (волны Кондратьева, демографические «ямы» и т.п.) Результат действия циклических факторов будем обозначать с помощью неслучайной функции (t).

Случайные (нерегулярные), не поддающиеся учету и регистрации. Их воздействие на формирование значений временного ряда как раз и обусловливает стохастическую природу элементов xt, а, следовательно, и необходимость интерпретации x1,…, xT как наблюдений, произведенных над случайными величинами 1,…, Т. Будем обозначать результат воздействия случайных факторов с помощью случайных величин («остатков», «ошибок ») t.

Конечно, вовсе не обязательно, чтобы в процессе формирования значений всякого временного ряда участвовали одновременно факторы всех четырех типов. Выводы о том, участвуют или нет факторы данного типа в формировании значений конкретного ряда, могут базироваться как на анализе содержательной сущности задачи, так и на специальном статистическом анализе исследуемого временного ряда. Однако во всех случаях предполагается непременное участие случайных факторов. Таким образом, в общем виде модель формирования данных (при аддитивной структурной схеме влияния факторов) выглядит как:

xt = 1f(t) + 2(t) +3(t) + t. (1)

где i = 1, если факторы i-го типа участвуют в формировании значений ряда и i = 0 - в противном случае.

Основные задачи анализа временных рядов. Базисная цель статистического анализа временного ряда заключается в том, чтобы по имеющейся траектории этого ряда:

определить, какие из неслучайных функций присутствуют в разложении (1), т.е. определить значения индикаторов i;

построить «хорошие» оценки для тех неслучайных функций, которые присутствуют в разложении (1);

подобрать модель, адекватно описывающую поведение случайных остатков t, и статистически оценить параметры этой модели.

Успешное решение перечисленных задач, обусловленных базовой целью статистического анализа временного ряда, является основой для достижения конечных прикладных целей исследования и, в первую очередь, для решения задачи кратко- и среднесрочного прогноза значений временного ряда. Приведем кратко основные элементы эконометрического анализа временных рядов.

Временным рядом (динамическим рядом ) называется набор значений какого-либо показателя за несколько последовательных моментов или периодов времени. Отдельные наблюдения называются уровнями ряда .

В общем виде при исследовании экономических процессов временного ряда выделяются несколько составляющих:

y t = u t + v t + c t + ε t (t= 1, 2, …, n),

где u t – тренд, v t – сезонная компонента, c t – циклическая компонента, ε t – случайная компонента.

Стационарные временные ряды.

Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Временной ряд y t (t= 1, 2, …, n ) называется строго стационарным , если совместное распределение вероятностей n наблюдений y 1 , y 2 ,…, y n такое же, как и n наблюдений y 1+τ , y 2+τ ,…, y n +τ при любых n, t, и τ . Таким образом, свойства строго стационарных рядов не зависят от момента времени t .

Степень тесноты связи между последовательностями наблюдений временного ряда y 1 , y 2 , …, y n и y 1+τ , y 2+τ , …, y n +τ можно оценить с помощью выборочного коэффициента корреляции r(τ) :

Так как он оценивает корреляцию между уровнями одного и того же ряда, его называют коэффициентом автокорреляции .

Функция r(τ) называется выборочной автокорреляционной функцией , а ее график - коррелограммой .

Кроме автокорреляционной функции при исследовании стационарных временных рядов рассматривают частную автокорреляционную функцию. Статистической оценкой частного коэффициента корреляции является выборочный частный коэффициент корреляции (или просто частный коэффициент корреляции ):

где r ij , r ik r jk – выборочные коэффициенты корреляции.

Так, выборочный частный коэффициент автокорреляции 1-го порядка между членами временного ряда y t и y t +2 при устранении влияния y t +1 определяется по формуле:

где r(1), r(1,2), r(2) – выборочные коэффициенты автокорреляции между y t и y t +1 , y t +1 и y t +2 , и y t и y t +2 соответственно.

Наиболее распространенным приемом устранения автокорреляции во временных рядах является подбор соответствующей модели: авторегрессионной АР(p ), скользящей средней СС(q ) или авторегрегрессионной модели скользящей средней АРСС(p,q ) для остатков модели (в литературе можно встретить англоязычные названия моделей: авторегрессионной – АR(p ), скользящей средней – MA(q ) и авторегрегрессионной модели скользящей средней АRMA(p,q ).)

Идентификацией временного ряда называется построение для ряда остатков адекватной АРСС-модели, в которой остатки представляют собой белый шум, а все регрессоры значимы. Такое представление, как правило, не единственное, и один и тот же ряд может быть идентифицирован и с помощью АР-модели, и с помощью СС-модели.



y t = β 0 + β 1 y t -1 + β 2 y t -2 +…+ β p y t - p +ε t , (t= 1, 2, …, n),

где β 0 , β 1 ,… β p – некоторые константы.

Если исследуемый процесс y t в момент t определяется его значениями только в преды-дущий период t-1 , то получаем авторегрессионную модель 1-го порядка (или модель АР(1)).

y t = β 0 + β 1 y t -1 +ε t , (t= 1, 2, …, n),

Наряду с авторегрессионными моделями временных рядов в эконометрике рассматриваются также модели скользящей средней. В них моделируемая величина задается линейной функцией от возмущений (остатков) в предыдущие моменты времени. Модель скользящей средней порядка q (модель СС(q )) имеет вид:

y t = ε t – γ 1 ε t-1 – γ 2 ε t-2 –…– γ q ε t- q (t= 1, 2, …, n).

Нередко используются и комбинированные модели временных рядов АР и СС, которые имеют вид:

y t = β 0 + β 1 y t -1 + β 2 y t -2 +…+ β p y t - p + ε t – γ 1 ε t-1 – γ 2 ε t-2 –…– γ q ε t- q .

Если все значения выборочной частной автокорреляционной функции порядка выше p незначимо отличаются от нуля, временной ряд следует идентифицировать с помощью модели, порядок авторегрессии которой не выше p .

Если все значения выборочной автокорреляционной функции порядка выше q незначимо отличаются от нуля, временной ряд следует идентифицировать с помощью модели скользящей средней, порядок которой не выше q .

Нестационарные временные ряды.

Пусть имеется временной ряд

y t = ρy t -1 + ξ t .

Предположим, что ошибки ξ t независимы и одинаково распределены, т.е. образуют белый шум. Перейдем к разностным величинам:

Δy t = λy t -1 + ξ t ,

где Δy t = y t – y t -1 , λ= ρ-1.

Если ряд Δy t является стационарным, то исходный нестационарный ряд y t называется интегрируемым (или однородным ).

Нестационарный ряд y t называется интегрируемым (однородным) k-го порядка , если после k -кратного перехода к приращениям

d k y t = d k-1 y t – d k-1 y t-1 ,

где d 1 y t = Δy t , получается стационарный ряд d k y t .

Если при этом стационарный ряд d k y t корректно идентифицируется как АРСС(p,q ), то нестационарный ряд y t обозначается как АРПСС(p,k,q ). Это означает модель авторегрессии – проинтегрированной скользящей средней (другое обозначение - ARIMA(p,k,q )) порядков p , k , q, которая известна как модель Бокса-Дженкинса. Процедура подбора такой модели реализована во многих эконометрических пакетах.

Модели с распределенными лагами.

При исследовании экономических процессов приходится моделировать ситуации, когда значение результативного признака в текущий момент времени t формируется под воздействием ряда факторов, действовавших в прошлые моменты времени. Величину l , характеризующую запаздывание в воздействии фактора на результат, называют лагом , а временные ряды самих факторных переменных, сдвинутые на один или более моментов времени, - лаговыми переменными . Модели, содержащие не только текущие, но и лаговые значения факторных переменных, называют моделями с распределенными лагами :

В случае конечной величины максимального лага модель имеет вид:

y t = a + b 0 x t + b 1 x t-1 + … + b l x t-l +ε t .

Коэффициент b 0 характеризует среднее абсолютное изменение y t при изменении x t на 1 ед. своего измерения в некоторый фиксированный момент времени t , без учета воздействия лаговых значений фактора x . Этот коэффициент называется краткосрочным мультипликатором .

Долгосрочный мультипликатор вычисляется по формуле:

b = b 0 + b 1 + … + b l .

Он показывает абсолютное изменение в долгосрочном периоде t+l результата y под влиянием изменения на 1 ед. фактора x .

Величины β j =b j /b (j = 0,…,l ) называются относительными коэффициентами модели с распределенным лагом.

Средний лаг определяется по формуле средней арифметической взвешенной:

и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t . Небольшая величина среднего лага свидетельствует об относительно быстром реагировании результата на изменение фактора. Высокое его значение говорит о том, что воздействие фактора на результат будет сказываться в течение длительного периода времени.

Медианный лаг (l Me) – представляет собой период времени, в течение которого будет реализована половина общего воздействия фактора на результат и определяется следующим соотношением:

Оценка модели с распределенными лагами зависит от того, конечное или бесконечное число лагов она содержит.

Метод Алмон.

Предполагается, что веса текущих и лаговых значений объясняющих переменных подчиняются полиномиальному закону распределения:

b j = c 0 + c 1 ·j + c 2 ·j 2 + … + c k ·j k . (5.1)

Уравнение регрессии примет вид:

y t = a + c 0 ·z 0 + c 1 ·z 1 + c 2 ·z 2 + … + c k ·z k + ε t , (5.2)

где , i = 1,…,k ; j =0,…,l . (5.3)

Схема расчета параметров модели:

1. устанавливается максимальная величина лага l ;

2. определяется степень полинома k , описывающего структуру лага;

3. по соотношениям (5.3) рассчитываются значения переменных z 0 , z 1 ,…, z k ;

4. обычным методом наименьших квадратов определяются
параметры уравнения линейной регрессии y t от z i (5.2);

5. рассчитываются параметры исходной модели по формулам (5.1).

Метод Койка.

Предполагается, что коэффициенты при лаговых значениях переменной убывают в геометрической прогрессии:

, j = 1, 2, … 0 < λ < 1. (5.4)

Уравнение регрессии преобразуется к виду:

y t = a + b 0 x t + b 0 ·λ x t-1 + b 0 ·λ 2 x t-2 +… +ε t .

После ряда преобразований получается уравнение авторегрессии первого порядка:

y t = a·(1 – λ) + b 0 ·x t + (1 – λ) y t-1 + u t ,

где u t = ε t λ ε t-1 .

Определив параметры данной модели, находятся λ и оценки параметров a и b 0 исходной модели. Далее из соотношения (5.4) определяются параметры модели b 1 , b 2 ,… .

Величина среднего лага в модели Койка определяется формулой:

Пример 5. По данным о динамике товарооборота (Y , млрд. руб.) и доходах населения (X , млрд. руб.) была получена следующая модель с распределенными лагами:

Y t = 0,50∙X t + 0,25∙X t -1 + 0,13∙X t -2 + 0,13∙X t -3 + ε t .

(0,06) (0,04) (0,04) (0,06)

В скобках указаны значения стандартных ошибок для коэффициентов регрессии. Значение R 2 = 0,98.

Задание:

1. Проанализируйте полученные результаты регрессионного анализа.

2. Дайте интерпретацию параметров модели: определить краткосрочный и долгосрочный мультипликаторы.

3. Определите величину среднего лага и медианного лага.

Решение.

1. Проверка значимости отдельных коэффициентов модели дает следующие расчетные значения t-статистики для коэффициентов:

t b 0 = 0,50/0,06 = 8,33; t b 1 = 0,25/0,04 = 6,25;

t b 2 = 0,13/0,04 = 3,25; t b 3 = 0,13/0,06 = 2,17.

Таким образом, все коэффициенты оказываются значимыми, и выбор величины лага l =3 является оправданным. Об адекватности полученной модели свидетельствует и высокое значение коэффициента детерминации.

2. Краткосрочный мультипликатор в модели равен b 0 = 0,50. Он показывает, что увеличение доходов на 1 млрд. руб. ведет в среднем к росту товарооборота на 0,5 млрд. руб. в том же периоде.

Долгосрочный мультипликатор для полученной модели составит:

b = b 0 + b 1 + b 2 + b 3 = 0,50 + 0,25 + 0,13 + 0,13 = 1,01.

Получаем, что увеличение доходов на 1 млрд. руб. в настоящий момент времени в долгосрочной перспективе (через 3 месяца) приведет к росту товарооборота на 1,01 млрд. руб.

Рассчитаем относительные коэффициенты модели:

β 0 = 0,50/1,01 = 0,495; β 1 = 0,25/1,01 = 0,248;

β 2 = 0,13/1,01 = 0,129; β 3 = 0,13/1,01 = 0,129.

Следовательно, 49,5% общего увеличения товарооборота, вызванного ростом доходов населения, происходит в текущий момент времени; 24,8% - в момент времени (t +1); 12,9% - в моменты времени (t +2) и (t +3).

3. Средний лаг в модели определяется следующим образом:

Величина среднего лага меньше месяца, что подтверждает, что эффект роста доходов населения на объем товарооборота проявляется сразу же.

Медианный лаг для данной модели составляет чуть более 1 месяца. ¨

Характерной чертой адаптивных методов прогнозирования является их способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, «адаптироваться» к этой эволюции, придавая тем больший вес, тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они к текущему моменту прогнозирования.

В основе процедуры адаптации лежит метод проб и ошибок. По модели делается прогноз на один интервал по времени. Через один шаг моделирования анализируется результат: насколько он далек от фактического значения. Затем в соответствии с моделью происходит корректировка. После этого процесс повторяется. Таким образом, адаптация осуществляется рекуррентно с получением каждой новой фактической точки ряда.

Методы экспоненциального сглаживания. Модель Брауна.

Пусть анализируемый временной ряд x(t) представлен в виде:

x(t) = a 0 + ε(t) ,

где a 0 – неизвестный параметр, не зависящий от времени, ε(t) - случайный остаток со средним значением, равным нулю, и конечной дисперсией.

В соответствии с методом Брауна прогноз x*(t+τ) для неизвестного значения x(t+τ) по известной до момента времени t траектории ряда x(t) строится по формуле:

x*(t; τ) = S(t),

где значение экспоненциально взвешенной скользящей средней S (t ) определяется по рекуррентной формуле:

S(t) = αx(t) + (1-α) S(t-1).

Коэффициент сглаживания α можно интерпретировать как коэффициент дисконтирования , характеризующий меру обесценивания информации за единицу времени. Из формулы следует, что экспоненциально взвешенная скользящая средняя является взвешенной суммой всех уровней ряда x(t) , причем веса уменьшаются экспоненциально по мере удаления в прошлое.

В качестве S (0) берется, как правило, среднее значение ряда динамики или среднее значение нескольких начальных уровней ряда.

Случай линейного тренда: x(t) = a 0 + a 1 t + ε(t) .

В этом случае прогноз x*(t; τ) будущего значения определяется соотношением:

x*(t; τ) = ,

а пересчет коэффициентов осуществляется по формулам:

Начальные значения коэффициентов берутся из оценки тренда линейной функцией.

Модель Хольта.

В модели Хольта введено два параметра сглаживания α 1 и α 2 (0< α 1 , α 2 <1). Прогноз x*(t;l) на l

x*(t; τ) = ,

а пересчет коэффициентов осуществляется по формулам:

Модель Хольта-Уинтерса.

Эта модель помимо линейного тренда учитывает и сезонную составляющую. Прогноз x*(t;τ) на τ шагов по времени определяется формулой:

x*(t;τ) = ,

где f(t) – коэффициент сезонности, а T – число временных тактов (фаз), содержащихся в полном сезонном цикле.

Видно, что в данной модели сезонность представлена мультипликативно . Формулы обновления коэффициентов имеют вид:

Модель Тейла-Вейджа.

Если исследуемый временной ряд имеет экспоненциальную тенденцию с мульти-пликативной сезонностью, то после логарифмирования обеих частей уравнения получается модель с линейной тенденцией и аддитивной сезонностью или модель Тейла-Вейджа.

Имеется модель:

x(t) = a 0 (t) + g(t) + δ(t),

a 0 (t) = a 0 (t-1) + a 1 (t).

Здесь a 0 (t) – уровень процесса после устранения сезонных колебаний, a 1 (t) – аддитивный коэффициент роста, ω(t) – аддитивный коэффициент сезонности и δ(t) – белый шум.

Прогноз x*(t;τ) на τ шагов по времени определяется формулой:

x*(t;τ) = .

Коэффициенты вычисляются рекуррентным способом по формулам:

Для определения оптимальных значений параметров адаптации перебирают различные наборы их значений и сравнивают получающиеся при этом среднеквадратические ошибки прогнозов.