Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

PANEL DATA MODELS AS A TOOL FOR ANALYSIS AND FORECASTING OF ECONOMIC INDICATORS OF RUSSIAN REGIONS

Kasimova T.M. 1
1 Dagestan State University
In this article models of panel data of various types (combined, with fixed effects, with random effects) of dependence of gross regional product on agricultural production volumes are constructed. The regions of the Russian Federation are the subject of the study. The initial data are panel data of gross regional product and agricultural production volume for 2010-2017. The panel is balanced not only by the considered indicators, but also by the whole period. This means that only regions for which full information is available are included. Panel data models have some advantages over classic models, the main of which is to take into account the individual features of observation objects. This made it possible to predict the value of the performance indicator for each region, federal district and the country as a whole, which is impossible on the basis of spatial data. A Houseman test was conducted to select the type of panel data model to predict – with fixed effects or random effects. The article presents the forecast values of gross regional product until 2021. At the same time, the forecast values of the indicator-factor, which is the volume of agricultural production, are obtained based on linear models of time series.
panel data
panel data models
gross regional product
gross agricultural products
forecast

Сельское хозяйство – крупная отрасль экономики Российской Федерации. Объем производства продукции сельского хозяйства в 2018 г. составил 5,1 трлн руб. При этом на растениеводство приходится 54 %, на животноводство – 46 % объема сельскохозяйственного производства. Россия – крупный экспортер сельскохозяйственной продукции. Ключевая статья экспорта сельскохозяйственного сырья и продовольствия из России в 2018 г. – зерно, что составило 42 % от общих поставок [1].

Показатели сельского хозяйства регионов РФ представляют собой панельные данные. Существенное различие между панельными и пространственными данными состоит в том, что в первом случае у нас имеются наблюдения за однотипными объектами во все периоды времени. Данные, представляемые в виде временных рядов, представляют собой наблюдения за одним объектом, но за некоторый промежуток времени. Следовательно, такие данные позволяют учитывать фактор времени.

Панельные данные представляют собой объединение пространственных данных и временных рядов.

Целью настоящего исследования являются выявление, анализ влияния объемов производства сельскохозяйственной продукции на валовой региональный продукт (ВРП) и его прогнозирование с помощью моделей панельных данных.

Материалы и методы исследования

Объектом настоящего исследования являются регионы РФ. Исходные данные исследования – показатель валового регионального продукта и «Продукция сельского хозяйства» в разрезе регионов РФ (федеральных округов (ФО)) и в целом за 2010–2017 гг.

Панель сбалансирована по выбранным показателям и по периоду исследования (а именно удалены наблюдения, по которым нет полных данных). В том числе не взяты данные показателя «Продукция сельского хозяйства» за 2018 г., поскольку в [1] отсутствуют данные ВРП за аналогичный год.

В результате исходные данные за 2010–2017 гг. составляют в общем по стране данные 81 региона (648 наблюдений), в том числе ЦФО – 17 регионов (136 наблюдений); СЗФО – 10 регионов (80 наблюдений); ЮФО – 6 регионов (48 наблюдений); СКФО – 7 регионов (56 наблюдений); ПФО – 14 регионов (112 наблюдений); УрФО – 6 регионов (48 наблюдений); СФО – 12 регионов (96 наблюдений); ДФО – 9 регионов (72 наблюдения).

По представленным данным составляются три вида моделей панельных данных: объединенная, с фиксированными и случайными эффектами.

Объединенная (pooled) модель имеет вид:

kasim01.wmf

где yit – результативный показатель, kasim02.wmf – показатель-фактор, µ и β – параметры модели, uit – ненаблюдаемые остатки, kasim03.wmf – номер объекта, kasim04.wmf – момент времени.

Модель с фиксированными эффектами (fixed effects model) имеет вид:

kasim05.wmf

В модели с фиксированными эффектами параметр β одинаков для всех объектов наблюдения во все моменты времени, а параметр местоположения µi индивидуален для каждого объекта наблюдения.

Модель со случайными эффектами имеет вид:

kasim06.wmf

где kasim07.wmf.

В этой модели также параметр β одинаков для всех объектов наблюдения, а специфичным для них является слагаемое mi, которое предполагается независимым от оставшейся части ошибки υit.

Модель называют «со случайными эффектами», так как эффекты mi, определяющие разнородность объектов, являются случайными переменными. Однако это не означает, что mi определяются для каждого наблюдения в случайном порядке. Здесь имеет место случайность выборки из генеральной совокупности, так как любой объект наблюдения имеет специфический эффект, который не зависит от времени.

Вопрос о спецификации моделей, т.е. о том, какую из двух последних моделей выбрать в настоящем исследовании, решается с помощью теста Хаусмана. При проведении теста Хаусмана выдвигаются две гипотезы: Н0 – оценки обеих моделей состоятельны и не отличаются слишком сильно; Н1 – оценки для модели с фиксированными эффектами являются состоятельными, а для модели со случайными эффектами – уже нет.

Тест Хаусмана основан на разности kasim08.wmf: kasim09.wmf, где kasim10.wmf – оценка матрицы ковариаций kasim11.wmf, имеющая асимптотическое распределение χ2 с d степенями свободы [2, 3].

Результаты исследования и их обсуждение

На рис. 1 представлены диаграммы, отражающие структуру показателя «Продукция сельского хозяйства» в разрезе федеральных округов РФ и в разрезе регионов СКФО в 2010 и 2017 гг.

Согласно рис. 1 крупными производителями продукции сельского хозяйства в России являются регионы Центрального, Приволжского и Южного федеральных округов. Причем такое распределение имеет место как в 2010 г., так и в 2017 г. При этом на долю этих регионов приходится 60 % и 65 % от общего объема в 2010 и 2017 гг. соответственно.

Регионы СКФО занимают в рассматриваемые периоды 5-е место. При этом Ставропольский край производит 41 % и 43 %, Республика Дагестан – 24 % и 27 %, Карачаево-Черкесская Республика – 12 % и 11 % от общего объема продукции сельского хозяйства СКФО соответственно в 2010 и 2017 гг.

На рис. 1 вторичная диаграмма отражает структуру показателя «Продукция сельского хозяйства» в разрезе регионов СКФО со значениями в процентах от общего объема этого показателя по стране в целом.

На рис. 2 представлены временные ряды ВРП и показателя «Продукция сельского хозяйства» регионов РФ за 2010–2017 гг.

Значительно высокие значения показателя «Продукция сельского хозяйства» за рассматриваемый период принадлежат Краснодарскому краю.

kasim1.tif

Рис. 1. Структура показателя «Продукция сельского хозяйства» федеральных округов РФ (первичная диаграмма) и в разрезе регионов СКФО (вторичная) в 2010 и 2017 гг.

kasim2.tif

Рис. 2. Временные ряды ВРП и показателя «Продукция сельского хозяйства» регионов РФ за 2010–2017 гг.

В табл. 1 представлены некоторые результаты оценивания моделей панельных данных, полученные с помощью пакета для эконометрического анализа «Eviews».

Индекс детерминации для модели с фиксированными эффектами высокий и составляет 0,95, для остальных моделей он незначительный – 0,12 и 0,24 (для модели со случайными эффектами см. в табл. 1). Критерий Стьюдента для всех моделей больше табличных значений, что свидетельствует о статистической значимости параметров моделей.

Математическая запись моделей приводится в табл. 2.

Таблица 1

Параметры и статистические характеристики модели со случайными эффектами, построенной по сбалансированным наблюдениям за 81 регионом РФ в 2010–2017 гг., полученные с помощью пакета «Eviews»

Модель со случайными эффектами (RE)

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

289586.3

80863.28

3.581185

0,0004

X

5,684541

0,401562

14,15608

0,0000

 

Effects Specification

     
     

S.D.

Rho

Cross-section random

   

701894,2

0,9345

Idiosyncratic random

   

185845,6

0,0655

 

Weighted Statistics

     

R-squared

0,236973

Mean dependent var

 

53491,51

Adjusted R-squared

0,2357

S.D. dependent var

 

212468,0

S.E. of regression

185737,3

Sum squared resid

 

2,23E + 13

F-statistic

200,6284

Durbin-Watson stat

 

0,2767

Prob(F-statistic)

0,000000

     
 

Unweighted Statistics

     

R-squared

0,1219

Mean dependent var

 

573910,1

Sum squared resid

3,35E + 14

Durbin-Watson stat

 

0,0184

 

Таблица 2

Уравнения различных моделей панельных данных, построенных по сбалансированным наблюдениям за 81 регионом РФ в 2010–2017 гг., полученные с помощью пакета «Eviews»

Estimation Equation:

Pooled

FE

RE

Y = C(1) + C(2)*X

Y = C(1) + C(2)*X + [CX=F]

Y = C(1) + C(2)*X + [CX=R]

Substituted Coefficients:

Pooled

FE

RE

Y = 322415.427087 +

+ 5.02818258085*X

Y = 286891,394703 +

+ 5,73842161572*X + [CX=F]

Y = 289586,338282 +

+ 5,68454107351*X + [CX=R]

 

Таблица 3

Фрагмент результатов проведения теста Хаусмана

Test Summary

Chi-Sq. Statistic

Chi-Sq. d.f.

Prob.

Cross-section random

0,247677

1

0,6187

Cross-section random effects test comparisons:

Variable

Fixed

Random

Var(Diff.)

Prob.

X

5,738422

5,684541

0,011721

0,6187

 

Аналогичные модели построены и по данным всех восьми федеральных округов.

Для выбора более предпочтительного вида модели панельных данных, на основе которой и будет производиться прогнозирование, использован тест Хаусмана. Например, для моделей из табл. 2 результаты представлены в табл. 3.

Так как p-уровень >0,01, значит, мы принимаем нулевую гипотезу.

По моделям панельных данных с фиксированными эффектами рассчитаны прогнозные значения ВРП каждого региона, федерального округа и РФ в целом по прогнозируемым значениям показателя-фактора, определенных в свою очередь на основе линейного тренда. Последние представлены в табл. 4.

Таблица 4

Прогнозные значения валовой продукции сельского хозяйства, полученные по линейной модели временных рядов по данным за 2010–2017 гг., млрд руб.

 

2018 г. факт

2018 г.

2019 г.

2020 г.

РФ

5348777

5719681

6072977

6426273

ЦФО

1467970

1471557

1569151

1666745

СЗФО

246116

265391

280579

295768

ЮФО

903937

933487

993219

1052951

СКФО

461495

474302

505240

536178

ПФО

1191874

1337701

1418565

1499429

УрФО

321680

363385

384196

405007

СФО

556883

690571

728047

765523

ДВФО

198823

183286

193979

204672

 

В табл. 4 представлены прогнозы в целом по РФ и в разрезе федеральных округов. Таким же образом рассчитаны прогнозы показателя-фактора для каждого отдельного региона. На основе этих значений и моделей панельных данных получены прогнозные значения ВРП регионов. Для РФ в целом и в разрезе федеральных округов они представлены в табл. 5.

Таблица 5

Прогнозные значения ВРП, полученные по моделям панельных данных за 2010–2017 гг., млрд руб.

 

2017 г. факт

2018 г.

2019 г.

2020 г.

РФ

74926791,6

57917048

60344079

62771111

ЦФО

26164236,7

9427988

9761578

10095168

СЗФО

8195347,2

4100257

4225263

4350269

ЮФО

5361878,8

5186680

5497695

5808711

СКФО

1864722,9

1910438

2010834

2111229

ПФО

11026688,4

11396266

11964882

12533499

УрФО

10677942

14803693

15352731

15901770

СФО

7757655,3

7579225

7925710

8272195

ДВФО

3878320,3

3512500

3605385

3698270

 

Прогнозы из табл. 5 пессимистичны. В модель панельных данных для адекватного прогнозирования целесообразно включить показатели некоторых других отраслей экономики (например, оптовой и розничной торговли или обрабатывающих производств, доля которых в структуре ВРП в 2017 г. составляет 19,4 % и 17,7 % соответственно [1]). Согласно статистическим данным [1] в структуре ВРП отрасль «Сельское хозяйство» составляет 4,3 % в 2010 г. и 4,6 % в 2017 г.

Особый интерес в построенных моделях панельных данных представляют коэффициенты при переменных, которые заданы в табл. 6.

Таблица 6

Коэффициенты при переменных моделях панельных данных с фиксированными эффектами (β) и значения t-критерия Стьюдента для них (tβ)

 

РФ

ЦФО

СЗФО

ЮФО

СКФО

ПФО

УрФО

СФО

ДВФО

β

5,74

3,42

8,23

5,21

3,25

7,03

26,38

9,25

8,69

tβ

13,80

4,93

6,41

17,65

17,12

18,13

4,31

7,69

4,24

 

Согласно t-критерию Стьюдента коэффициенты статистически значимы (превышают табличное значение критерия, которое составляет приблизительно 2). Кроме того, эти коэффициенты представляют собой предельные эффекты – показывают отзывчивость (в абсолютных единицах) результативного показателя при изменении показателя-фактора на одну абсолютную единицу [4, 5]. Например, для регионов Уральского федерального округа при увеличении валовой продукции сельского хозяйства на 1 млрд руб. ВРП увеличивается на 26,4 млрд руб. Это самое максимальное значение предельного эффекта в разрезе федеральных округов, в среднем по всем регионам РФ за период 2010–2017 гг. этот показатель равен 5,7.

Выводы

В результате проведенного исследования выявлено, что:

– в структуре показателя «Продукция сельского хозяйства» соотношение федеральных округов РФ в 2010 и 2017 гг. изменилось незначительно – в пределах 1 % для некоторых округов, кроме ЦФО. Доля регионов ЦФО в этом показателе увеличилась на 3 % в 2017 г. по сравнению с 2010 г. Лидером по показателю «Продукция сельского хозяйства» за весь рассматриваемый период является Краснодарский край;

– при анализе и прогнозировании модели панельных данных позволяют учитывать не только фактор времени, но и индивидуальные эффекты регионов отдельных федеральных округов в зависимости от показателя «Продукция сельского хозяйства»;

– построенные модели панельных данных позволили рассчитать прогнозные значения ВРП каждого региона, федерального округа и РФ в целом до 2021 г.;

– для адекватного прогнозирования ВРП разных уровней целесообразно в модели в качестве факторов добавить показатели отраслей, имеющих высокую долю в структуре ВРП.