Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

FORESTS CARBON-DEPOSITING ABILITY ESTIMATING REGRESSION EQUATIONS COEFFICIENTS AUTOMATED CALCULATION ALGORITHM IN CASE OF REFERENCE DATA UPDATE

Voronov М.P. 1 Usoltsev V.A. 1 Chasovskikh V.P. 1
1 Ural state forest engineering university, Ekaterinburg
1275 KB
The algorithm was developed to automate the recount procedure for the values, which are calculated by the means of correlation of empiric data in accordance with regression equations, deduced from the base of reference or empiric data, in case of reference or empiric data update. The algorithm allows calculating the coefficients of regression equations, which describe the linear dependence on 1, 2, 3 or 4 independent variables, and can be applied within information systems in order to adjust reference, normative and other generalized data to particular results, derived during empiric research under the certain conditions (territorial, climatic, geographical and other conditions).
information systems
automation
regression equation

Оценка углерододепонирующей способности лесного покрова в связи с обязательствами по Киотскому протоколу сегодня является одной из насущных проблем. Наши расчеты выполняются с использованием эмпирических моделей зависимости запасов фитомассы и годичной чистой первичной продукции (ЧПП), полученных на пробных площадях, от основных массоопределяющих факторов - возраста и запаса стволовой древесины - путем совмещения полученных моделей с данными ГУЛФ. Алгоритмы расчета пулов углерода и его годичного депонирования на лесопокрытых площадях очень сложны и трудоемки, а результаты расчетов вследствие периодических изменений в данных ГУЛФ и непрерывного пополнения данных фитомассы и ЧПП новыми определениями на пробных площадях нуждаются в постоянной актуализации.

Цель исследования ‒ создание алгоритма автоматической актуализации коэффициентов регрессионных уравнений оценки углерододепонирующей способности лесов, конечных значений фитомассы и годичного прироста фитомассы лесов по различным породам и фракциям.

В общем виде алгоритм показан в виде схемы на рис. 1.

Согласно способу Чебышева множественное корреляционное уравнение можно привести к виду [3]:

129 (1)

с основной ошибкой

130 (2)

где rpq - коэффициент корреляции для случайных величин Xp и Xq (для независимых переменных уравнения); 131 - находится по формуле:

132 (3)

При последовательном увеличении числа случайных величин (независимых переменных), т.е. при увеличении n, количество слагаемых в уравнении (1) соответствующим образом увеличивается, т.е. каждое последующее слагаемое в уравнении (1) добавляет одну независимую переменную. Так, останавливаясь на первом члене уравнения (1), получаем обыкновенное корреляционное уравнение первого порядка, выражающее зависимость x1 от x2:

133 (4)

с основной ошибкой

134 (5)

pic

Рис. 1. Основные компоненты алгоритма и взаимосвязи между ними

Присоединяя второе слагаемое уравнения (1), получаем множественное корреляционное уравнение второго порядка, выражающее зависимость X1 от X2 и X3:

135 (6)

с основной ошибкой

136 (7)

И так далее. Для получения уравнения более высокого порядка, иными словами, при включении каждой дополнительной независимой переменной в уравнение, присоединяется еще одно слагаемое в уравнении (1).

Максимальное количество независимых переменных в множественных регрессионных уравнениях, предусмотренное алгоритмом, - 4. Идея алгоритма расчета значений коэффициентов расчетных уравнений (КРУ) заключается в осуществлении расчета единственным, однозначно определенным в каждом из 4 случаев, способом. Для этого уравнение (1) преобразуется в соответствии с количеством выбранных независимых переменных, и независимые переменные (X1, X2 и т.д.) выносятся за скобки, так, чтобы коэффициенты при них можно было выразить через величины, вычисляемые по значениям независимых переменных. Всего создано 5 независимых расчетных программ, выражающих зависимость от 1, 2, 3, и 4 переменных, выбираемых в качестве независимых.

Выбор и запуск расчетной программы для расчета значений КРУ производится на основе подсчета количества переменных, выбираемых в качестве независимых. Значения выбранных независимых переменных считываются расчетной программой (БД эмпирических данных), которая также находит натуральные логарифмы значений, производит расчет их средних и сумм значений и рассчитывает КРУ. Ниже представлены формулы для 2 расчетных программ, осуществляющих расчет КРУ уравнений, выражающих зависимость от 1-й и 4-х независимых переменных. КРУ в уравнениях, выражающих зависимость от 2-х и 3-х независимых переменных, вычисляются аналогичным способом.

Для расчета КРУ на основе 1 выбранной независимой переменной уравнение (1) будет иметь следующий вид:

137 (8)

Преобразуя выражение (8), получаем:

138

или

139

Таким образом, коэффициенты расчетного уравнения, выражающего зависимость фитомассы от 1 выбранной переменной вычисляются расчетной программой по следующим формулам:

- свободный член (a):

140

- коэффициент при X2(a1):

141

Уравнение (1) для расчета КРУ на основе 4 выбранных независимых переменных имеет вид:

142 (9)

Преобразуем выражение (9):

143

Введем следующие обозначения:

144 145 146  147  148

149  150  151  152

Уравнение приобретает вид:

153

Введем следующие дополнительные обозначения:

154 155  156

157  158  159

160  161

Уравнение принимает вид:

162

Выносим общие множители 131 за скобки и преобразуем по формуле (3):

163

Введем следующие дополнительные обозначения:

164

165

166

167

Уравнение принимает вид:

168

КРУ, выражающие зависимость фитомассы от 4 выбранных переменных, вычисляются расчетной программой по следующим формулам:

- свободный член (a):

168

- коэффициент при X2(a1):

170

- коэффициент при X3(a2):

171

- коэффициент при X4(a3):

172

- коэффициент при X5(a4):

173

Для каждого КРУ вычисляется значение t-критерия. Если значение t-критерия для каких-либо независимых переменных получается меньше абсолютной величины 1,9, соответствующие независимые переменные исключаются из расчета, и производится перерасчет КРУ. При этом значения КРУ соответствующих независимых переменных приравниваются нулю.

Для корреляции справочных данных (см. рис. 1.) производится вычисление суммы произведений КРУ на значения справочных данных, соответствующих переменным, выбранным в качестве независимых. Для этого рассчитанные значения КРУ заносятся в БД или рабочий файл промежуточных результатов (см. рис. 1.), которая (который) имеет следующую структуру (таблица).

Структура БД или рабочего файла промежуточных результатов
(на примере породы Betula)

№ п/п

Наименования параметров

Коэффициенты расчетных уравнений (для независимых переменных)

R2

SE

a

a1

a2

a3

a4

a5

1

Прирост ствол

0,1859

-1,0005

0,8971

0

0

0

0,938

0,399

2

Прирост ветви

-0,4285

-0,2023

0

0,8003

0

0

0,797

0,563

3

Прирост листва

-0,3550

-0,5078

0,7003

0

0

0

0,867

0,440

4

Прирост корни

0,0954

-0,3177

-0,4191

0

0,9879

0

0,768

0,435

5

Прирост нижние ярусы

1,2652

-0,4600

0

0

0

0,4269

0,630

0,382

...

...

...

...

...

...

...

...

...

...

Все поля БД или рабочего файла промежуточных результатов (см. таблицу) заполняются таким способом, чтобы ни одно поле не осталось пустым. Таким образом, при нахождении суммы произведений КРУ на значения независимых переменных автоматически исключается влияние малозначимых независимых переменных на итоговое значение фитомассы и приростов фитомассы, т.к. произведение любого из значений переменной на 0 (КРУ малозначимых переменных приравниваются нулю) дает 0.

Степень детерминации выявленных зависимостей проверяется при помощи коэффициента детерминации (R2). Также определяется основное отклонение выборочного распределения - стандартная ошибка (SE). Оба показателя также заносятся в БД (см. таблицу).

В случае оценки углерододепонирующей способности лесов в качестве справочных данных выступают данные Государственного учета лесного фонда (ГУЛФ), из которых в вышеописанных моделях используются 2 показателя - возраст и запас. Поскольку эти показатели корреляционно не связаны, и структура уравнений остается неизменной (т.е. для каждого параметра перечень коэффициентов a, a1 ... a5 неизменен, но выполняется перерасчет значений коэффициентов на основании измененных эмпирических данных), считаем, что дополнительная проверка на адекватность моделей в данном случае не требуется.

Вышеизложенный алгоритм реализован в среде СУБД ADABAS и редактора приложений Natural. Основные аспекты проектирования информационных систем в данной среде представлены в [1, 2].

Помимо автоматического расчета значений по уравнениям фиксированной структуры (см. таблицу), созданное приложение позволяет переходить на новую структуру регрессионных уравнений и осуществлять расчет коэффициентов на основании переменных, выбираемых пользователем в качестве зависимых и независимых в уравнении.

Выбор зависимой переменной и независимых переменных осуществляется при помощи вспомогательных приложений (рис. 2, 3).

pic

Рис. 2. Выбор зависимой переменной для расчета КРУ (на примере вспомогательного приложения для расчета КРУ фитомассы)

pic

Рис. 3. Выбор независимых переменных для расчета КРУ
(на примере вспомогательного приложения для расчета КРУ фитомассы)

При переходе на новую структуру уравнений необходима дополнительная проверка модели на адекватность, которая может быть осуществлена с помощью метода группового учета аргументов (МГУА), который в рамках нашего алгоритма пока не автоматизирован. Направление дальнейших исследований и совершенствование вышеописанного алгоритма заключаются в автоматизации расчетных процедур МГУА и включения их в алгоритм.

Заключение

Поставленную цель исследования считаем достигнутой. Алгоритм автоматической актуализации коэффициентов регрессионных уравнений оценки углерододепонирующей способности лесов создан и реализован в рамках следующих проектов:

1. Научно-исследовательская работа «Разработка системы пространственного анализа депонирования углерода лесными экосистемами Уральского региона» - грант РФФИ - «Урал» №07-07-96010 (год завершения - 2009).

2. Научно-исследовательская работа «Разработка автоматизированной системы оценки углерододепонирующей способности лесов России» в рамках Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг., в рамках мероприятия 1.3 «Проведение научных исследований молодыми учеными - кандидатами наук и целевыми аспирантами в научно-образовательных центрах», по направлению «Оценка ресурсов и прогнозирование состояния литосферы и биосферы» - Государственный контракт № П1713 (год завершения - 2010).

Также алгоритм может быть применен в информационных системах при необходимости корректировки справочных, нормативных и прочих обобщенных данных на конкретные результаты, полученные в ходе эмпирических исследований в конкретных (территориальных, климатических, географических и пр.) условиях.

Рецензенты:

Доросинский Л.Г., д.т.н., профессор, зав. кафедрой АСУ Радиотехнического института Уральского федерального университета им. первого Президента России Б.Н. Ельцина, г. Екатеринбург;

Лабунец В.Г., д.т.н., профессор кафедры теоретических основ радиотехники Уральского федерального университета им. первого Президента России Б.Н. Ельцина, г. Екатеринбург.

Работа поступила в редакцию 07.07.2011.