AN L-STABLE METHOD OF THIRD ORDER FOR THE NUMERICAL INTEGRATION STIFF PROBLEMS

Для численного решения жестких систем обыкновенных дифференциальных уравнений обычно применяются L-устойчивые методы [9]. При реализации таких численных схем на каждом шаге несколько раз решается линейная система алгебраических уравнений с применением LU-разложения матрицы Якоби. При большой размерности исходной задачи общие вычислительные затраты фактически полностью определяются временем декомпозиции данной матрицы. Сокращения затрат достигают за счет применения одной матрицы на нескольких шагах [3, 4, 9]. Наиболее естественно это осуществляется в итерационных методах, где данная матрица только определяет скорость сходимости итерационного процесса [9]. Для безытерационных методов типа Розенброка [10] и их модификаций [5, 9] вопрос о замораживании матрицы Якоби более сложный. В таких методах эта матрица включена в численную схему, и поэтому ее аппроксимация приводит к потере порядка точности численной формулы. Максимальный порядок методов типа Розенброка с замораживанием матрицы Якоби равен двум [3]. Безытерационные методы просты с точки зрения реализации и, как следствие, привлекательны для вычислителей. Некоторым аналогом замораживания матрицы Якоби является применение в расчетах алгоритмов интегрирования на основе явных и L-устойчивых методов с автоматическим выбором численной схемы. В этом случае эффективность алгоритма может быть повышена за счет расчета переходного участка, соответствующего максимальному собственному числу матрицы Якоби, явным методом. В качестве критерия выбора эффективной численной формулы естественно применять неравенство для контроля устойчивости [6, 11]. Следует отметить, что применение таких комбинированных алгоритмов полностью не снимает проблему замораживания матрицы Якоби, потому что явным методом можно просчитать, вообще говоря, погранслойное решение, соответствующее максимальному собственному числу матрицы Якоби. В [5] предложен новый класс одношаговых численных схем, которые были названы (m, k)-методами. Они столь же просты при реализации, как и методы типа Розенброка, но обладают более хорошими свойствами точности и устойчивости. Более существенно, они достаточно просто реализуются с замораживанием матрицы Якоби.

Здесь разработан L-устойчивый (3,2)-метод третьего порядка точности для решения жестких задач. Построено неравенство для контроля точности вычислений, основанное на оценке аналога глобальной ошибки. Оценка осуществляется с привлечением ранее вычисленных стадий, что позволяет выбирать величину шага интегрирования фактически без увеличения вычислительных затрат. Сформулирован последовательный алгоритм и его параллельный аналог – MPI-алгоритм.

1. Класс (m, k)-методов решения жестких задач

Рассмотрим задачу Коши для системы дифференциальных уравнений вида

y′ = f(y); y(t₀) = y₀; t₀ ≤ t ≤ tk, (1)

где y и f – вещественные N-мерные вектор-функции; t – независимая переменная. Пусть Z – множество целых чисел, и заданы числа m, k ∈ Z, k ≤ m. Обозначим через M_m множество чисел {i ∈ Z, 1 ≤ i ≤ m}, а через M_k и J_i, 1 < i ≤ m подмножества из M_m вида

novikov001.wmf

novikov002.wmf

где 1 ≤ i ≤ m. Тогда класс (m, k)-методов записывается следующим образом [5]:

novikov003.wmf novikov004.wmf

novikov005.wmf i ∈ Mk, (2)

novikov006.wmf i ∈ M_m\M_k,

где k_i, 1 ≤ i ≤ m, - стадии метода; a, p_i, β_ij, α_ij и c_ij - постоянные коэффициенты; h - шаг интегрирования; E - единичная матрица; f′_n = ∂f(y_n)/∂y - матрица Якоби системы (1); k - количество вычислений функции f на шаге; m - число стадий. На каждом шаге интегрирования осуществляются одно вычисление матрицы Якоби и одна декомпозиция матрицы D_n. Так как k и m полностью определяют затраты на шаг, а набор чисел m₁, ..., m_k из множества M_k только распределяет их внутри шага, то методы типа (2) названы (m, k)-методами. Основное отличие приведенных методов (2) от существующих численных формул состоит в том, что в них стадия метода не связывается с обязательным вычислением правой части исходной задачи (1), за счет этого свойства методов могут быть улучшены.

При k = m и α_ij = c_ij = 0 схемы (2) совпадают с методами типа Розенброка [10], а при k = m и α_ij= 0 – с ROW-методами [9]. В отличие от ROW-методов в численных формулах (2) более точно определены затраты на шаг интегрирования и более правильно описана область определения коэффициентов численных формул, что упрощает их исследование и делает их предпочтительнее. При рассмотрении методов такого типа в основном изучался случай k = m, то есть когда число стадий и количество вычислений правой части задачи (1) совпадают. В этом случае k-стадийную схему (2) можно поставить в соответствие k-стадийной полуявной формуле типа Рунге ‒ Кутты, при реализации которой на каждом шаге используется одна матрица размерности N. Относительно таких численных формул известно, что нельзя построить k-стадийную схему выше (k + 1)-го порядка точности, причем схема максимального порядка A-устойчивая. Если рассматривать схемы (2) при m > k, то можно построить численные схемы более высокого порядка точности [5].

2. Исследование (3, 2)-метода

Рассмотрим численную формулу вида

novikov007.wmf (3)

Разлагая стадии k_i, 1 ≤ i ≤ 3 в ряды Тейлора и подставляя в первую формулу (3), получим ряд Тейлора для приближенного решения y_n + 1. Полагая y_n = y(t_n) и сравнивая ряды для точного и приближенного решений, получим условия третьего порядка точности схемы (3), то есть

novikov008.wmf novikov009.wmf

novikov010.wmf novikov011.wmf

Положим a, β₃₁ и β₃₂ свободными и исследуем эту систему на совместность. Получим

novikov012.wmf

novikov013.wmf (4)

novikov014.wmf novikov015.wmf

где β = β₃₁ + β₃₂. Исследуем устойчивость схемы (3) на линейном скалярном уравнении y′ = λy, где смысл комплексного числа λ, Re(λ) < 0, – некоторое собственное число матрицы Якоби задачи (1). Применяя (3) для решения этого уравнения, получим y_n _{+ 1} = Q(z)y_n, где z = hλ, а функция устойчивости Q(z) записывается следующим образом:

novikov016.wmf

Из вида Q(z) следует, что для L-устойчивости схемы (3) необходимо выполнение соотношения

a²- a(p₁ + p₃) + β₃₁p₃ = 0.

Подставляя сюда коэффициенты (4), получим уравнение

a³-3a² + 1,5a - 1/6 = 0.

Далее, сравнивая представление приближенного и точного решений до членов с h⁴ включительно, видим, что слагаемые с элементарными дифференциалами f′′′f³ и f′′f′f² в главном члене локальной ошибки будут отсутствовать, если

novikov017.wmf

novikov018.wmf

Теперь отсюда и (4) получим набор коэффициентов

novikov019.wmf

novikov020.wmf

novikov021.wmf

novikov022.wmf

novikov023.wmf

novikov024.wmf ,

при которых локальная ошибка δ_n,3 схемы (3) имеет вид

novikov025.wmf

где значение a определяется из условия L-устойчивости

a³ – 3a²+ 1,5a – 1/6 = 0.

Это уравнение имеет три вещественных корня. Согласно [2] требование A-устойчивости схемы (3) имеет вид 1/3 ≤ a ≤ 1,0685790, поэтому выбираем корень a = 0,435866521508459.

В жестких задачах поведение ошибки определяется элементарным дифференциалом f′³f [5]. Поэтому при построении оценки аналога глобальной ошибки будем учитывать только первое слагаемое в локальной ошибке. Для контроля точности вычислений и автоматического выбора величины шага интегрирования используем идею вложенных методов. Для этого рассмотрим двухстадийный метод (2) вида

novikov026.wmf

novikov027.wmf novikov028.wmf (5)

где y_n вычислено по формуле (3). В численной формуле (5) применяются стадии метода (3), и поэтому она практически не приводит к увеличению вычислительных затрат. Нетрудно видеть, что при коэффициентах b₁ = 0,5(4a – 1)/a и b₂ = 0,5(1 – 2a)/a схема (5) имеет второй порядок точности, а ее локальная ошибка имеет вид

δ _n,2 = (6a² – 6a + 1)h³ f′²f/6 + O(h⁴).

Тогда в неравенстве для контроля точности можно применять оценку ошибки ε_n(j_n) вида [5]

novikov029.wmf (6)

где

c = 4·|6a² – 6a + 1|/|1 – 12a + 36a² – 24a³| ≈ 3.

При j_n = 1 оценка ε_n(j_n) будет A-устойчивой, а при j_n = 2 – L-устойчивой. Теперь неравенство для контроля точности имеет вид

novikov030.wmf 1 ≤ jn ≤ 2, (7)

где ε – требуемая точность интегрирования, а параметр j_n выбирается с наименьшим значением, при котором выполняется неравенство (7). Норма ||ξ|| в (7) вычисляется по формуле

novikov031.wmf

В случае выполнения неравенства novikov032.wmf по i-й компоненте решения контролируется абсолютная ошибка vε, в противном случае контролируется относительная ошибка ε.

3. Последовательный алгоритм интегрирования и его параллельная версия

Запишем схему (3) в покомпонентной форме, имеем

novikov033.wmf (8)

где 1 ≤ i ≤ N, novikov034.wmf novikov035.wmf и novikov036.wmf есть элементы векторов приращений novikov037.wmf novikov038.wmf и novikov039.wmf novikov040.wmf novikov041.wmf novikov042.wmf и novikov043.wmf есть элементы матрицы D_n и векторов g⁽ⁿ⁾ , σ⁽ⁿ⁾ , w⁽ⁿ⁾ ;

novikov044.wmf

novikov045.wmf

novikov046.wmf

novikov047.wmf

при i = j и novikov048.wmf при i ≠ j. Здесь novikov049.wmf – элементы матрицы Якоби novikov050.wmf задачи (1), вычисленные на решении y(n), novikov051.wmf – элементы вектора правой части f(y). Применение LU-разложения [8] приводит к системам уравнений для нахождения стадий novikov052.wmf novikov053.wmf и novikov054.wmf , то есть

novikov055.wmf novikov056.wmf 1 ≤ i ≤ N;

novikov057.wmf novikov058.wmf 1 ≤ i ≤ N; (9)

novikov059.wmf novikov060.wmf 1 ≤ i ≤ N,

где novikov061.wmf при i ≤ j и novikov062.wmf при i > j.

Используя обозначения элементов обратной матрицы novikov063.wmf через novikov064.wmf , нормы ошибок вычисляем по формулам

novikov065.wmf (10)

novikov066.wmf (11)

Пусть приближение y_n к решению y(t_n) задачи (1) вычислено в точке t_n с шагом h_n. Тогда учитывая, что имеет место novikov067.wmf 1 ≤ j_n ≤ 2, последовательный алгоритм интегрирования формулируется следующим образом.

Шаг 1, 2. Вычислить матрицу Якоби novikov068.wmf и сформировать матрицу novikov069.wmf

Шаг 3. Выполнить декомпозицию матрицы novikov070.wmf

Шаг 4, 5. Вычислить

novikov071.wmf

novikov072.wmf

Шаг 6, 7. Вычислить

novikov073.wmf

novikov074.wmf

Шаг 8. Вычислить

novikov075.wmf

Шаг 9, 10. Вычислить норму ошибки novikov076.wmf по формуле (10) и q₁ по формуле

novikov077.wmf .

Шаг 11. Если q₁ < 1, то есть требуемая точность не достигнута, то вычисляется novikov078.wmf по формуле (11). В противном случае novikov079.wmf полагается равным novikov080.wmf .

Шаг 12. Вычислить значение параметра q₂ по формуле novikov081.wmf .

Шаг 13. Если q₂ < 1, то hn полагается равным q₂h_n и возврат на шаг 2.

Шаг 14. Вычислить приближение к решению в точке tn + 1 по формуле (8), то есть

novikov082.wmf

Шаг 15. Вычислить значение h_{n + 1} по формуле h_{n + 1} = min(q₁, q₂)h_n.

Шаг 16. Выполнить следующий шаг интегрирования.

Замечание

При численном вычислении матрицы Якоби шаг численного дифференцирования r_i, 1 ≤ i ≤ N, выбирается по формуле [6]

novikov083.wmf 1 ≤ j ≤ N,

где r_min – минимальный шаг численного дифференцирования, зависит от разрядности вычислительной системы. При расчетах с двойной точностью величину r_min следует принять равной 10^–14. Тогда j-й столбец novikov084.wmf численной матрицы вычисляется по формуле

novikov085.wmf

то есть для задания матрицы требуется N вычислений правой части системы дифференциальных уравнений (1).

Если рассматривать алгоритм (3, 2)-метода (3), (8) как объект для распараллеливания, то его последовательный вариант выглядит как процесс вычисления векторов приращений novikov086.wmf , 1 ≤ i ≤ 3. При этом на каждом n-м шаге вычисления имеют последовательный порядок, novikov087.wmf При построении параллельного алгоритма необходимо сохранить этот порядок вычисления. Элементы каждого из векторов приращений получаются из решения систем линейных уравнений с одинаковой матрицей D_n и разными правыми частями.

Предположим, что размерность N системы (1) связана с размером p вычислительной системы соотношением N = s·p. Для Dn выберем блочно-строчную схему хранения. Тогда параллельный аналог (3,2)-метода (3) запишется в виде [7]

novikov088.wmf (12)

где 1 ≤ i ≤ p, novikov089.wmf .

Теперь сформулируем параллельный алгоритм вычисления приближенного решения с контролем точности вычислений. Для контроля точности в (12) используем процессор pr(1). Пусть известно приближение y⁽ⁿ⁾ в точке t_n с шагом h_n. Тогда для вычисления y^{(n + 1)} в точке t _{n + 1} справедлив параллельный алгоритм, в котором на каждом процессоре pr(j) формируется своя s_j-я часть матрицы D_n, векторов novikov090.wmf novikov091.wmf novikov092.wmf и вектора решения novikov093.wmf .

Шаг 1. В каждом pr(j), 1 ≤ i ≤ p, novikov094.wmf :

а) выполнить recv novikov095.wmf

б) вычислить novikov096.wmf

в) вычислить матрицу Якоби.

Шаг 2, 3. Сформировать матрицу novikov097.wmf и разложить

novikov098.wmf .

Шаг 4, 5. Вычислить

novikov099.wmf

novikov100.wmf .

Шаг 6. В каждом pr(j), 1 ≤ i ≤ p, novikov101.wmf :

а) выполнить

recv novikov102.wmf

б) вычислить

novikov103.wmf

в) выполнить send novikov104.wmf .

Шаг 7. В каждом pr(j), 1 ≤ j ≤ p, novikov105.wmf :

а) выполнить recv novikov106.wmf

б) сформировать novikov107.wmf

в) вычислить novikov108.wmf и novikov109.wmf

Шаг 8. Вычислить

novikov110.wmf .

Шаг 9. В каждом pr(j), 1 ≤ j ≤ p, novikov111.wmf :

а) вычислить

novikov112.wmf

б) вычислить

novikov113.wmf

в) вычислить

novikov114.wmf

г) вычислить

novikov115.wmf

д) send novikov116.wmf

Шаг 10. В pr(1):

а) выполнить

recv novikov117.wmf

выполняется последовательность действий по контролю точности и вычисление значения h_n;

б) выполнить send (h_n, rp; 1, …, p). При rp = 1 – возврат на шаг 2, при rp = 0 – переход на шаг 11.

Шаг 11. В каждом pr(j), 1 ≤ j ≤ p, novikov118.wmf :

а) выполнить recv (h_n, rp; 1);

б) вычислить novikov119.wmf

в) выполнить send novikov120.wmf .

Шаг 12. В pr(1):

а) вычислить h_{n + 1} по формуле

h _{n + 1} = min(q₁, q₂)h_n;

б) send (h _{n + 1}; 1, …, p).

Шаг 13. Выполнить следующий шаг интегрирования.

Замечание

Представленный алгоритм является параллельно-последовательным. В нем не учтены фрагменты, относящиеся к вычислению правой части (1) и матрицы Якоби, а также обращение матрицы Якоби, необходимое при невыполнении неравенства по точности. Для LU-разложения используется частичный выбор по столбцу.

В (m, k)-методах стадия метода не связывается с обязательным вычислением правой части исходной задачи. За счет этого их свойства могут быть улучшены. Данные схемы можно рассматривать как способ реализации неявных методов типа Рунге – Кутты. Важно, что при такой реализации не требуются итерации метода Ньютона, а все проблемы решаются за счет выбора шага интегрирования. Построена параллельная MPI-версия алгоритма интегрирования переменного шага, ориентированная на кластерные системы и топологию полного графа. В [1] построено соотношение изоэффективности, которое может быть использовано для сравнения различных параллельных алгоритмов решения одной и той же задачи Коши на основе (3,2)-метода, а также подходов к выбору и построению алгоритмов вычисления матрицы Якоби и алгоритмов ее факторизации. В особенности это относится к оценке коммуникационных затрат при организации межпроцессорных обменов.

Работа выполнена при финансовой поддержке РФФИ (проект 14-01-00047).

Рецензенты:

Белолипецкий В.М., д.ф.-м.н., профессор, главный научный сотрудник, ФГБУН «Институт вычислительного моделирования» СО РАН, г. Красноярск;

Плотников С.М., д.т.н., профессор, ФГБОУ ВПО «Сибирский государственный технологический университет», г. Красноярск.

Работа поступила в редакцию 10.07.2014.

Scientific journal
Fundamental research

ISSN 1812-7339

"Перечень" ВАК

ИФ РИНЦ = 1,674

AN L-STABLE METHOD OF THIRD ORDER FOR THE NUMERICAL INTEGRATION STIFF PROBLEMS

Fundamental research
Scientific journal | ISSN 1812-7339 | Certificate - PI №77-15598