Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

AUTOMATIZATION OF DATA PROCESSING AND CALCULATION OF CHROMATOGRAPHIC PARAMETERS USING MATHCAD

Faerman V.A. 1 Makarycheva A.I. 2 Slizhov Y.G. 2
1 National Research Tomsk Polytechnic University
2 National Research Tomsk State University
The study of ways of automated chromatographic data processing for scientific purposes was carried out. The program method of calculation of the adjusted retention time, corrected retention volume, specific retention volume, as well as of the thermodynamic parameters of adsorption – differential molar free adsorption energy, partial molar dissolution enthalpy and isosteric adsorption heat for an unlimited number of analytes was developed. The suggested approach automates the processing and storage of chromatographic information and has the ability to modify data processing algorithm without help of a programmer. This is accomplished by simultaneous using Mathcad program for data processing and MS Excel spreadsheets for data representation. The approach was successfully tested during the chromatography polarity evaluation of the modified Silochrome S-80.
gas chromatography
retention parameters
chelating sorbents
Mathcad
chromatographic data processing
1. Maksfild B. Mathcad v inzhenernyh raschjotah, Kiev: Korona-Vek, MK-Press, 2010, 368 p.
2. Nuriev N.K., Pashukov E.V. Obrabotka eksperimentalnyh dannyh v zadachah himicheskogo profilja metodom naimenshih kvadratov v programmnyh sredah Microsoft Office Excel i Mathcad, Vestnik Marijskogo gosudarstvennogo universiteta, 2011, no 7, pp. 116–118.
3. Stoljarov B.V., Savinov I.M., Vitenberg A.G., Karcova L.A., Zenkevich I.G., Kalmanovskij V.I., Kalambet Ju.A. Prakticheskaja gazovaja i zhidkostnaja hromatografija: uchebnoe posobie, M: S.-Peterburg. un-ta, 2002, 616 p.
4. Tanganov B.B., Krupennikova V.E. Perspektivy kompjuterizacii himicheskih issledovanij, Mezhdunarodnyj zhurnal prikladnyh i fundamentalnyh issledovanij, 2011, no 5, pp. 35–38.
5. Abraham M.H., Poole C.F., Poole S.K., Classification of stationary phases and other materials by gas chromatography, J. Chromatogr. A., 1999, 842, рр. 79‒114.
6. Makarycheva A.I., Slizhov Yu.G., Synthesis of Silica Gel with Surface Layer of Transition Metals 8-Oxyquinolinates for Gas Chromatography, Advanced Materials Research, 2014, 1040, p. 405–409.
7. De Levie R. How to Use Excel in Analytical Chemistry And in General Scientific Data Analysis, Cambridge University Press, 2004, 501 p.

В настоящее время, несмотря на значительный прогресс в аппаратном оформлении метода хроматографического анализа, программные решения в области обработки хроматографических данных несколько ограничены в применимости [3]. Известны многочисленные разновидности как зарубежных, так и отечественных программных продуктов для обработки хроматографических данных («Chemstation», «Мультихром» «Кристалл» и др.). Однако большинство из них не в полной мере отвечают потребностям исследователей, что связано с многообразием реальных аналитических задач и специфичностью связанных с их решением расчётов. В частности, основной задачей подобных программных продуктов является автоматизация проведения количественного газохроматографического анализа, в то время как для характеристики новых хроматографических материалов требуется специфический набор алгоритмов для обработки параметров удержания аналитов и расчёта ряда величин на их основе. Так, изучение полярности и селективности сорбентов осложнено существованием различных подходов к определению данных понятий [5], в связи с чем у исследователя возникает необходимость модификации способов обработки экспериментальных данных и, следовательно, внесения изменений в реализуемые программно методики расчетов.

Анализ путей автоматизации обработки хроматографических данных

Недостатки подхода к ручной (с использованием инженерного калькулятора) обработки результатов экспериментальных исследований в общем и хроматографических данных в частности представляются очевидными. Во-первых, анализ большого объёма данных требует значительных временных затрат. Во-вторых, со сложностью применяемых математических методов обработки данных возрастает вероятность внесения исследователем ошибки в результаты, обнаружение и устранение которых требует дополнительных усилий [4]. В-третьих, как исходные данные, так и результаты их анализа хранятся без строгой привязки определенному формату, что усложняет их дальнейшее применение и затрудняет их восприятие другими членами коллектива. Все вышеописанные трудности имеют место при обработке хроматографических параметров, и в этой связи представляется необходимой автоматизация процесса.

Несмотря на то, что наиболее очевидным и простым решением представляется использование специализированных программных продуктов, ориентированных на обработку данных, полученных в ходе физико-химических исследований, их применение оказывается всё же ограниченным. Таким образом, можно говорить о «гибкости» как об одном из ключевых требований к используемым программным решениям, что накладывает ограничения на применение проприетарных продуктов с закрытым исходным кодом.

В качестве альтернативного решения может рассматриваться разработка собственного программного продукта, в полной мере удовлетворяющего потребностям коллектива исследователей на одном из объектно-ориентированных языков программирования высокого уровня, таких как С#, Visual Pascal, C++ и аналогичных. Однако недостатком такого подхода является необходимость привлечения группы квалифицированных программистов для разработки и сопровождения программного продукта, с одной стороны, и специалиста в области системного анализа для формализации задачи и подготовке технического задания, с другой стороны. Стоит отметить, что небольшие исследовательские коллективы, как правило, не обладают достаточными финансовыми ресурсами для привлечения сторонних специалистов.

В связи с вышеизложенным все большее распространение получают программные средства обработки и хранения экспериментальных данных, разработанные на базе доступных офисных приложений и математических пакетов без привлечения программистов [7]. Так, например, распространённым решением обработки химических данных является среда электронных таблиц MS Excel [7]. Широкое применение данного программного решения обусловлено, с одной стороны, широкой доступностью пакета MS Office, частью которого является MS Excel, а с другой стороны – наличием базовых навыков использования электронных таблиц у значительной части исследователей, специализацией которых не являются информационные технологии.

Очевидным преимуществом использования MS Excel является структурированность и наглядность представления имеющихся экспериментальных данных и результатов их обработки. Кроме того, электронные таблицы позволяют относительно просто организовывать обработку больших объёмов однотипных данных в соответствии с несложными алгоритмами, ограничивающимися последовательностью арифметических операций, проверок логических условий [7]. Тем не менее ограниченность набора предзаданных функций и их нацеленность на работу с табулированными данными затрудняет реализацию в Excel более сложных алгоритмов обработки результатов экспериментов, требующих, например, экстраполяции значений по некоторым наборам данных, построения регрессионных моделей, решение систем дифференциальных уравнений, выполнений преобразований Фурье и применения других алгоритмически сложных математических методов. Указанный недостаток в значительной степени обуславливается невозможностью непосредственной реализации в среде электронных таблиц циклов и рекурсий [7]. Несмотря на то, что реализация этих алгоритмических конструкций в MS Excel возможна посредством специальных программ, написанных на языке Visual Basic for Applications (VBA) [7], это требует привлечения профессионалов.

Большей применимостью с точки зрения реализации подобных алгоритмов обладают математические пакеты. Преимуществом последних является то, что они сочетают в себе большой набор разнообразных математических функций и основные средства программирования, достаточно простые, чтобы эффективно использоваться не программистами [1]. Часто используемыми при обработке данных и автоматизации научной деятельности в целом, в особенности в академической среде, являются математические пакеты Mathcad и Matlab. Данные программные продукты обладают в целом схожими возможностями (применительно к решению обобщенной задачи обработки данных, полученных в ходе химических экспериментов), но и имеют собственную специфику. При этом Mathcad, отличающийся визуально-ориентированным входным языком, более прост в освоении и представляется более предпочтительным решением [1]. Кроме того, в качестве достоинства Mathcad можно отметить более низкую стоимость академической лицензии.

Тем не менее при использовании математического пакета непосредственно для обработки данных (а также их визуализации), предпочтительно сохранить наглядность представления числовых данных, обеспечиваемую применением электронных таблиц. В связи с этим была принята концептуальная модель разрабатываемого решения, представленная на рис. 1.

pic_58.wmf

Рис. 1. Концептуальная схема решения

Такое решение обладает рядом достоинств как на этапе его реализации, так и на этапе практического применения. В частности, используемые в качестве «среды разработки» программные продукты являются широко доступными для академических коллективов [2], а сама процедура реализации решения представляет собой сравнительно простую задачу, которая сводится к формализации алгоритма обработки данных и не требует привлечения сторонних специалистов. Другим достоинством является то, что исходные (экспериментальные) данные представляются в виде электронных таблиц, что позволяет не только унифицировать их формат, но и посредством встроенных средств MS Excel контролировать его соблюдение и производить автоматическое форматирование [7].

Получение экспериментальных данных

В работе в качестве первичных экспериментальных данных были обработаны времена удерживания тестовых соединений и параметры хроматографического анализа для ряда сорбентов, среди которых силикагель марки Силохром С80, а также сорбенты на его основе, адсорбционно модифицированные 8-оксихинолинатами меди(II), кобальта(II) и никеля(II) [6]. Для оценки хроматографической полярности и селективности исследуемых хроматографических материалов использовали органические соединения различных классов: алканы, алкены, спирты, альдегиды и кетоны, нитросоединения, а также ароматические соединения.

Времена удерживания тестовых соединений определялись на газовом хроматографе МАЭСТРО 7820А (Agilent Technologies) с пламенно-ионизационным детектором в различных изотермических режимах. Сигналы детектора обрабатывались с помощью программного продукта ChemStation. Дальнейшая обработка экспериментальных данных осуществлялась в соответствии с формулами и алгоритмами описанными в разделе далее.

Обработка экспериментальных данных

Приведенное время удерживания faerman01.wmf определяется по формуле [3]

faerman02.wmf

где tм – время пребывания в хроматографической системе неудерживаемого вещества, мин, в качестве которого использовали метан.

Приведенный удерживаемый объем (исправленный объем удерживания) faerman03.wmf [3]:

faerman04.wmf

где Fc – объемная скорость газа-носителя, мл/мин.

В качестве относительных параметров удерживания, которые не зависят от случайных небольших колебаний параметров хроматографического анализа, были рассчитаны индексы Ковача согласно формуле [3]

faerman05.wmf

где faerman06.wmf – приведенные времена удерживания тестового вещества и н-алканов с числом углеродных атомов n и n + 1, элюирующихся до и после исследуемого сорбата.

Значения дифференциальной молярной свободной энергии адсорбции тестовых соединений вычисляются по формулам [6]

faerman07.wmf

faerman08.wmf

где R = 8,314 Дж/моль·К; T – температура колонки, К; I – индекс удерживания вещества при температуре колонки T; n – число атомов углерода одного из реперных н-алканов; faerman09.wmf; faerman10.wmf – приведенное время удерживания; Vgn – удельный удерживаемый объем н-алкана с числом атомов углерода равным n.

Величины удельных удерживаемых объемов определяются в соответствии с формулой [3]

faerman11.wmf

где FC – объемная скорость газа-носителя, мл/мин; WS – масса сорбента, г; TC – температура колонки, °C; pо – барометрическое давление, Па; pi – давление на входе в колонку, Па.

Также на основе удельного удерживаемого объема производится расчет термодинамических характеристик адсорбции. Значения парциальной мольной энтальпии растворения:

faerman12.wmf

где ΔH – парциальная мольная энтальпия растворения; R – универсальная газовая постоянная; Vg(1) и Vg(2) – удельные объемы удерживания при температуре колонки T1, T2.

Изостерические теплоты адсорбции:

faerman13.wmf

где Q – изостерическая теплота адсорбции; Vg(1) и Vg(2) – удельные объемы удерживания при температуре колонки T1, T2.

Описание программы

В качестве исходных данных в виде двумерного массива на вход реализованного в Mathcad алгоритма поступали времена удерживания тестовых соединений, которые агрегировались в файле MS Excel. При этом значение времени удерживания, соответствующее определенным тестовому веществу и условиям экспериментов (температуре колонки и сорбенту), содержалось в ячейке, расположенной на пересечении строки, соответствующей тестовому веществу и столбца, соответствующего условиям эксперимента. Фрагмент электронной таблицы, содержащей исходные данные, представлен на рис. 2.

pic_59.tif

Рис. 2. Фрагмент электронной таблицы MS Excel, содержащей исходные данные

В связи с тем, что каждый столбец исходных данных, поступающих на вход программы, представлял собой набор результатов экспериментов с различными тестовыми веществами, производимых при фиксированной температуре колонки и с одним сорбентом, его обработка могла осуществляться независимо от остальных данных, а ее результаты должны были фиксироваться обособленно. Таким образом, для выбора анализируемых данных, в среде Mathcad с помощью VBScript (Visual Basic Scripting Edition) был реализован стандартный элемент управления ListBox, позволяющий выбрать единственный вариант из предложенного набора, количество элементов в котором определялось числом столбцов в исходном массиве. При формировании набора строк, отображаемых в элементе управления, использовалась следующая информация, также извлекаемая из электронной таблицы: название используемого сорбента, температура колонки, дата проведения экспериментов. Примерный вид элемента управления ListBox представлен на рис. 3.

Опираясь на значения времён удерживания, содержащихся в выбранном массиве, для каждого из использованных тестовых веществ производились вычисления искомых величин. Результаты расчетов представлялись в формате MS Excel, с применением компонента интеграции электронных таблиц в Mathcad. Фрагменты таблиц, содержащих результаты обработки экспериментальных данных, представлены на рис. 4.

pic_60.tif

Рис. 3. Элемент управления ListBox

pic_61.tif

Рис. 4. Фрагменты электронных таблиц, содержащих рассчитанные параметры сорбции (а – тестовых соединений; б – алканов) для Силохрома С80, модифицированного оксихинолинатом никеля(II)

Заключение

С использованием математического пакета Mathcad в сочетании с возможностями электронных таблиц MS Excel был разработан способ обработки хроматографической информации, позволяющий оперировать большим числом данных, которые отражают как информацию о дате и объектах исследования (природа аналитов, используемые сорбционные материалы), физических параметрах хроматографического процесса (температура колонки, скорость газа-носителя, давление на входе в колонку и др.), так и непосредственно результаты хроматографического анализа (времена удерживания аналитов). Полученный метод позволяет быстро и с достаточной точностью обрабатывать хроматографические данные, представляя результаты расчета параметров удерживания и термодинамических величин сорбции аналитов в формате, удобном для их дальнейшей интерпретации. Так, на примере Силохрома С80, модифицированного 8-оксихинолинатами металлов, проведена оценка хроматографической полярности с использованием программно рассчитанных величин ∆G, ∆H, Q.

Реализованное программное решение позволяет хроматографисту самостоятельно вносить изменения и дополнения в алгоритм обработки данных, что расширяет границы его применимости для расчета разнообразных величин на основе параметров хроматографического удерживания в целях детального изучения и характеристики новых сорбционных материалов.

Работа выполнена в рамках государственного задания (№ госрегистрации 114051370021) Минобрнауки РФ по проекту № 1432.

Рецензенты:

Дунаевский Г.Е., д.т.н., профессор, Национальный исследовательский Томский государственный университет, г. Томск;

Берестнева О.Г., д.т.н., профессор кафедры прикладной математики, Национальный исследовательский Томский политехнический университет, г. Томск.