Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

THE AGENT-BASED MODELING OF ENTRANTS` UNIVERSITY CHOICE IN RUSSIA

Nasadkin M.Y. 1 Pitukhin E.A. 1 Astafeva M.P. 2
1 Petrozavodsk State University
2 Branch of International University for Nature Society and Man «Dubna»
In the present paper we consider the construction of a model of the entrants’ behavior for admission to institutions of higher education in Russia. The agent-based modeling is taken as a methodology of computer simulation. Each entrant is presented by virtual agent, which has a set of stochastic properties. All factors can be divided by two groups: deterministic factors of educational environment and stochastic factors of entrants. We suggest the schema of calculating utility functions for each virtual entrant which determine prospective pairs «university-specialty» and an iterate procedure of matriculation. The procedure is based on confidence criteria. Each entrant evaluates probability of successful matriculation using knowledge on sorted lists of all entrants. Full schema of modeling is presented in paper. Adequacy of model may be verified on retrospective data if we use contest (number of entrants claiming one state-funded place) as a result property. The paper’s character is introductory: we present methodology but not results of modeling.
agent-based modeling
modeling of enrollment campaign
factors of university choice
1. Abankina I.V. Model mnogostupenchatogo vybora dlja prognozirovanija sprosa na vysshee obrazovanie / I.V. Abankina i dr. // Universitetskoe upravlenie: praktika i analiz. 2014. no. 4–5. рр. 84–94.
2. Informacionno-analiticheskie materialy po rezultatam analiza pokazatelej jeffektivnosti obrazovatelnyh organizacij vysshego obrazovanija [Jelektronnyj resurs]. Rezhim dostupa: http://miccedu.ru/monitoring/2014 (data obrashhenija: 01.07.2015).
3. Kiselgof S.A. Vybor vuzov abiturientami s kvadratichnoj funkciej poleznosti: preprint WP7/2011/01; Vysshaja shkola jekonomiki. M.: Izd. dom Vysshej shkoly jekonomiki, 2011. 44 р.
4. Pituhin E.A. Analiz mezhregionalnoj mobilnosti vypusknikov shkol pri postpulenii v vysshie uchebnye zavedenija / Pituhin E.A., Semenov A.A. // Universitetskoe upravlenie: praktika i analiz. 2011. no. 3. рр. 82–89.
5. Prahov I.A. Model vybora vuza v uslovijah EGJe i rol ozhidanij abiturientov: preprint WP10/2010/06; Gos. un-t Vysshaja shkola jekonomiki. M.: Izd. dom Gos. un-ta Vysshej shkoly jekonomiki, 2010. 56 р.
6. Gale D., Shapley L.S. College Admissions and the Stability of Marriage. The American Mathematical Monthly. Vol. 69. no. 1 (Jan., 1962). рр. 9–15.

В настоящее время в России усилилось внимание общества к вопросам построения карьеры, как со стороны исполнительной власти, так и со стороны родителей и самой молодежи. Этому способствует увеличение количества доступной информации о качестве образования в российских вузах и возможных перспективах построения карьеры. С этой точки зрения интересным представляется исследование того, как абитуриенты реагируют на характеристики и изменения внешней образовательной среды.

Схожие задачи по моделированию выбора вузов абитуриентами решались в работах С.А. Кисельгоф «Выбор вуза абитуриентами с квадратичной функцией полезности» [3], И.А. Прахова «Модель выбора вуза в условиях ЕГЭ и роль ожиданий абитуриентов» [5] и др. Во всех изученных работах в качестве методологии в основу брались известные результаты D. Gale, L.S. Shapley «College Admissions and the Stability of Marriaga» [6]. Кроме того, укажем и ряд других стоящих внимания работ об источниках информации о влияющих на выбор абитуриента факторах. И.В. Абанкина и другие в работе «Модель многоступенчатого выбора для прогнозирования поведения спроса на высшее образование» [1] рассматривали некоторые из факторов выбора вузов. Факторы образовательной привлекательности регионов для абитуриентов рассматривались в работе Е.А. Питухина «Анализ межрегиональной мобильности выпускников школ при поступлении в высшие учебные заведения» [4].

В данной статье для решения задачи выбора вуза применяется агентное моделирование. Рассматривается методология моделирования; набор факторов, влияющих на решения абитуриентов; набор факторов внешней среды; вводятся функции полезности от поступления конкретного абитуриента на специальность конкретного вуза; указывается весь алгоритм проведения моделирования и перспективы развития.

Схема моделирования

Генерация популяции абитуриентов

Каждый из абитуриентов характеризуется такими группами показателей, как баллы Единого Государственного Экзамена (ЕГЭ); финансовое положение семьи; стремление абитуриента обучаться бесплатно; интерес абитуриента к различным образовательным специальностям; значимость общедоступных и публикуемых в России показателей вузов и региона; отношение выпускника к переезду в другой регион. Ниже представлен подробный список факторов, влияющих на выбор вуза абитуриентом: набор экзаменов (ЕГЭ), которые сдает абитуриент; баллы ЕГЭ за каждый экзамен и показатель Ei,j – суммарный балл ЕГЭ для поступления на специальность j; nasadkin01.wmf – сумма, которую семья абитуриента i готова тратить на обучение в год; nasadkin02.wmf – стремление абитуриента i обучаться бесплатно; nasadkin03.wmf – интерес абитуриента i к специальности j; nasadkin04.wmf – значимость показателя образовательной деятельности вуза для абитуриента i; nasadkin05.wmf – значимость показателя научно-исследовательской деятельности вуза для абитуриента i; nasadkin06.wmf – значимость показателя инфраструктуры вуза для абитуриента i; nasadkin07.wmf – значимость показателя международной деятельности вуза для абитуриента i; nasadkin08.wmf – значимость показателя финансово-экономической деятельности для абитуриента i; nasadkin09.wmf – значимость показателя бренда вуза для абитуриента i; nasadkin10.wmf – значимость показателя трудоустройства по специальности для абитуриента i; nasadkin11.wmf – значимость показателя средней заработной платы в регионе для абитуриента i; nasadkin12.wmf – значимость показателя безработицы в регионе для абитуриента i; nasadkin13.wmf – значимость востребованности на рынке труда в регионе для абитуриента i; nasadkin14.wmf – значимость показателя культурного уровня в регионе для абитуриента i; nasadkin15.wmf – значимость показателя уровня преступности в регионе для абитуриента i; nasadkin16.wmf – показатель, описывающий стремление абитуриента i к переезду в регион s(k), в котором находится вуз k.

Конкретные значения показателей каждого из генерируемых абитуриентов – агентов формируются с помощью реализации случайных величин. Эти случайные величины описываются с помощью заранее подобранных функций распределения F(x, p0), где p0 – вектор параметров распределения, зависящий от конкретного вида распределения. Впоследствии параметры распределений подбираются с помощью проверки адекватности модели на ретроспективных данных.

Помещение абитуриентов во внешнюю среду

Созданная популяция абитуриентов помещается во внешнюю среду в соответствии с реальным распределением. Каждому абитуриенту задается его фактическое местоположение. Внешняя среда задается набором детерминированных показателей, которые представлены ниже: Bj,k(year – 1) – проходной балл ЕГЭ прошлого по отношению к моделируемому году в вуз k по специальности j; набор экзаменов (ЕГЭ), необходимых для поступления на каждую из специальностей j; nasadkin17.wmf – стоимость обучения по специальности j в вузе k за год; nasadkin18.wmf – показатель образовательной деятельности вуза k; nasadkin19.wmf – показатель научно-исследовательской деятельности вуза k; nasadkin20.wmf – показатель инфраструктуры вуза k; nasadkin21.wmf – показатель международной деятельности вуза k; nasadkin22.wmf – показатель финансово-экономической деятельности вуза k; nasadkin23.wmf – показатель трудоустройства выпускников вуза k по специальности j; nasadkin24.wmf – показатель «бренда» вуза k; nasadkin25.wmf – средняя заработная плата в регионе (городе) s(k); nasadkin26.wmf – уровень безработицы в регионе (городе) s(k); nasadkin27.wmf – культурный уровень в регионе (городе) s(k); nasadkin28.wmf – уровень преступности в регионе (городе) s(k); nasadkin29.wmf – востребованность на рынке труда региона (города) s(k) выпускников по специальности j.

Расчет функций полезности поступления

Следующий этап процесса моделирования заключается в том, что агенты-абитуриенты, обладающие наборами случайных величин и помещенные во внешнюю среду, должны определиться, какие возможные пары «вуз – специальность» им подходят в наибольшей мере. Будем рассматривать полезность поступления в вуз из 4 составляющих:

● Соответствие баллов ЕГЭ абитуриента i проходным баллам прошлых лет по специальности j в вузе k будем обозначать nasadkin30.wmf.

● Интерес абитуриента i к различным специальностям j будем обозначать как nasadkin31.wmf.

● Значимость для абитуриента i факторов вуза (эффективность деятельности) k при обучении по специальности j будем обозначать как nasadkin32.wmf.

● Значимость для абитуриента i факторов региона s(k), в котором находится вуз k при обучении по специальности j, будем обозначать как nasadkin33.wmf.

Тогда выбор абитуриента осуществляется путем нахождения таких пар j, k, при которых некоторая функция (линейная комбинация или мультипликативная)

nasadkin34.wmf

будет принимать максимальные значения. Напомним, что на данном этапе моделирования абитуриент выбирает несколько вузов, куда он подает свои заявления. Окончательный выбор будет осуществляться на более позднем этапе, когда абитуриенты будут иметь информацию о конкурсе в вузы, которая позволит им оценить вероятности успешного поступления. Опишем подробнее вид каждой из указанных составляющих.

Основной показатель, влияющий на решение абитуриента, – это разница между его баллом ЕГЭ (суммой, деленной на количество предметов) Ei,j и проходным баллом прошлого года Bj,k(year – 1) в вуз k. Каждая пара <j, k> возможна лишь в том случае, если абитуриент сдавал ЕГЭ по предметам, необходимым для поступления на специальность j. Кроме того, будем считать, что абитуриент подает документы только в том случае, если проходной балл в прошлом году был меньше баллов ЕГЭ абитуриента: Ei,j – Bj,k(year – 1) > 0 или сумма, которую семья может позволить себе тратить на обучение, превосходит стоимость обучения в вузе nasadkin35.wmf.

Таким образом, пусть Ji – это множество специальностей, на которые абитуриент может поступить с теми экзаменами, которые он сдавал. Тогда получаем, что абитуриент может выбрать только такие пары <j, k>, для которых выполняется следующее условие (используются обозначения в индикаторах):

nasadkin36.wmf

Кроме того, учтем и то, что абитуриент может иметь возможность обучаться платно, но принципиально не хочет этого делать. Или наоборот, человек может поступить на бесплатное обучение в родном городе, но уезжает учиться в мегаполис. Математически за это будет отвечать показатель абитуриента nasadkin37.wmf. Будем считать, что если nasadkin38.wmf, то абитуриент однозначно не хочет учиться платно, если nasadkin39.wmf, то ему все равно. Таким образом, описывать вид составляющей полезности nasadkin40.wmf будем следующим образом в случае j ∈ Ji (иначе значение будет равно 0):

nasadkin41.wmf

Показатель nasadkin42.wmf отражает интерес абитуриента i к поступлению на специальность j, поэтому имеет простой вид nasadkin43.wmf с учетом возможности поступления только на специальности j ∈ Ji (иначе 0). nasadkin44.wmf – случайные величины, которые подчиняются условию nasadkin45.wmf

Показатель nasadkin46.wmf отражает значимость факторов, обусловленных вузом для абитуриента. Показатели эффективности деятельности вузов в России (образовательная деятельность, научно-исследовательская деятельность, инфраструктура, международная деятельность, финансовая деятельность, трудоустройство выпускников, бренд) публикуются [2] Министерством образования и науки и доступны для абитуриентов. Для удобства записи вида показателя введем обозначение M = {edu, sci, int, inf, fin, br}. Тогда значение показателя nasadkin47.wmf запишем в виде линейной комбинации

nasadkin48.wmf

В указанной формуле выделено слагаемое, отвечающее за трудоустройство выпускников: этот показатель используется при расчетах в разрезе специальностей, тогда как остальные только в разрезе вузов. Для показателей значимости факторов nasadkin49.wmf выполняется условие нормировки

nasadkin50.wmf

Аналогичным образом рассчитывается и показатель nasadkin51.wmf, отвечающий за учет влияния факторов региона s(k), в котором находится вуз k. Вводя обозначение N = {sal, unemp, cult, crim}, укажем формулу для расчета показателя nasadkin52.wmf. Единственное отличие заключается в том, что каждый абитуриент имеет различное отношение к переезду в другой регион, что отражается в существовании показателя nasadkin53.wmf. Указанный показатель принимает значение, равное 1, если регион s(k) наиболее предпочтителен для абитуриента.

nasadkin54.wmf

Подача заявлений в вузы и основной выбор абитуриента

На основании расчета функций полезности для каждого абитуриента составляются ранжированные списки по всем возможным парам специальностей и вузов <j, k>. Абитуриент подает заявления в некоторое случайное число вузов на специальности, наиболее подходящие ему. Вузы публикуют информацию обо всех поданных заявлениях – списки абитуриентов, отсортированные по их баллам ЕГЭ, а также информацию о количестве бюджетных и платных мест. На основании этой информации, абитуриенты могут оценить вероятности поступления в вузы, которые они выбрали на первом этапе (пример представлен в таблице).

Зная оценки вероятностей поступления, наиболее уверенные абитуриенты подают оригиналы документов в те вузы, которые им подходят в наибольшей степени. Все остальные абитуриенты (те, кто не удовлетворяют критерию уверенности в поступлении), получают эту информацию и на основании занятых мест в вузах пересчитывают вероятности своего поступления. Такая итерационная процедура продолжается до тех пор, пока все места на бюджетной и платной основах не будут заняты абитуриентами.

Проверка модели на адекватность и идентификация параметров

В ходе моделирования генерировалась популяция абитуриентов, каждый из которых имел свои собственные случайные показатели. Каждый из этих показателей – реализация случайной величины, имеющей некоторый заранее определенный закон распределения с параметрами, которые мы будем называть начальными и обозначим их как nasadkin55.wmf.

В качестве результата моделирования можно рассматривать количество поданных заявлений к общему количеству мест по каждой специальности j каждого вуза k (конкурс – количество человек, претендующих на одно место). Будем обозначать этот показатель как nasadkin56.wmf.

Для того чтобы показать адекватность построенной модели, достаточно провести моделирование на ретроспективных данных и сравнить реальный конкурс Сj,k с полученным при моделировании nasadkin57.wmf. В таком случае идентификация параметров модели – параметров распределений nasadkin58.wmf – будет осуществляться путем проведения многих серий экспериментов с различными наборами параметров методом наименьших квадратов:

nasadkin59.wmf

Пример информации, анализируемой каждым виртуальным агентом

Вуз

Специальность

Значение функции полезности

Оценка вероятности успешного поступления

Вуз 1

Специальность 1

0,954

0,93

Вуз 2

Специальность 2

0,932

0,87

Вуз 1

Специальность 3

0,911

0,95

Заключение

В данной статье представлена методология моделирования приемной кампании в российские вузы, которая основана на использовании агентного подхода. Достоинства такого подхода к рассматриваемой задаче заключаются, прежде всего, в следующем:

● Максимально приближенная к реальности модель – степень детализации ограничивается возможностями компьютеров.

● Нет сложных формул, описывающих различные потоки абитуриентов. Все представляется с помощью простых правил, которые описывают мышление абитуриентов. В то же время возможно получение неочевидных результатов на агрегированном уровне.

● Моделирование многих социальных процессов зачастую является задачей, в которой поведение индивидов нелинейно, наполнено правилами «если-то». Такие особенности едва ли можно удовлетворительно описывать дифференциальными уравнениями, рекуррентными соотношениями и т.д.

Построенная модель может использоваться как вузами, так и органами государственной власти в области образования. Она позволяет проводить прогнозирование того, как абитуриенты будущего года будут распределяться по вузам, изучать реакции абитуриентов на закрытие вузов, закрытие или создание новых специальностей, изменения социально-экономических показателей региона и др. Кроме того, интересным представляется и использование приведенного аппарата расчета полезности поступления в вузы России и для самих абитуриентов и их родителей. Это может выразиться в возможном создании Интернет-ресурса, нацеленного на выработку рекомендаций по поступлению с учетом личных предпочтений абитуриента.

Рецензенты:

Соколов А.А., д.ф.-м.н., ведущий научный сотрудник отдела экспериментальной физики, Национальный исследовательский центр «Курчатовский институт» ФГБУ ГНЦ РФ «Институт физики высоких энергий», г. Москва;

Клименко К.Г., д.ф.-м.н., профессор кафедры «Математика и естественные науки» филиала «Протвино», ГБОУ ВО Московской области университета «Дубна», г. Протвино.