Большая наука

А какой след оставил ты?

Время на прочтение: 5 минут(ы)

Группа исследователей Алтайского государственного университета совместно с Высшей школой экономики реализуют проект «Зеркальная лаборатория. Большие данные в анализе образовательной миграции молодежи на основе цифровых следов». А что такое цифровой след? Где предпочитают учиться студенты Алтайского края? «ЗН» задалась этими вопросами и обратилась к человеку, который в этом точно разбирается, – Дарье Алексеевне Омельченко, к. с. н., заведующей кафедрой социальной и молодежной политики АлтГУ.

Скрытая миграция

«Зеркальная лаборатория» – флагманский проект Высшей школы экономики, направленный на развитие сотрудничества и реализацию совместных проектов с университетами. Для участия в нем вузы проходят конкурсный отбор, и победители получают возможность в течение трех лет реализовывать свои инициативы. В 2024 году в числе победителей оказался АлтГУ – вместе с еще девятью вузами. От ВШЭ соруководитель проекта Нияз Камилевич Габдрахманов, от АлтГУ – профессор кафедры социальной и молодежной политики Светлана Геннадьевна Максимова. Всего в «Зеркальной лаборатории» задействовано более 20 человек.

Иллюстрация сгенерирована Алисой AI

При этом большинство проектов имели техническую направленность, поэтому для нас эта победа стала особенно значимой – как подтверждение сильных позиций социологических исследований. Дарья Алексеевна объясняет:

– Нашим партнером выступает Институт образования Высшей школы экономики, который занимается изучением системы высшего образования, анализирует статистические данные, в том числе Росстата, и рассматривает миграционные процессы. Кафедра давно занимается миграционными исследованиями – мы изучали международную, транзитную, возвратную миграцию, международные молодежные обмены. Объединившись с Институтом образования, начали искать точку соприкосновения наших научных интересов и пришли к тому, что нужно развивать направление, связанное с цифровыми социологическими методами и анализом цифровых следов. Возникла идея рассмотреть образовательную миграцию через цифровые данные. Традиционная статистика редко отражает реальную картину: ведь далеко не каждый человек фиксирует факт переезда. Часто официальные данные не совпадают с фактическим местом проживания, а часть информации остается недоступной для исследователей по этическим соображениям. В то же время сегодня формируется огромный массив цифровых следов – в социальных сетях, на медиаплатформах, образовательных сервисах. Это открывает новые возможности для анализа, и с научной точки зрения это направление остается недостаточно изученным. Классические социологические методы, безусловно, позволяют получить важную информацию. В наших предыдущих проектах мы использовали глубинные интервью с мигрантами, проводили опросы целевых групп. Однако такие исследования, хотя и репрезентативны, предполагают погружение респондента в исследовательский процесс, взаимодействие с исследователем. Цифровые следы относятся к нереактивным данным. Это информация, которую люди добровольно передают платформам в процессе своей повседневной цифровой активности. Пользователи добровольно заполняют профили в социальных сетях, публикуют записи, фотографии, оставляют комментарии и реакции. Все это формирует массив данных, который можно использовать для анализа.

Удержать таланты

Проект «Большие данные в анализе образовательной миграции молодежи на основе цифровых следов» реализуется уже третий год. На каждом этапе – конкретные научные задачи.

– В первый год мы сосредоточились на изучении технологий сбора и анализа цифровых следов: определяли их типы, оценивали возможности использования таких данных в социологических исследованиях. Во второй год основной акцент был сделан на сборе эмпирических данных из разных регионов, анализе масштабов миграции и выявлении факторов, влияющих на эти процессы. В текущем году сосредоточились на исследовании виртуальных сообществ – анализируем сообщества университетов, их востребованность и то, как вузы используют социальные медиа для привлечения абитуриентов и удержания талантливой молодежи. Во время реализации проекта запланированы создание баз данных, публикационная активность, участие в международных конференциях, проведение научных и образовательных мероприятий. Основная аудитория – молодые исследователи, аспиранты и магистранты. За два года мы реализовали ряд научно-методических семинаров, воркшопов, а также летнюю школу молодых исследователей, где участвовали студенты и ученые из разных университетов, – уточняет Дарья Омельченко.

Найти алмаз среди массива

Именно так, из этой деятельности, выросла идея сетевой магистратуры. Базовая программа «Цифровые методы анализа, визуализации данных в социальных исследованиях» реализуется с 2020 года, но с появлением «Зеркальной лаборатории» появилась возможность вывести ее на новый уровень.

– Мы начали развивать партнерства – в частности, с Консорциумом исследователей больших данных Томского государственного университета, с индустриальными партнерами – ВЦИОМом, компанией «Мегапьютер», ВК Групп. Параллельно укрепилось сотрудничество с другими подразделениями Высшей школы экономики, например с Международной лабораторией прикладного сетевого анализа. В программу, помимо классических инструментов анализа данных, был включен отдельный модуль, посвященный искусственному интеллекту и машинному обучению, который реализуется при участии партнеров. Дополнительное улучшение программа получила за счет методологии сетевого анализа, активно развиваемой коллегами из Вышки. Этот подход универсален и применяется для изучения самых разных объектов – от научных коллабораций и публикационной активности до бизнес-сетей, товарных цепочек и распространения идей. Если у человека есть знания и возможность использовать такие технологии, он может применять их на практике и получать гораздо более глубокое понимание социальных процессов. При этом ключевой задачей остается подготовка социологов – специалистов с глубоким пониманием общественных проблем, критическим мышлением и, подчеркну, владеющих современными цифровыми методами, – замечает Дарья Омельченко.

300 тысяч профилей

Цифровой след – понятие широкое. Он включает любые результаты взаимодействия человека с цифровой средой: от публикаций и лайков до менее заметных метаданных, таких как время активности, используемые устройства, геометки. В последние годы развивается и практика так называемой донации данных, когда пользователи добровольно передают исследователям свои цифровые данные. При этом соблюдаются все этические требования и принципы анонимизации.

– Мы опираемся в основном на открытые источники. Одной из наиболее доступных платформ остается «ВКонтакте», где существует открытый API и понятные инструменты для работы с данными. При этом используется только публичная информация, выставленная пользователем. Закрытые профили и группы не используются – соблюдение этических норм является обязательным условием работы. При изучении образовательной миграции мы выделяем целевую группу: молодежь в возрасте от 18 до 24 лет. Далее анализируем данные, которые пользователи указали о себе. Родной город, место учебы, образовательную траекторию. С помощью программных инструментов на языке Python собираются массивы данных, которые затем проходят этапы фильтрации и анализа. Мы отслеживаем, как меняется образовательный путь: переходы между школами, поступление в колледжи, лицеи, вузы. Смотрим, где находится выбранный вуз – в родном регионе или за его пределами. Например, по Алтайскому краю наши данные показывают, что около 73 % молодежи выбирают обучение в своем регионе, а остальные уезжают. В рамках исследования Сибири мы собрали порядка 300 тысяч профилей и на их основе построили модели миграционных связей. Это позволило увидеть, какие регионы удерживают и привлекают абитуриентов, как формируются образовательные маршруты. В некоторых случаях можно наблюдать, что выпускники конкретной школы массово поступают в один и тот же вуз, и это невозможно выявить с помощью традиционной статистики. Дополнительно появляется возможность проследить дальнейшую траекторию – трудоустройство, возвращение в регион или переезд. Конечно, по мере углубления анализа объем доступных данных сокращается, поскольку не все пользователи заполняют профили полностью. Тем не менее даже при этом остаются значительные выборки, позволяющие выявлять закономерности и формировать более полное представление о миграционных процессах, – описывает суть работы Дарья Омельченко.

Лидеры аналитического рынка

Университет получает от этого проекта значимые преимущества.

– Прежде всего, мы вовлекаем молодых исследователей в реальную научную работу, в полноценный исследовательский процесс. В исследовании принимают участие аспиранты и магистранты, доценты, научные сотрудники, молодые ученые. Они получают возможность работать с данными и взаимодействовать с ведущими специалистами в своей области – в иных условиях такие контакты были бы практически недоступны. Приглашаем на научно-образовательные мероприятия экспертов, которые непосредственно занимаются развитием этого направления. Это позволяет студентам и ученым получать знания из первых рук и осваивать самые современные технологии. В проекте участвуют и представители аналитической индустрии. Например, на прошедшем в прошлом году хакатоне кейсы предоставлял ВЦИОМ, а на Летней школе Open Data Lab слушатели изучали систему PolyAnalyst под руководством практикующего эксперта компании «Мегапьютер». В дальнейшем они могут использовать эти инструменты в собственных исследованиях, при подготовке магистерских диссертаций, научных публикаций, что также открывает возможности для получения повышенных стипендий и академического роста. Он дает возможность анализировать эффективность образовательной и медиаполитики не только внутри вуза, но и в сравнении с другими университетами и регионами. Это создает основу для формирования системы мониторинга образовательной миграции абитуриентов. В перспективе такие инструменты могут способствовать удержанию молодежи в регионе, – уверена Дарья Омельченко.

Эльвира Петренева
Фото Дмитрия ГЕРАЙКИНА

Как изменилось отношение к виртуальной жизни?

Что касается отношения к цифровой среде, оно продолжает меняться. Появляются новые платформы и инструменты, и молодежь быстро адаптируется к этим изменениям. При этом на выбор цифровых площадок влияют и институциональные факторы. Например, если в образовательной среде продвигается определенная платформа, студенты так или иначе будут ее использовать – для учебы, коммуникации или хранения контента. Вопрос открытости также остается неоднозначным. Цифровые следы не являются универсальным источником полной информации, и проблема качества данных по-прежнему актуальна. Исследователи работают с теми данными, которые доступны, и учитывают эффект «сужающейся воронки», когда по мере углубления анализа объем информации сокращается. При этом часть пользователей осознанно формирует свои профили, рассматривая их как инструмент самопрезентации. В итоге можно наблюдать разнонаправленные тенденции: с одной стороны – стремление к приватности, с другой – готовность к публичности в зависимости от целей и контекста.

94 просмотров

Related posts

Не сибирская тема

Степной край. Власть и общество

Макро под микро