Продолжается третья волна популярности нейросетей. Но знали ли вы, что первый бум случился еще в 50–60-х годах, когда ученые пытались создать модель нейронов мозга? А что второй всплеск случился в 80-х годах, когда появились новые методы моделирования нейронных процессов? Компьютеры тогда не обладали достаточной вычислительной мощностью, чтобы эффективно обрабатывать большой объем данных, поэтому интерес тогда затих.
А вот в двухтысячных годах совпали все необходимые условия: мощные компьютеры и технологии, облегчающие сбор огромного количества данных. Как только общество осознало, чего можно добиться с помощью нейросетей, их начали внедрять и в науку, и в искусство, и в бизнес. И до сих пор эти сервисы удивляют пользователей. Но, как отмечает Андрей Александрович Лепендин, кандидат физико-математических наук, доцент кафедры информационной безопасности ИЦТЭФ АлтГУ, сейчас интерес связан с возможностью использования: продукт дошел до конечного потребителя. Термины «машинное обучение» и «искусственный интеллект» стали модными, а нейросети – востребованными. Они продемонстрировали, как могут работать и какие задачи решать.
– Нейросеть – это не компьютерная модель мозга. Искусственные сети работают не так, как нейроны мозга: где-то они примитивнее, где-то и вовсе отличаются. Нейронными сетями называют очень широкий набор моделей. Например, модель ChatGPT построена на так называемых трансформерах и занимается обработкой естественных языков (NLP – Natural Language Processing). Все НЛП-модели обрабатывают тексты в широком смысле. Могут вытаскивать смысл из текста, то есть ключевые слова, или делать суммаризацию текста, поддерживать диалоговые системы (как бот в телеграме). Задаете вопрос – бот разбирается, анализирует и генерирует ответ. Также такие модели могут оценивать эмоциональную окраску текста, разбирать предложения на части речи, – рассказывает Андрей Александрович.
Вторая группа популярных моделей разработана для генерации изображений, видео и звука. Эти модели основаны на так называемой диффузии. Описываете желаемое изображение – и нейросеть генерирует его из шума, постепенно улучшая картинку и добавляя новые детали. Разные шумы – разные картинки, и их может быть бесконечно много. Именно поэтому Midjourney и Stable Diffusion отдают несколько изображений сразу.
– Алгоритмы (модели) – это постоянное развитие. С каждым днем модели переучиваются именно в количестве параметров. Сейчас их там уже сотни миллиардов! Ведь чем больше данных дать нейросети – тем лучше модель учится. Но помимо данных и математики, нужны большие мощности. Такое могут позволить себе только крупные компании, – заметил эксперт.
OpenAI – американская компания, занимающаяся разработкой и лицензированием технологий на основе машинного обучения. Илон Маск и Сэм Олтмен запустили OpenAI в конце 2015 года с целью создать открытую компанию, работающую на благо общества, а не государства или корпорации. Открытость способствует быстрому развитию науки и технологии за счет совместной работы над задачей многих людей. ChatGPT запустили в ноябре 2022 года – и это далеко не единственный проект компании, но именно он обрел мировую популярность благодаря хорошим и наглядным результатам, полученным с ним.
– Эту систему можно использовать как аналог поисковика, ведь ChatGPT позволяет получить ответы на некоторые запросы. Но использовать ли ее постоянно и особенно доверять ли ответам – другой вопрос. Нейросети иногда ошибаются. Да и обычный поиск в сети не всегда выдает правду. Поэтому фактчекинг никто не отменял! Я смешанно отношусь к тому, что студенты используют нейросети в подготовке домашних заданий или каких-то других работ. Потому что, с одной стороны, прогресс не отменить. Но с другой – использование этих инструментов должно сопровождаться пониманием информации. Надо осознанно подходить к использованию этих сервисов! Можно попросить нейронную сеть написать код или переписать текст. Но если вы не понимаете, что в этом тексте написано или что в этом коде происходит, это не имеет никакой ценности. И теряется смысл самого обучения. В связи с этими изменениями и новшествами нам, возможно, придется возвращаться назад к более традиционным методам контроля знаний при обучении: устным экзаменам, частым выступлениям на парах и прочим, – перечислил преподаватель.
Сейчас Андрей Александрович продолжает реализацию гранта по улучшению качества речевых сигналов с использованием глубоких нейронных сетей. Эти технологии используются для чистки архивных записей, встраиваются в беспроводные наушники, внедряются в приложения для связи. В прошлом году команда предложила новую модель для очистки речи, а в этом году хочет оптимизировать ее: сделать компактнее и быстрее, универсальной для разных языков. Модель, использованная в этом исследовании, – архитектура «с узким горлом»:
– Подаем аудиосигнал на вход сети, она сжимает этот сигнал до некого компактного представления, полезного сигнала – и разжимает это в маску, которую можно наложить на сигнал и убрать лишнее. Когда-то маски были бинарные: 0 – то, что убрать, 1 – то, что оставить. Очень наивно! Ведь тогда в звуке появляются паузы вместо шумов, искажения, резкие переходы и так далее. Сейчас маскирование более гибкое: можем что-то уменьшить по громкости, что-то поднять, восстановить внутри шумов потерянные вещи. Это довольно тяжело. Сейчас мы получаем высокое качество восстановления речи, но пока не слишком быстрое, – поделился Андрей Александрович.
Кстати, эксперт считает, в ближайшем будущем нейросеть точно не захватит мир. А все потому, что это реактивная система: даешь запрос – получаешь результат. Чтобы она начала проявлять свой собственный интеллект, ей нужно обрести собственное самосознание. А до этого еще далеко.
Александра СМОЛЯНИНОВА
Рисунок нейросети Deliberate AI Bot «Нейросеть захватывает мир».
*Заголовок сгенерирован нейросетью ChatGPT.