Новая реальность: цифровые двойники и искусственный интеллект

В эпоху становления цифровой экономики традиционные представления о числах и данных существенно изменились. Возникла даже целая отрасль науки о больших данных (Data Science). О новых понятиях и тенденциях в этой науке, а также о ее связи с искусственным интеллектом и о роли научно-исследовательской лаборатории искусственного интеллекта в их развитии рассказала заместитель заведующего НИЛ ИИ ПГУТИ Оксана Захарова.

Большие числа - большие проблемы

Формального определения больших данных не существует. Более 60 лет назад один из крупнейших математиков ХХ века Андрей Колмогоров объяснил научному сообществу, что такое маленькие, средние и большие числа.

Вот один пример того, как появляются большие данные (Big Data). К электрической лампочке присоединены три выключателя, каждый из которых может находиться в левом или в правом положении. Существует восемь возможных вариантов совместных положений выключателей. Проводку к ним можно подвести таким образом, чтобы в каждом из восьми положений лампочка или горела, или не горела. Получится 256 возможных комбинаций. Если выключателей, допустим, пять, комбинаций будет уже 4 294 967 296. А если шесть, то число комбинаций превысит количество атомов во Вселенной.

А теперь представим, что на одну из лекций пришла тысяча человек, и лектор решил с каждым из них поздороваться за руку. При личном контакте он получит информацию о человеке (пол, примерный возраст, рост и т.д.), на основе которой можно определить, например, процентное соотношение мужчин и женщин, их средний возраст (в науке о данных это называется "разметка данных"). Если же попросить всю тысячу присутствующих обменяться рукопожатиями друг с другом, то нашему мозгу не под силу будет сосчитать общее число контактов и тем более обработать в разы увеличившееся количество сведений. Получается, тысяча - это среднее число, потому что мы осознанно не можем проанализировать такое количество элементов.

Сверхсущность или обычная ЭВМ?

Человеческий мозг с легкостью может строить теории, делать выводы и принимать решения при малом наборе сведений. А вот большие объемы данных, и даже средние, люди уже не в силах проанализировать. Для этого и создан искусственный интеллект, который формально определяют как набор методов, алгоритмов, сред и технологий для обработки данных любого типа.

Цель обработки - составление всевозможных прогнозов, разработка классификаций, выявление аномалий, а также получение нового знания, обнаружение новых интересных закономерностей в данных. И компьютер с этим справится гораздо лучше человека. Но все же надо помнить, что у машины всегда есть вероятность погрешности, пусть и минимальной. Поэтому слепо доверять ей не стоит.

Все мы знаем о существовании "трех китов" информатики: это данные, информация и знания. "Сырые" данные мы превращаем в информацию. А из нее, в свою очередь, извлекаем знания - неизвестные ранее сведения. С позиции искусственного интеллекта, информация - структурированные данные. А знания - структурированная информация. Сейчас ученые работают над автоматизацией процессов структуризации.

Однако популярность термина "искусственный интеллект" во многом объясняется его ошибочным толкованием, в частности, когда им обозначают некую искусственную сущность, наделенную разумом, которая якобы в состоянии конкурировать с людьми. Эта мысль из области древних легенд и преданий, звучащая как миф о Големе, с недавних пор реанимируется такими нашими современниками, как британский физик Стивен Хокинг (1942-2018 гг.), американский предприниматель Илон Маск и американский инженер Рэй Курцвейл, а также сторонниками создания так называемого сильного или общего ИИ.

Не будем, впрочем, говорить о данном понимании этого термина, ибо оно скорее представляет собой появившийся под влиянием научной фантастики продукт богатого воображения, а не осязаемую научную реальность, подтвержденную опытами и эмпирическими наблюдениями.

Сплели нейронные сети

Если говорить об ИИ, нельзя не упомянуть такое популярное в наше время понятие, как нейронные сети. Нейронные сети были придуманы лет 60 назад. Сегодня они стали основным инструментом глубокого обучения (Deep Learning) - методов машинного обучения, основанных на имитации работы человеческого мозга в процессе обработки данных.

Мы знаем, что в нашем мозге есть нейроны (нервные клетки), соединенные друг с другом аксонами (длинными цилиндрическими отростками нервной клетки). А с точки зрения информатики нейронная сеть - это математическая модель, в которой искусственные нейроны (простые процессоры) объединены в систему и взаимодействуют друг с другом. Так, каждый процессор периодически получает сигналы от других процессоров, а также посылает сигналы сам. И такая с виду простая сеть способна выполнять довольно сложные задачи.

Схема работы нейросети выглядит так: входные нейроны получают исходные данные, скрытые нейроны обрабатывают информацию, а выходные нейроны выводят готовый результат. Таким образом, в зависимости от характера задачи определенное количество нейронов получает входные данные, а затем передает их на скрытый средний слой. Машина ищет закономерности среди огромного количества нейронных связей и "принимает" решение.

От физического тела - к цифровому двойнику

А что потом? Data Science уже начала менять наш мир. Мы никуда не денемся от цифровизации. Окружающие нас вещи будут постепенно лишаться физического тела и переходить в виртуальность под лозунгом: "Все, что может быть лишено физического тела, будет его лишено, превратившись в цифрового двойника".

Можно предположить, что в недалеком будущем после полной цифровизации геномов белковых тел станет вероятным отправлять их цифровую копию по электронной почте. Кстати, уже сейчас наблюдается тенденция падения спроса на программистов, стали востребованы другие специалисты - компьютерные лингвисты, специалисты по машинному обучению, архитекторы виртуальности, аналитики Big Data. Особенно этот процесс будет ускоряться в связи с появлением ChatGPT.

ПГУТИ создает кадры для цифровой экономики будущего

В России в последние два года сделан серьезный шаг вперед, совершен скачок и на уровне регионов, и на уровне правительства для того, чтобы создать условия для развития искусственного интеллекта практически во всех сферах. Сегодня явно виден рост интереса к развитию и внедрению технологии искусственного интеллекта.

Поволжский государственный университет телекоммуникаций и информатики является одним из первых образовательных учреждений региона, которое оценило перспективы развития данных технологий.

В январе 2020 года в ПГУТИ была создана Научно-исследовательская лаборатория искусственного интеллекта (НИЛ ИИ). Возглавил ее Сергей Левашкин, выпускник МГУ им. М.В.Ломоносова, ученый с более чем 20-летним опытом работы в университетах и компаниях России, Северной Америки и Европы.

В контексте национальной программы "Цифровая экономика РФ" и "Плана 2030", создание НИЛ ИИ является стратегическим проектом, поскольку наука о данных, искусственный интеллект и бизнес-интеллект являются ключевыми факторами цифровой трансформации экономики.

Сегодня лаборатория занимает лидирующее положение в НИР и НИОКР университета по ИИ и решает самые разнообразные задачи, включая научно-исследовательскую работу в области науки о данных, искусственного интеллекта и машинного обучения, а также подготовку высококвалифицированных кадров для цифровой экономики.

Искусственный интеллект хорошо работает в интересах и на благо людей, если его создает и применяет грамотный, хорошо подготовленный человек.

Лаборатория обеспечивает содержанием факультатив и магистерскую программу "Наука о данных и искусственный интеллект", а также коммерческий курс "Бизнес-интеллект".

Студенческий курс содержит популярное введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Он мотивирует студентов старших курсов на поступление в магистратуру "Наука о данных и искусственный интеллект", но доступен также студентам младших курсов и самой широкой публике.

Коммерческий курс - введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Курс рассчитан на повышение цифровой грамотности управленцев, представителей коммерческих компаний и т.д. Содержит примеры приложений методов искусственного интеллекта в различных областях экономики, бизнеса, управления и т.д.

В 2022 году на базе НИЛ ИИ ПГУТИ впервые был осуществлен прием в магистратуру по профилю "Прикладной искусственный интеллект и наука о данных" по программе МГУ.

В рамках реализации программы осуществляется подготовка специалистов в области искусственного интеллекта и науки о данных, способных применять фундаментальные знания математических и естественных наук, программирования и информационных технологий при решении прикладных задач различного уровня сложности с целью удовлетворения потребностей промышленности, бизнеса и науки, муниципального и государственного управления, решения иных задач.

Активно ведется студенческая научная работа. Студенты и магистранты уже с самых ранних курсов обучения имеют возможность работать над реальными практическими задачами, осваивать новые компетенции в области искусственного интеллекта и науки о данных, принимая участие в научной и грантовой деятельности лаборатории.

Лаборатория активно ведет НИР и выигрывает различные гранты - от математического моделирования распространения вирусных заболеваний до разработки модулей для системы "Умные дороги".

Кроме того, лаборатория НИЛ ИИ входит в состав Рабочего комитета "Искусственный интеллект" НОЦ "Инженерия будущего" - это научно-образовательный центр, объединяющий науку и реальный сектор экономики. Основным направлением от ПГУТИ в области искусственного интеллекта является разработка инфокоммуникационных технологий на основе анализа BigData. Куратор направления - заведующий лабораторией Сергей Левашкин.

В горизонте текущего десятилетия задача лаборатории - обеспечить массовое внедрение искусственного интеллекта. Оно должно охватить все отрасли экономики, социальной сферы и систему госуправления.

Научный поиск НИЛ ИИ ПГУТИ

  • Программное обеспечение формализации и извлечения знаний о сложных информационных объектах
  • Алгоритмы и программное обеспечение машинного обучения (machine learning)
  • Аналитическое программное обеспечение нового поколения (next-generation analytics)
  • Мультиязычные (инвариантные к исходным языкам) и мультимодальные (инвариантные к типу контента) системы извлечения и формализации информации (nlp)
  • Алгоритмы и программное обеспечение для формализации и извлечения знаний из слабоструктурированной и неструктурированной информации.
  • Математические модели распространения вирусных заболеваний и их исследование методами искусственного интеллекта
  • Семантико-ассоциативный анализ и синтез телекоммуникационных данных

Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ

Реализованные гранты НИЛ ИИ ПГУТИ (2022 год)

  • "Вирусы I": Многофакторное моделирование с применением технологий искусственного интеллекта структурно-динамического равновесия социально-экономической системы РФ при распространении пандемии (РФФИ/РНФ)
  • "Вирусы II": Математическое моделирование распространения вирусных заболеваний (Минобраз/РосАтом)
  • "Умные дороги": Разработка модуля интеллектуальной обработки данных системы мониторинга оптоволоконных сигналов (Haulmont).
  • "СМАРТ продукты": Применение алгоритмов ИИ для компьютерного моделирования новых продуктов, товаров и услуг с заданными свойствами (Минцифры РФ).

Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ

Ссылки: https://ai.psuti.ru/

https://t.me/laboratoria_psuti

https://vk.com/nil_ai_psuti

Автор выражает благодарность за помощь в подготовке статьи заведующему НИЛ ИИ Сергею Павловичу Левашкину.

Версия для печати