На первом этапе было проведено обучение и тестирование моделей разной архитектуры для задачи маппинга (определения соответствия между различными моделями данных) текстовых списков, в частности — предсказания принадлежности текстовых объектов к классам различного уровня. Модели, построенные с применением методов глубокого обучения (Embedding+LSTM+Dense, реализация в Natasha, FastText и Keras/Pytorch-lightning и RuBERT), оценивались по соотношению время обучения — качество. Оказалось, что точность обучения при использовании графических ускорителей и обычных ЦП сопоставима, а вот скорость обучения на графических ускорителях выросла в 15-80 раз.
На втором этапе тестирования проведено обучение и тестирование моделей для решения задач улучшения распознавания сущностей в неструктурированном тексте и распознавания по фотографии. В ходе испытаний установлено, что использование графических ускорителей позволяет до 38 раз ускорить процесс тренировки небольших моделей (12 — 17M параметров). В то же время для исполнения моделей в ряде случаев оказывается предпочтительным использование обычных ЦП.
Для проведения испытаний использовался стенд, развернутый в Ассоциации ФинТех на базе оборудования компании YADRO. Стенд демонстрирует возможность использования российских инфраструктурных решений на большинстве уровней технологического стека типичной финансовой организации и включает в себя серверы VEGMAN, систему хранения TATLIN.UNIFIED, централизованное ПО управления СУПРИМ.
"Мы выражаем благодарность Ассоциации ФинТех и компании YADRO за предоставленную возможность. Такой стенд — это возможность провести тестирование и определить ключевые параметры требуемого для задач программно-аппаратного комплекса на базе отечественного оборудования для планируемой аренды или покупки. Это существенно облегчило для нас процесс бюджетирования на 2024 год в части затрат на аппаратные средства", — отметили руководители команд тестирования: руководитель направления Лаборатория финтех и инноваций Страхового Дома ВСК Александра Левушкина и руководитель стратегического проекта центра анализа данных, тарификации и риск-технологий Страхового Дома ВСК Алексей Чистяков.
"В рамках цели по достижению технологического суверенитета перед финансовыми организациями стоит задача заместить имеющиеся импортные программно-аппаратные комплексы для работы core-систем отечественными, не замедляя при этом развитие и внедрение инноваций. Стенд АФТ позволяет успешно решать различные задачи, в том числе в области ML: по распознаванию документов, обработке неструктурированных потоков информации, разработке решений для андеррайтинга и т. д.", — подчеркнул руководитель управления развития технологий Ассоциации ФинТех Олег Моргун.
"Страховой Дом ВСК стал первым пользователем нашего стенда, развернутого в АФТ. Мы благодарны коллегам из ВСК, вместе с которыми удалось поработать над крайне интересной задачей использования ИИ в финансовой сфере. В 2024 году мы планируем сфокусироваться на проработке референсных архитектур комплексных решений — прежде всего, автоматизированных банковских систем, к которым проявляют интерес практически все российские банки. В то же время продолжим проводить тесты решений на базе российского технологического стека в рамках различных прикладных кейсов по запросам участников Ассоциации", — отметил директор департамента технической поддержки продаж YADRO Павел Карнаух.