«Сбер» анонсировал внедрение новой языковой модели в сервис GigaChat
В рамках международной конференции AI Journey, которая проходит 22–24 ноября в Москве, специалисты «Сбера» рассказали о планах внедрить в свой сервис GigaChat принципиально новую языковую модель на 29 млрд параметров.
По словам старшего вице-президента, CTO, руководителя блока «Технологии» Сбербанка Андрея Белевцева, каждое обновление нейросетевой модели — масштабный и сложный процесс, в котором участвуют сотни сотрудников «Сбера»: «Специально для GigaChat мы собрали и развиваем уникальный датасет, помогая развивать и улучшать качество ответов в самых разных доменах».
После завершения работы над новой версией GigaChat разработчики провели ее детальное сравнение с актуальной версией, придя к следующим выводам: значительно улучшилось качество суммаризации, рерайтинга и редактирования текстов, ответов на различные вопросы, общий рост качества тут составил 23%. С фактологией же новая модель справляется на 25% лучше предыдущей версии. Кроме того, по результатам внутренней оценки в бенчмарке MMLU (Massive Multitask Language Understanding) модель новой версии GigaChat превзошла самый популярный на сегодня открытый аналог LLaMA 2 34B, подчеркнули разработчики.
По словам разработчиков, к программному интерфейсу (API) новой версии ранний доступ получат две категории пользователей: бизнес-клиенты «Сбера», а также представители научного сообщества для проведения своих исследований.