Перейти к основному контенту
Технологии и медиа⁠,
0

«Яндекс» представил новую русскоязычную нейросеть

YaLM 100B — самая продвинутая нейросеть для генерации текстов на русском языке, утверждает компания
Яндекс YDEX ₽1 662 +3,88% Купить
Фото: Валерий Мельников / РИА Новости
Фото: Валерий Мельников / РИА Новости

Компания «Яндекс» выложила в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках. Как утверждает компания, это самая большая GPT-подобная модель, опубликованная в свободном доступе.

«YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире», — описывает пресс-служба «Яндекса» работу новой модели.

Как утверждает компания, новую нейросеть можно использовать для создания рекламы, описания товаров, генерировать любые тексты, даже стихи, и применять ее для классификации текста, например по стилю.

Модель обучали на суперкомпьютерах «Яндекса», которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках.

Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Петр Попов, генеральный директор «Яндекс Технологий», заявил, что, выкладывая YaLM 100B в открытый доступ, компания рассчитывает, что это даст толчок развитию генеративных нейросетей.

«Я бы вакцинировал троих на миллион». Интервью с нейросетью GPT-3
Футурология
Фото:Shutterstock

Самой мощной языковой моделью в мире сейчас считается GPT-3 от OpenAI, впервые представленная в 2020 году. Она основана на более чем 175 млрд параметров. Она способна генерировать текст высокого уровня сложности. 8 сентябре 2020 года британское издание The Guardian опубликовало заметку, написанную при помощи GPT-3. В этой статье нейросеть, в частности, написала: «Я здесь, чтобы убедить вас не волноваться. Искусственный интеллект не уничтожит людей. Поверьте мне».

Летом 2021 года «Яндекс» представил нейросетевой языковой алгоритм генерации текстов YaLM. На его основании работал сервис «Балабола», в котором пользователи могли пообщаться с нейросетью. Однако в апреле компания закрыла к нему доступ.

Свою нейросеть для генерации русскоязычных текстов представлял и «Сбер», ее бета-версия находится в открытом доступе. Она построена на 760 млн параметров.

Теги
Компании
Магазин исследований Аналитика по теме "Интернет"
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 31 декабря
EUR ЦБ: 92,09 (+0,62)
Инвестиции, 30 дек, 18:05
Курс доллара на 31 декабря
USD ЦБ: 78,23 (+0,78)
Инвестиции, 30 дек, 18:05
NYT узнала, что Трамп назвал Келлога «идиотом» из-за слов о Зеленском Политика, 15:10
Структурные облигации: возможности и риски для инвесторов #всенабиржу!, 15:05
Путин поздравил россиян с Новым годом Общество, 15:02
ФИФА объявила о создании новой премии лучшим футболистам года Спорт, 15:00
Коростелев упал и занял 64-е место в масс-старте на этапе «Тур де Ски» Спорт, 14:44
Функциональность и осмысленность: что такое новая загородная роскошь РБК и Папушево Парк, 14:40
Лукашенко рассказал об уничтожении «Южмаша» ракетой «за минуту» Политика, 14:39
Праздники без последствий
Узнайте, как пить красиво
Пройти интенсив
Как добавить золото в свой портфель: инструкция для инвесторов #всенабиржу!, 14:10
Посольство США поздравило россиян с Новым годом пожеланием мира Политика, 13:59
Олимпийский чемпион по боксу из России Батыргазиев приостановил карьеру Спорт, 13:58
«Культпоход» по театрам. Специальный репортаж РБК Общество, 13:47
Монетизация данных о клиентах: норма или повод для паники РБК и PostgresPro, 13:46
Кто из знаменитостей умер в 2025 году. Фотогалерея Общество, 13:45 
В Туапсе кадетский корпус и техникум получили повреждения при атаке БПЛА Политика, 13:22