Логотип
Баннер в шапке 1
Баннер в шапке 2

MTS AI: Cotype (Большая языковая модель, LLM)

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: МТС ИИ, MTS AI (Центр искусственного интеллекта МТС)
Дата последнего релиза: 2025/04/01
Технологии: Речевые технологии

Содержание

[Свернуть]

Основные статьи:

2025

Cotype Pro 2

Компания MTS AI выпустила второе поколение своей большой языковой модели Cotype, предназначенной для корпоративных клиентов, — Cotype Pro 2. Об этом компания сообщила 1 апреля 2025 года. Данная версия на 40% быстрее предыдущей и на 50% точнее обрабатывает длинные тексты — до 128 тыс. токенов (около 900 тыс. символов). Модель станет основой для линейки ИИ-агентов, способных решать бизнес-задачи на высоком уровне автономности.

Cotype Pro 2 адаптирована под более чем 100 корпоративных сценариев и может развертываться на внутренней инфраструктуре компаний — без подключения к внешним серверам, что повышает защиту данных. В 2025–2026 годах на её основе MTS AI планирует выпустить серию ИИ-агентов для госсектора, банков, ритейла и других сфер.

«
Ключевым требованием становится развитие способности к рассуждению, что позволит моделям анализировать, делать выводы и принимать обоснованные решения в условиях неопределённости, например, оценивать риски в финансовой аналитике или находить оптимальные подходы в научных исследованиях. Для ИИ-агентов также важно не только хорошо выполнять инструкции и работать с большим объёмом информации, но и выдавать ответы в структурированном виде, понятном другим системам, — отметил исполнительный директор MTS AI Дмитрий Марков.
»

Данная модель демонстрирует рост эффективности по всем основным задачам: генерация идей (с 44% до 57%), извлечение информации (с 81% до 86%), общение на общие темы (с 55% до 64%). Также улучшены суммаризация (до 85%) и креативное письмо (до 65%). При этом точность классификации осталась на высоком уровне — 87%. Cotype Pro 2 также лучше справляется с рассуждениями, что полезно для финансовой аналитики и научных исследований.

Перед выпуском MTS AI в течение трёх месяцев тестировала модель Cotype Pro 2 в реальных условиях: в банке она автоматически сортировала обращения в поддержку, а для МТС Live создавала описания мероприятий. Также в рамках тестирования была подтверждена возможность интеграции с инструментами RAG (Retrieval-Augmented Generation) для извлечения информации из баз знаний с генерацией текста. Такие решения востребованы, например, в чат-ботах, где нужно регулярно обновлять данные и отвечать пользователю за несколько секунд.

Помимо базовых задач, Cotype Pro 2 поддерживает «ролевой отыгрыш» — ведение диалога от лица специалиста, что полезно для поддержки клиентов и обучения сотрудников. Компания также разработала собственный метод оценки работы с длинными текстами, где модель показала двукратный рост качества по сравнению с предыдущей версией.

Внедрение в МТС Live

Сервис для покупки билетов МТС Live и разработчик больших языковых моделей MTS AI (Центр искусственного интеллекта МТС) завершили пилотный проект, в рамках которого тестировали большую языковую модель (LLM) Cotype для подготовки SEO-оптимизированных описаний к спектаклям для билетной витрины. Об этом МТС сообщил 26 марта 2025 года. Подробнее здесь.

2024

Запуск Cotype Nano

Компания MTS AI выпустила открытую большую языковую модель (LLM) Cotype Nano для решения бизнес-задач, связанных с созданием и анализом текстов на русском языке. Об этом компания сообщила 26 ноября 2024 года. Модель можно запускать локально на персональных устройствах – мобильных телефонах, настольных компьютерах и ноутбуках со средней производительностью, что делает её доступной для большого круга пользователей.

Веса модели – параметры, которые используются ей для принятия решений, открыты для исследователей и разработчиков. Это позволяет им изучать, как модель работает, настраивать её под свои нужды и использовать в собственных проектах без необходимости строить всё с нуля.

Модель продемонстрировала хорошие результаты в своём классе на бенчмарке Ru Arena Hard. В рамках тестирования оценивается точность, качество и релевантность ответов на вопросы пользователей по сравнению с другими моделями.

Cotype Nano способна обрабатывать контекст до 32,000 токенов (около 45 страниц текста) за раз, что позволяет работать с большими объемами данных. Модель обучена для создания контента, точных и быстрых переводов между русским и английским языками, обработки и анализа текстовых данных для улучшения клиентского сервиса и может быть использована для разработки чат-ботов и виртуальных помощников. Кроме того, она обладает продвинутыми возможностями классификации данных – это необходимо для таких сценариев, как автоматический поиск и анализ информации в корпоративных базах знаний. 

Cotype Nano оптимизирована для работы на CPU и GPU, с дополнительной оптимизацией под процессоры Intel, что позволяет запустить её на ноутбуках и даже смартфонах и делает модель доступной для широкого круга разработчиков и компаний, у которых нет доступа к мощным вычислительным ресурсам.

«
MTS AI придерживается принципов открытости и прозрачности в разработке генеративного искусственного интеллекта. Мы запускаем открытую большую языковую моделей с лицензией на использование в коммерческих целях и разрабатываем новые сервисы для автоматического обучения нейросетей и создания кода, которые ускорят процесс разработки. Развитие открытых LLM-моделей в России позволит компаниям и начинающим разработчикам и исследователям создавать решения на основе нейросетей, не вкладывая значительные ресурсы в разработку и оборудование, – отметил директор по LLM-продуктам MTS AI Сергей Пономаренко.
»

Развертывание MTS AI Cotype Plus в Технологической песочнице АФТ

В Технологической песочнице АФТ развернута GPU-ориентированная инфраструктура для высокопроизводительных матричных и векторных операций в целях пилотирования решений с использованием технологий искусственного интеллекта. Об этом Ассоциация сообщила 12 сентября 2024 года. В частности, на данной инфраструктуре уже развернута большая языковая модель МТС AI Cotype Plus. Подробнее здесь.

Оптимизация для текстов на татарском языке

MTS AI разработал обновленную версию большой языковой модели Cotype Lite для работы с текстами на татарском языке. Об этом компания сообщила 10 сентября 2024 года.

LLM способна обрабатывать документы объемом до 8 тысяч токенов (примерно 5 листов A4), извлекать и суммаризировать данные за несколько секунд.

Cotype Light может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы.

Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

«
Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России, - сказал исполнительный директор MTS AI Дмитрий Марков.

»

Чтобы модель Cotype Light смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка. Обучение Cotype Light происходит на мощностях МТС Web Services.

По словам разработчиков, Cotype Light входит в число лучших LLM в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров - до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

Возможность обработать длинный пользовательский контекст

MTS AI выпустил обновленную версию своей большой языковой модели для бизнеса Cotype PRO. Данная модель может обработать длинный пользовательский контекст - до 20 страниц, что позволяет выдавать персонализированные и точные ответы при низком потреблении вычислительных мощностей. Об этом компания сообщила 28 августа 2024 года.

Cotype — большая языковая модель, созданная MTS AI специально для работы с корпоративными данными. Она обучена на большом объеме деловой переписки, должностных инструкций, документации и прочих текстов, что обеспечивает высокую экспертизу LLM в этой области и позволяет использовать ИИ в бизнес-процессах. Cotype входит в топ-3 русскоязычных моделей, согласно бенчмарку MERA.

«
Увеличенный объем запоминания контекста без потери данных — функция Cotype Pro, которую используется в более чем 10 пилотных проектах корпоративного сектора и госструктур для создания системы сквозного поиска по внутренней документации и базам данных, генерации технических инструкций и корпоративных писем, SEO-оптимизации материалов на сайте и анализа и суммаризации результатов встреч — сказал Сергей Пономаренко, старший менеджер LLM-продуктов MTS AI.
»

Cotype PRO была создана с помощью уникального двухэтапного метода дообучения и собственных бенчмарков, разработанных специалистами MTS AI. Такой подход позволил достичь высокого качества работы большой языковой модели, которая работает всего на одной видеокарте NVIDIA A100, в отличие от конкурентных решений, которым необходимо 4 видеокарты.

Большое контекстное окно дает языковой модели Cotype PRO возможность за один раз обрабатывать значительный объем информации. То есть пользователь может загрузить договор или другой документ на 20 страниц. Благодаря чему, модель лучше понимает, о чем идет речь, и дает более точные ответы, что крайне важно, когда идет речь об анализе корпоративных документов и регламентов.



СМ. ТАКЖЕ (3)


Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (46)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (30)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (28)
  SteadyControl (19)
  Naumen (Наумен консалтинг) (15)
  Другие (214)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
  Naumen (Наумен консалтинг) (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Мегапьютер Интелидженс (Megaputer Intelligence) (2)
  Другие (14)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (5)
  Naumen (Наумен консалтинг) (4)
  Другие (29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Авантелеком (3)
  Другие (38)

  Voice Systems Robotics (VSR, VS Robotics) (2)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1)
  Napoleon IT (Наполеон Айти) (1)
  SteadyControl (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Другие (5)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 31)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 30)
  SteadyControl HoReCa (1, 24)
  SteadyControl (1, 24)
  Другие (409, 235)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Naumen (Наумен консалтинг) (1, 3)
  SteadyControl (1, 3)
  SteadyControl HoReCa (1, 3)
  Другие (12, 16)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Другие (18, 30)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  SteadyControl (1, 5)
  Другие (28, 45)

  Voice Systems Robotics (VSR, VS Robotics) (1, 2)
  Сенсор-Тех Лаборатория (1, 1)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 1)
  SteadyControl (1, 1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 1)
  Другие (7, 7)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2022 год
2023 год
2024 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 24
  BSS Digital2Speech - 21
  Voice2Med Система распознавания речи в медицине - 14
  EXpress Защищенный корпоративный мессенджер - 13
  Другие 225

  МТТ VoiceBox - 11
  BSS Digital2Speech - 6
  SteadyControl Система контроля и управления персоналом - 3
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  Другие 14

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  EXpress Защищенный корпоративный мессенджер - 6
  BSS Digital2Speech - 6
  SmartLogger II - 4
  Другие 23

  EXpress Защищенный корпоративный мессенджер - 5
  SteadyControl Система контроля и управления персоналом - 5
  BSS Digital2Speech - 4
  Napoleon IT отзывы - 3
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3
  Другие 36

  VS Robotics: VS Робот-оператор - 2
  Наносемантика: DialogOS (Dialog Operating System) - 1
  Prof IT: Vocamate AI - 1
  BSS: Речевая аналитика - 1
  Сенсор-Тех: Сурдо-Помощь - 1
  Другие 5