Заказчики: Rambler Group (Рамблер Групп) Подрядчики: SberDevices (СалютДевайсы, ранее СберДевайсы) Продукт: Елена Цифровой двойник телеведущей СбербанкаДата проекта: 2020/01 — 2020/06
|
Технология: Речевые технологии
Технология: Робототехника
|
2020: Интеграция диджитал-телеведущей в новости Ferra.ru
22 июля 2020 года компания Rambler Group сообщила, что техническое медиа Ferra.ru интегрировало в свои новости диджитал-телеведущую Елену от SberDevices. Созданная с помощью нейросетей, она может вести новостные сюжеты, используя только текст для генерации полноценного видеоизображения и речи, а также имитирует мимику и эмоции человека. Первый выпуск с участием Елены уже доступен на сайте Ferra.ru.
Елена — цифровой двойник телеведущей, созданный в 2019 году в Лаборатории робототехники Сбербанка с привлечением группы компаний ЦРТ, технологии которой обеспечивают синтез речи аватара. Его особенность — в использовании сложных нейросетевых моделей для непрерывной генерации речевого аудиосигнала по тексту. Это позволяет добиться плавности и выразительности искусственной речи, а благодаря лингвистическому процессору прочтение текста выполняется со всеми нормами языка даже в сложных случаях.
Изображение Елены — тоже результат работы нейросетевых моделей, обученных на видеозаписях реального человека. Использование исследований в области нейросетевой генерации видео позволяет добиться фотореалистичности персонажа и сходства с реальным человеком. Собственные разработки компаний экосистемы Сбербанка в этой области позволяют осуществлять одновременную генерацию и речи, и изображения виртуального персонажа.
«Первые аватары телеведущих, созданные и управляемые искусственным интеллектом, появились еще пару лет назад в Китае. За это небольшое время цифровые технологии шагнули вперед, предоставив нам еще больше вариантов для их использования. Для медиа одним из наиболее перспективных направлений является искусственный интеллект, который внедряется в издания Rambler Group. Так, совместно с компаниями экосистемы Сбербанка мы решили изменить привычную модель подачи информации на Ferra.ru: новости издания можно не только читать, но и смотреть в исполнении цифрового аватара Елены. Она едва отличима от обычных людей: технологии точно имитируют не только голосовую составляющую Елены, но и отражают человеческие эмоции, повторяют живую мимику», |
«С момента старта проекта всеми участниками была проделана большая исследовательская работа. Следующий важный шаг — довести эти результаты до массового рынка и сформировать понятный рынку продукт. Очевидно, что это только начало пути: в исследовательской части еще очень много актуальных задач, связанных с генерацией фотореалистичных цифровых персонажей, моделированием анимации тела (включая мимику лица и жесты) и различных стилей (одежда, прически, макияж). Отдельная большая задача — заставить такие технологии работать быстро, в режиме реального времени. Это и есть главный фокус SberDevices, а проект с Ferra.ru — дебют Елены за пределами Сбербанка», |
«Использование синтеза группы ЦРТ для диджитал-телеведущей — один из основных для нас проектов. По сравнению с предшествующей технологией (компилятивного синтеза), применение нейронных сетей позволило нам вывести качество генерируемой речи на более высокий уровень. С помощью гибких настроек мы привнесли целый пласт возможностей по ее управлению: естественное изменение темпа, тона речи, а также стиля прочтения текста. В ближайшем будущем подобная технология сможет еще точнее моделировать человеческие эмоции и в полной мере будет конкурировать с профессиональными дикторами. Кроме того, мы сделали свой синтез доступным не только в виде SDK для встраивания в конечное решение, но и из облака», |
Развитием и поддержкой проекта занимается SberDevices.