Сбер: PyTorch-LifeStream Программная библиотека

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Сбербанк
Дата последнего релиза: 2022/02/01
Технологии: MDM - Master Data Management - Управление основными мастер-данными

Основная статья: Управление данными (Data management)

2022: Предоставление разработчикам бесплатного доступа к PyTorch-LifeStream

1 февраля 2022 года «Сбер» сообщил, что предоставил разработчикам бесплатный доступ к инструменту подготовки датасетов.

«Сбер» сделал открытым инструмент - программную библиотеку PyTorch-LifeStream, содержащую несколько алгоритмов построения эмбеддингов событийных данных. Инструмент может быть использован для подготовки различных массивов обезличенных данных (датасетов).

Событийные данные могут представлять собой разные последовательности - истории посещений сайтов, истории покупок, событий в онлайн-играх и так далее. При этом, сгенерированный на основе алгоритмов библиотеки эмбеддинг такой последовательности не будет содержать каких-либо персональных данных.Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

В библиотеке реализован алгоритм применения нейросетевого контрастного обучения к событийным данным, созданный и запатентованный в Лаборатории по искусственному интеллекту «Сбера». Кроме того, в библиотеке реализованы методы на основе сторонних научных публикаций, но адаптированные «Сбером» к событийным данным.

«
«Недостаток очищенных, обезличенных и размеченных данных - это один из главных барьеров для дальнейшего развития искусственного интеллекта, для создания новых продуктов и сервисов, которые смогут решать важные научные и социально значимые задачи. Но существуют инструменты, которые позволяют готовить такие данные. Свободный доступ к этим инструментам - важное условие для преодоления барьера. Уверен, что вывод нашей библиотеки в паблик ускорит разработку и внедрение систем искусственного интеллекта в России и, как следствие, будет содействовать конкуренции и экономическому развитию нашей страны», -

говорит Александр Ведяхин, первый заместитель Председателя Правления «Сбербанка».
»

«Сбер» уже давно делится результатами своих исследований в области искусственного интеллекта со всеми желающими. В частности, ранее компания вывела в открытый доступ такие библиотеки, как ruGPT-3, LAMA, RePlay, ruDALL-E.



Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (272)
  Axelot (Акселот) (156)
  Цифра (31)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (25)
  АйТи Про (IT Pro) (21)
  Другие (287)

  Datareon (Датареон) (37)
  Axelot (Акселот) (25)
  Commvault (5)
  АйТи Про (IT Pro) (4)
  AnalyticsHub (АналитиксХаб) (2)
  Другие (35)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  Цифра (7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5)
  Софрос (Sofros) (4)
  Другие (22)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (9)
  Naumen (Наумен консалтинг) (3)
  TData (ТДата) (3)
  Другие (32)

  Datareon (Датареон) (19)
  Axelot (Акселот) (8)
  TData (ТДата) (3)
  Первый Бит (3)
  Софрос (Sofros) (3)
  Другие (20)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon (Датареон) (2, 419)
  Цифра (2, 36)
  Axelot (Акселот) (1, 30)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (5, 26)
  Informatica (14, 21)
  Другие (307, 261)

  Datareon (Датареон) (1, 60)
  Commvault (2, 5)
  АйТи Про (IT Pro) (1, 4)
  ЮниДата (UniData) (1, 3)
  SAP SE (1, 2)
  Другие (25, 25)

  Datareon (Датареон) (1, 71)
  Цифра (1, 7)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3, 5)
  Axelot (Акселот) (1, 5)
  TData (ТДата) (2, 2)
  Другие (16, 18)

  Datareon (Датареон) (1, 57)
  Axelot (Акселот) (1, 6)
  Цифра (1, 4)
  Ростелеком (3, 3)
  TData (ТДата) (3, 3)
  Другие (18, 22)

  Datareon (Датареон) (1, 31)
  TData (ТДата) (2, 3)
  Ростелеком (2, 3)
  Data Sapience (Дата Сапиенс) (2, 3)
  Axelot (Акселот) (1, 2)
  Другие (15, 16)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Datareon Platform - 419
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 36
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 30
  HFLabs Единый клиент - 23
  АйТи Про: BI.Qube - 18
  Другие 228

  Datareon Platform - 60
  АйТи Про: BI.Qube - 4
  Commvault Complete Data Protection - 4
  ЮниДата Платформа управления данными - 3
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 2
  Другие 27

  Datareon Platform - 71
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 7
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 5
  Полином:MDM - 2
  HFLabs Центр управления согласиями (ЦУС) - 2
  Другие 18

  Datareon Platform - 57
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 6
  Цифра: Диспетчер Система мониторинга промышленного оборудования и персонала - 4
  Naumen Enterprise Search - 3
  N3.Управление НСИ - 2
  Другие 19

  Datareon Platform - 31
  HFLabs Единый клиент - 2
  1С:MDM Управление нормативно-справочной информацией (1С:MDM Управление НСИ) - 2
  RT.Datalake Решение для хранения и обработки данных любых объемов - 2
  Data Sapience: Data Ocean Платформа управления данными - 2
  Другие 16