ContentCapture (ранее Content AI FlexiCapture)

Продукт
Разработчики: Content AI (Контент ИИ)
Дата последнего релиза: 2024/07/25
Технологии: СЭД - Системы потокового распознавания

Содержание

ContentCapture (ранее FlexiCapture) – универсальная платформа для интеллектуальной обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. C ContentCapture можно ускорить и упростить любые процессы, связанные с документооборотом.

ContentCapture оснащена инструментами, позволяющими гибко интегрировать процесс потокового ввода в текущую деятельность компании, что значительно упрощает обмен данными внутри организации.

Решения могут быть интегрированы с различными информационными системами, например, ECM, CRM, RPA, АБС и т.д.

2024

Совместимость с Documino

«Айди–Технологии управления» и Content AI подтвердили совместимость работы ECM-платформы Documino c IDP-платформой ContentCapture. Об этом Content AI сообщил 3 сентября 2024 года. Подробнее здесь.

Совместимость с «Ред ОС»

Content AI подтвердил, что теперь пользователям Ред ОС доступно кросс-платформенное решение ContentCapture для автоматической обработки информации из любых типов документов. Об том Ред Софт сообщил 20 августа 2024 года.

Компании провели комплексное тестирование, которое подтверждает корректность и работоспособность всех компонентов IDP-платформы ContentCapture в среде операционной системы РЕД ОС. По итогам тестирования компании подписали сертификат о совместимости продуктов.

«
Подписав сертификат совместимости ContentCapture c РЕД ОС, мы завершили задачу по подтверждению работоспособности всех своих флагманских продуктов с одной из ведущих отечественных операционных систем. Ранее мы провели соответствующие успешные испытания редактора ContentReader PDF и решения для интеллектуального корпоративного поиска Content AI Intelligent Search. Все продукты продемонстрировали устойчивость и безошибочное функционирование в среде РЕД ОС. Поэтому пользователи данной операционной системы могут встраивать их в свой ИТ-ландшафт без каких-либо опасений, — подчеркнула Светлана Дергачева, генеральный директор Content AI.
»

«
Среди наших заказчиков — организации, деятельность которых тесно связана с документооборотом. Мы рады предлагать клиентам больше совместимых решений, нацеленных на автоматизацию и ускорение процессов, связанных с рутинными задачами. С каждым годом процессы ускоряются все больше, поэтому наличие такого инструмента, как ContentCapture, полезная практика для организации, — добавил Рустам Рустамов, заместитель генерального директора РЕД СОФТ.
»

Совместимость с DocTrix

Content AI и i-Sys договорились о технологическом сотрудничестве, которое поможет российским заказчикам повысить эффективность управления документо-ориентированными бизнес-процессами. Об этом Content AI сообщил 5 августа 2024 года.

Компании успешно протестировали совместную работу платформы для автоматизации бизнес-процессов DocTrix и флагманских IDP-решений (IDP, Intellectual Document Processing) Content AI – ContentReader Server и ContentСapture. Подробнее здесь.

ContentCapture 14.2 с распознаванием на основе технологий машинного обучения

Content AI продолжает расширять функциональность своих продуктов с помощью искусственного интеллекта.

Компания выпустила релиз IDP-платформы ContentCapture 14.2 с усовершенствованным инструментом добавления новых типов документов. Начиная с этой версии, обучение распознаванию новых типов документов, с которыми планирует работать пользователь, реализовано на основе технологий машинного обучения. Об этом разработчик сообщил 25 июля 2024 года.Известный писатель-фантаст Сергей Лукьяненко выступит на TAdviser SummIT 28 ноября. Регистрация 5.6 т

Теперь достаточно показать системе несколько примеров документов и разметить в них необходимые для извлечения поля. Далее ContentCapture сможет автоматически обрабатывать аналогичные файлы, извлекая данные из указанных ранее полей. Данная функциональность доступна как для Windows, так и для и Linux.

«
Удобство добавления новых типов документов позволит ускорить настройку комплекса и значительно упростить работу с платформой, так как заказчики смогут делать это самостоятельно, не обращаясь к вендору и не привлекая дорогостоящих специалистов, – уточнила Светлана Дергачева, генеральный директор Content AI. – Развивая ContentCapture, мы думаем не только над принципиально новыми функциями, но и учитываем персональный опыт сотрудников, взаимодействующих с системой. Большое внимание уделяется таким факторам как простота «входа» в продукт новых пользователей и удобство выполнения различных операций.
»

«
Технологии на основе машинного обучения и нейронных сетей открывают широкие возможности для улучшения продуктов. Мы выбираем только такие решения, которые, действительно, работают и несут наибольшую практическую пользу нашим заказчикам, – добавил Иван Волков, директор по продуктам Content AI.
»

IDP-платформа ContentCapture предназначена для автоматизации обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение востребовано крупными компаниями из различных сфер бизнеса и государственными организациями, которые в ежедневном режиме принимают большой поток документов. ContentCapture распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.

Вместе с тем в данном релизе продукта команде разработки Content AI удалось качественно оптимизировать технологию распознавания русского рукописного текста. Для этого были задействованы нейронные сети. ContentCapture научилась распознавать рукописный текст в полнотекстовом формате и в документах с многострочными полями. Система стала лучше считывать сложный почерк и в целом увеличила качество распознавания на 5%. Кроме того, в версии 14.2 появилась поддержка распознавания печатного и рукописного текста в одном поле, что позволяет в едином потоке обрабатывать документы, содержащие такие виды текста, например, паспорта. Также система научилась распознавать рукописные слова, содержащие буквы и цифры, – артикулы деталей или номера автомобилей.

IDP-платформа ContentCapture включена в реестр российского ПО, работает на отечественных ОС и на Windows. Подходит для импортозамещения ABBYY FlexiСapture, Kofax Capture, IBM Datacap.

Совместимость ContentCapture 14.2 с Platform V SberLinux OS Server

СберТех и Content AI 23 июля 2024 года объявили о совместимости своих продуктов: универсальной платформы для распознавания и извлечения данных из документов с помощью искусственного интеллекта ContentCapture и серверной операционной системы Platform V SberLinux OS Server.

Компании провели двустороннее тестирование, по итогам которого подтверждено, что версия ContentCapture 14.2 корректно инсталлируется и сохраняет полную функциональность при работе на Platform V SberLinux OS Server. Это значит, что на базе продуктов российских разработчиков Content AI и СберТеха бизнес может построить надежный и импортонезависимый технологический стек для повышения эффективности работы с документами.

«
Platform V SberLinux OS Server создана с учетом потребностей крупного бизнеса по размещению высоконагруженных распределенных систем высокого уровня критичности. Она позволяет нашим клиентам использовать доступные и легкие в обслуживании серверы, а также передовые технологические решения, такие, как продукты компании Content AI,
сказал Максим Тятюшев, генеральный директор СберТеха.
»

«
Экосистема продуктов цифровой облачной платформы Platform V от СберТеха сегодня активно развивается, и мы рады установить партнерские отношения. В условиях импортозамещения и формирования отечественного ИТ-суверенитета сотрудничество технологических компаний имеет крайне важное значение. Проводя тестирование продуктов и подтверждая их совместимость, мы гарантируем надежность, безопасность, устойчивость ПО, с помощью которого наши клиенты смогут эффективно решать свои задачи,
отметила Светлана Дергачева, генеральный директор Content AI.
»

Получение статуса ИИ-продукта в реестре отечественного ПО

Продукты Content AI IDP-платформа ContentCapture и многофункциональный редактор ContentReader PDF получили статус программных продуктов, относящихся к сфере искусственного интеллекта. Запись об этом появилась на страницах решений в реестре российских программ для электронных вычислительных машин и баз данных. Об этом разработчик сообщил 10 июля 2024 года. Подробнее здесь.

Совместимость ContentCapture 14 с Astra Linux Special Edition 1.7

Content AI и «Группа Астра» 25 апреля 2024 года объявили о совместимости своих продуктов: ContentCapture 14 и защищенной ОС Astra Linux Special Edition 1.7.

По результатам комплексного тестирования компании подписали сертификат, подтверждающий корректность совместной работы Astra Linux Special Edition и ContentCapture 14, кросс-платформенной версии решения для интеллектуальной обработки документов.

«
Сертификация ПО от Content AI станет значимой новостью для рынка, так как российские организации применяют автоматизированную обработку документов и данных не один десяток лет, и теперь вендор официально гарантирует корректность работы ContentCapture под Astra Linux. Это дает нашим клиентам уверенность, что можно успешно пользоваться технологиями, не зависящими от зарубежных разработчиков, и сохранить непрерывность бизнес-процессов. Мы очень рады тому, что коллеги из Content AI разделяют нашу позицию относительно необходимости обеспечивать полную совместимость продуктов, и уверены, что в результате дальнейшего сотрудничества конечным пользователям всегда будут доступны самые современные версии нашего софта, корректно работающие в рамках одной ИТ-инфраструктуры, — сказал Алексей Трубочев, директор департамента сопровождения «Группы Астра».
»

2023

Доступность на Linux в сетевом варианте использования

Компания Content AI 27 ноября 2023 года выпустила обновленную кросс-платформенную версию своего флагманского продукта ContentCapture 14.

В данном релизе платформа для извлечения данных и потоковой обработки информации из любых типов документов стала доступна на Linux в сетевом варианте использования, который позволяет задействовать мощности нескольких серверов для обработки большого количества документов. Сетевая установка предназначена для крупных проектов, где требуется обрабатывать десятки и сотни тысяч страниц ежедневно. Благодаря переходу на кросс-платформенный технологический стек продукт предоставляет одинаковую функциональность, вне зависимости от используемой ОС.

Также поддержан вариант гибридной инсталляции, когда в процессе импортозамещения на первом этапе на Linux мигрирует только серверная часть, а рабочие станции остаются на Windows. Это позволит осуществить миграцию максимально комфортно для пользователей.

«
В 2023 году фокус внимания команды Content AI сосредоточен на адаптации ключевых продуктов, в том числе ContentCapture для Linux, – уточнил технический директор компании Иван Волков. – В процессе реализации задачи мы ориентировались на лучшие практики по созданию кросс-платформенного ПО. Важно, чтобы наши решения сохраняли привычные пользователям свойства Windows-версий, и при этом были совместимы с отечественными операционными системами, такими как Astra Linux, ОС Альт и РЕД ОС. Серверная часть решения упакована в docker-контейнеры и готова к работе как на отдельных Linux-машинах, так и в составе docker-кластера.
»

Решение СontentCapture предназначено для компаний, которые в ежедневном режиме обрабатывают большие потоки входящей электронной и бумажной документации. Платформа позволяет автоматизировать обработку информации, извлеченной из отсканированных бумаг, фотографий, электронных документов. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.

ContentCapture входит в реестр отечественного ПО и может заместить продукты западных вендоров – ABBYY FlexiCapture, Kofax Capture, IBM Datacap.

«
В основе продуктов Content AI лежат одни из лучших в мире технологий для интеллектуального распознавания данных и обработки естественного языка. Сегодня нам важно адаптировать их для нужд российских заказчиков, поэтому компания занимается выпуском решений для Linux и их совместимостью с отечественными операционными системами. Мы работаем в тесной связке с представителями различных секторов бизнеса и вместе находим оптимальные решения задач замещения иностранного софта, – пояснила Светлана Дергачева, генеральный директор Content AI.
»

В 2024 году Content AI также планирует выпустить ряд важных функциональных обновлений ContentCapture, связанных с повышением удобства использования продукта и упрощением основных операций.

Обновление с функцией распознавания русского рукописного текста

Функция распознавания русского рукописного текста появилась в обновленной версии платформы для интеллектуальной обработки информации ContentCapture. Обновленный релиз своего флагманского продукта 17 июля 2023 года представил российский разработчик ИИ-решений Content AI.

ContentCapture

Как сообщалось, программа с обновленной функциональностью способна с оптимальной точностью распознавать в документах заполненные от руки поля на русском языке. Ранее ContentCapture могла распознавать только рукопечатный текст, где каждая буква прописывалась в отдельных полях заполняемой формы, например, анкеты или опроса. В данном релизе эти возможности объединены: система автоматически определяет, как написан текст, и распознает символы.

Важное технологическое изменение – способность распознавать курсив, то есть фразы, написанные без отрыва ручки от бумаги. Это одна из самых сложных задач, с которой ранее OCR-редакторы справлялись менее успешно. Кроме того, в выпуске существенно оптимизировано качество распознавания рукописного английского текста.

В ходе тестирования обновленной функциональности ContentCapture подтверждена точность распознавания данных в документах определенного типа в диапазоне 85-95%: речь идёт о паспортах и других документах, удостоверяющих личность, тестовых формах, служебных записках, подготовленных в свободном стиле.

«
Качество распознавания в рамках данной задачи сильно зависит от разборчивости почерка и вида документа. Во внутренних тестах мы ориентировались на лучшие образцы технологий, имеющиеся на российском рынке. По ряду сценариев распознавание русского рукописного текста в ContentCapture демонстрирует оптимальные показатели среди всех протестированных продуктов. Мы готовы индивидуально обучать и настраивать систему для более точной обработки конкретного, даже самого редкого, типа документа, если у заказчиков будет такая необходимость.

уточнил Иван Волков, технический директор Content AI
»

«
Сценарии применения технологии распознавания рукописного текста востребованы в различных сферах, в которых ведется работа с документами, заполненными от руки, например в финансовых организациях и государственных структурах. Через специалистов этих ведомств ежедневно проходят десятки и сотни документов с элементами рукописного текста – паспортов, свидетельств, анкет, заявлений. Ввод данных в информационные системы зачастую осуществляется вручную. Автоматическая обработка и распознавание не только значительно оптимизирует скорость работы сотрудников, но и сократит количество ошибок, которые могут быть допущены при ручном переносе данных.

отметила Светлана Дергачева, генеральный директор Content AI
»

В основе технологии распознавания русского рукописного текста лежат собственные разработки Content AI в области нейронных сетей. Современные методики впервые применены для реализации этой функциональности. В текущем релизе распознавание русского рукописного текста доступно в версии ContentCapture для Windows. До конца 2023 года планируется выпуск кросс-платформенной версии с возможностью использования на операционных системах на базе Linux.

В числе других обновлений релиза ContentCapture – редизайн интерфейса веб-станций. Он стал более легким и современным. При этом внутренняя структура продукта не претерпела значительных изменений, поэтому уже знакомые с платформой пользователи смогут приступить к работе без необходимости повторного обучения.

Включение в реестр российского ПО

Универсальная платформа для интеллектуальной обработки информации ContentCapture включена в реестр российского ПО под номером 17598. Об этом компания Content AI (Контент ИИ) сообщила 17 мая 2023 года.

ContentCapture — это российский аналог продукта ABBYY FlexiCapture, модифицированный специально для отечественного рынка с учетом потребностей российских пользователей. В основе платформы лежат технологии распознавания и интеллектуальной обработки документов. Решение позволяет ускорить и упростить любые процессы, связанные с документооборотом за счет высококачественного распознавания, классифицикации, извлечения данных из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений.

«
Бизнес нуждается в инструментах, позволяющих быстро и качественно обрабатывать информацию. Платформа ContentCapture способна стать ключевым элементом корпоративной инфраструктуры в организациях, которые управляют множеством бизнес-процессов и ежедневно принимают и генерируют большой поток данных, — отметила генеральный директор Content AI Светлана Дергачева. — Также ContentCapture идеально вписывается в стратегию цифровой трансформации. Собирая и анализируя информацию, платформа способствует ускорению транзакций, снижению затрат, повышению эффективности и оперативному принятию решений.
»

Включение ContentCapture в реестр отечественного ПО дает возможность различным ведомствам, компаниям из государственного сектора, образовательным учреждениям и архивам беспрепятственно использовать продукт в работе. С его помощью организации смогут в разы увеличить скорость и качество обработки информации, что в конечном итоге позволит быстрее реагировать на обращения граждан.

Content AI планирует развивать платформу ContentCapture, исходя из актуальных потребностей российского бизнеса. В следующих версиях предполагается расширение функциональности продукта для реализации новых пользовательских задач, которые постоянно возникают в процессе цифровой трансформации бизнеса и государственных структур. В числе приоритетных направлений – адаптация решения для упрощенной бесшовной интеграции с отечественным программным обеспечением на базе Linux.

Смена названия на ContentCapture

В январе-феврале 2023 года универсальная платформа для интеллектуальной обработки информации из любых типов документов FlexiCapture была переименована в ContentCapture.





Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (746)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Content AI (Контент ИИ) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (16, 130)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 622)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Beorg (Биорг) (1, 2)
  Content AI (Контент ИИ) (1, 2)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151
  Synerdocs - 130
  Smart ID Engine (ранее Smart IDReader) - 113
  ABBYY FlexiCapture - 90
  Е1 Евфрат - 87
  Другие 777

  Syntellect Tessa Мобильное согласование - 30
  Syntellect Tessa Графический визуализатор процессов - 28
  Smart ID Engine (ранее Smart IDReader) - 12
  ABBYY FlexiCapture - 6
  ЭЛАР ПланСкан - 6
  Другие 28

  Smart ID Engine (ранее Smart IDReader) - 10
  ЭЛАР ПланСкан - 9
  Beorg Smart Vision - 8
  ЭЛАР ПауэрСкан - 2
  Directum Jazz - 2
  Другие 16

  Smart ID Engine (ранее Smart IDReader) - 18
  ЭЛАР ПланСкан - 8
  Syntellect Tessa Графический визуализатор процессов - 4
  Beorg Smart Vision - 4
  ЭЛАР СканИмидж - 4
  Другие 19

  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 5
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  ContentReader Server - 2
  ЭЛАР СканИмидж - 2
  Другие 11