Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Дуров после задержания объяснил французской полиции, как правильно направлять запросы к Telegram 5 ч.
Ubisoft случайно устроила утечку сюжетного дополнения A Pirate's Fortune к Star Wars Outlaws — новый трейлер и дата выхода 5 ч.
«Как завещала матушка Westwood»: олдскульная стратегия Tempest Rising в духе Command & Conquer заслужила дифирамбы критиков 6 ч.
UserGate расширила экосистему UserGate SUMMA образовательными проектами и ИБ-услугами 7 ч.
Epic Games Store устроил на PC, Android и iOS раздачу очаровательного приключения Botanicula от создателей Samorost 8 ч.
На суде Марк Цукерберг обвинил TikTok в замедлении роста Meta 9 ч.
В работе Telegram произошёл глобальный сбой: приложение не запускается, сообщения не отправляются 9 ч.
Продажи легендарного симулятора колонии дварфов Dwarf Fortress в Steam превысили 1 миллион копий 9 ч.
Google официально признана монополистом в интернет-рекламе 9 ч.
Nvidia снова оплошала: пользователи массово жалуются на новый драйвер GeForce, который должен был исправить 40 проблем 10 ч.
Новая статья: Обзор и тестирование корпуса DeepCool CH690 Digital: свобода выбора 4 ч.
Китай достиг полного цикла работы первого в мире ториевого реактора 7 ч.
AOC выпустила 27-дюймовый игровой монитор Q27G40XMN с QHD, 180 Гц и подсветкой Mini-LED 9 ч.
Nothing представила наушники CMF Buds 2 с гибридным шумоподавлением и автономностью до 55 часов за  $59 10 ч.
TSMC пообещала треть 2-нм и более тонких чипов выпускать в США, но фабрики будут готовые ещё не скоро 10 ч.
Motorola представила зелёный планшет Moto Pad 60 Pro с Dimensity 8300 и батареей на 10 200 мА·ч за $315 10 ч.
Archer Aviation запустит летающую электромаршрутку между Манхэттеном и ближайшими аэропортами 11 ч.
Tesla ответит в суде за махинации с показаниями одометров для ускоренного истечения гарантии 11 ч.
Seagate утверждает, что HDD гораздо экологичнее SSD с точки зрения углеродных выбросов 11 ч.
Motorola представила свой первый ноутбук — компактный Moto Book 60 с OLED, Intel Core и Wi-Fi 7 12 ч.