Сегодня 14 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Фильм по The Legend of Zelda выйдет раньше ожидаемого — премьеру опять перенесли 6 мин.
Яростный мультиплеерный шутер Hell Let Loose: Vietnam отправит игроков воевать во вьетнамские джунгли — новый трейлер и дата выхода 3 ч.
AMD выпустила драйвер с поддержкой Forza Horizon 6 и 007 First Light 3 ч.
Subnautica 2 вышла в раннем доступе — продажи уже превысили миллион копий 4 ч.
Видеокарты Radeon RX 6000 и RX 7000 получат поддержку масштабирования AMD FSR 4.1 5 ч.
Amazon отменила MMO по «Властелину колец», но уже взялась за новую «захватывающую» игру 6 ч.
Google урезает лимиты: некоторым новым пользователям Gmail выделяют всего 5 Гбайт вместо 15 Гбайт 6 ч.
Anthropic заявила, что ИИ уже пишет более 90 % её кода 6 ч.
Virtuozzo предложила инфраструктурную систему V/IS для ИИ, которая поможет справиться с ростом цен на ПО VMware 6 ч.
OpenAI предложила создать глобальный орган контроля ИИ с участием Китая и США 6 ч.
Nvidia мчится к капитализации в $6 трлн — за неделю акции выросли на 20 % 44 мин.
Крупнейший солнечный беспилотник совершил рекордный по длительности полёт и пропал в океане 51 мин.
Microsoft готовит компактный Xbox-контроллер для облачного гейминга 58 мин.
Угроза забастовки на полупроводниковых фабриках Samsung снова разогнала цены на память 2 ч.
Microsoft заподозрили в подавлении конкуренции через Word, Teams и Copilot 2 ч.
Razer представила игровой ноутбук Blade 18 с производительностью настольного ПК 2 ч.
«Несчастны все, кроме руководства»: в Meta рекордно упал моральный дух, несмотря на рекордные прибыли 5 ч.
Благодаря спросу на ИИ AMD нарастила долю на рынке серверных CPU, а Intel потихоньку теснит Arm 5 ч.
MSI выпустит очень лимитированную GeForce RTX 5080 в стиле «Мандалорца и Грогу» 6 ч.
NASA раскрыло подробности грядущей лунной миссии Artemis III, которая не полетит на Луну 7 ч.