Сегодня 16 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новый ИИ-помощник Adobe может использовать приложения Creative Cloud для выполнения задач 3 ч.
Призыв существ, талисманы и новое эпическое оружие: для Titan Quest 2 вышло крупное обновление 4 ч.
Google выпустила приложение Gemini для macOS 4 ч.
Хоррор-шутер Industria 2 перенесли на 29 апреля — создатели пообещали как следует поработать в ближайшие две недели 4 ч.
Поездка затягивается: уютный симулятор путешествий в доме на колёсах Outbound не выйдет 23 апреля 6 ч.
«Вложу всю свою страсть, энергию и душу»: анимационный фильм по Bloodborne оказался в надёжных руках 6 ч.
Snap объявила о сокращении 1000 человек из-за «достижений в области ИИ» 7 ч.
Нет худа без добра: украденные хакерами данные об успехах GTA Online обернулись для Take-Two резким ростом стоимости акций 8 ч.
Европейское приложение для верификации возраста пользователей готово к запуску 9 ч.
Переработанная функция Windows Recall всё ещё не отвечает требованиям безопасности 9 ч.
Обувная компания Allbirds решила стать ИИ-неооблаком NewBird AI — инвесторы в восторге 2 ч.
Новая статья: ИИ в иллюминаторе: перспективы орбитальных дата-центров 2 ч.
Китайские учёные совершили рывок в сверхплотной голографической записи 4 ч.
Credo купила израильского разработчика кремниевой фотоники DustPhotonics 5 ч.
Keychron представила беспроводную игровую мышку G3 весом 44 г с флагманской начинкой 6 ч.
Аналитики уверены, что Apple не будет повышать цены на Mac, чтобы перетянуть пользователей ПК 6 ч.
Intel рассказала, каким должен быть игровой ноутбук с ИИ на базе Core Ultra 200HX Plus, — тихим, мощным и холодным 7 ч.
Компания Science бывшего президента Neuralink готовится установить в мозг человека первый биогибридный имплант 7 ч.
Microsoft получит 30 тыс. ИИ-ускорителей NVIDIA Vera Rubin, от которых отказалась OpenAI, отменившая проект Stargate Norway 8 ч.
Lexar: геймеры готовы жертвовать объёмом оперативной памяти, но не SSD 9 ч.