Сегодня 23 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Утечка: кадры со съёмок экранизации Elden Ring поразили фанатов достоверностью 2 ч.
ИИ-ассистент Google Gemini начал делать заметки, сводки и стенограммы не только во встречах Google Meet 3 ч.
Microsoft объявила о партнёрстве между Xbox и Discord, но скрыла детали 13 ч.
Google начала рекламировать поумневшую Apple Siri — в её основу ляжет ИИ Gemini 13 ч.
Tides of Tomorrow уже в продаже: асинхронное приключение от авторов Road 96, где игрок расплачивается за ошибки своих предшественников 13 ч.
Tencent и Alibaba готовы инвестировать в DeepSeek — стартап уже оценивается в более чем $20 млрд 15 ч.
В Steam и на консолях стартовала закрытая «бета» амбициозного ролевого боевика The Expanse: Osiris Reborn в духе Mass Effect — 35 минут геймплея 17 ч.
Первая за 25 лет новая игра о приключениях разумного дельфина Экко войдёт в сборник Ecco the Dolphin: Complete — подробности «правильного ремастера» 17 ч.
«Google Карты» скоро получат мощную порцию искусственного интеллекта 19 ч.
Паранормальный экшен Control теперь доступен на iPhone и iPad — с переработанным управлением и не только 19 ч.
Большой ящик на колёсах: Humble Robotics представил беспилотный грузовик без кабины с запасом хода в 320 км 2 мин.
Anthropic обогнала OpenAI — по оценке на вторичном рынке акций, которая взлетела до $1 трлн за три месяца 4 мин.
Маск обещал полный автопилот всем Tesla с 2016 года — теперь им нужен апгрейд «железа» на особых микрофабриках 5 мин.
Американцы потребовали от Nintendo вернуть им то, что они переплатили из-за трамповских пошлин 14 мин.
У Apple закончились запасы даже базовых Mac mini с чипом M4 и 16 Гбайт оперативной памяти 27 мин.
Стали известны цены на телевизоры LG Micro RGB evo — от $5000 за 75-дюймовую модель 28 мин.
Asus оценила флагманский ноутбук ROG Zephyrus Duo в заоблачные $8570 31 мин.
Мегафабрика Terafab Илона Маска будет выпускать чипы по ангстремному техпроцессу Intel 14A 36 мин.
Как на Татуине: индийская Uravu будет добывать питьевую воду из воздуха с помощью «мусорного» тепла ЦОД 56 мин.
Chuwi представила мощный мини-ПК AuBox X на настоящем Intel Core Ultra 2 ч.