Сегодня 18 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Умные помощники: обзор ИИ-сервисов для обработки изображений. Часть 2, актуализированная 2 ч.
Моддер показал геймплей Dark Souls 2 с бесшовным кооперативом — игроки в восторге 4 ч.
Telegram удалили из Apple App Store и Google Play в Индии 5 ч.
Assassin’s Creed Black Flag Resynced ушла на золото за три недели до релиза — ремейк «Чёрного флага» выйдет в срок 6 ч.
Возраст не помеха: спустя семь лет с релиза Devil May Cry 5 установила рекорд по продажам за год 7 ч.
Дженсен Хуанг: обществу необходимы «новые социальные нормы» в эпоху ИИ 8 ч.
Смартфоны Samsung научатся оценивать здоровье питомцев по фотографии 8 ч.
Спустя четыре года апгрейд GTA V до версий для PS5, Xbox Series X и S всё-таки станет бесплатным 8 ч.
Создатели хоррор-шутера Luna Abyss остались без работы через месяц после релиза — всех уволили 9 ч.
Внезапная блокировка Anthropic Fable 5 подстегнула интерес к открытым ИИ-моделям 9 ч.
Sandisk оценила SSD Optimus GX PRO 850P ёмкостью 8 Тбайт для PS5 почти в пять раз дороже самой консоли 5 ч.
Полный комплект комплектующих и аксессуаров Asus ROG 20th Anniversary Collection Edition оценён в $16 580 в Китае 6 ч.
В Гонконге открывается круглосуточный магазин с продавцом-андроидом 6 ч.
MSI наделила свои платы для Intel поддержкой половинчатых модулей DDR5 HUDIMM 7 ч.
Учёные разработали память, которая умеет забывать лишнюю информацию — совсем как человеческий мозг 8 ч.
Китай проследит, как ИИ отнимает и создаёт рабочие места 9 ч.
Silicon Motion будет внедрять PCIe 6.0 в SSD с оглядкой на процессоры Nvidia, а не Intel или AMD 9 ч.
Тяжёлая ракета Ariane 6 впервые стартовала в самой мощной конфигурации — она вывела на орбиту спутники Amazon Leo 9 ч.
«Мегафон» связал Россию и Китай новым магистральным каналом связи 10 ч.
«Я собираюсь красть ваших клиентов»: глава Nothing объявил войну Apple из-за слишком скучных iPhone 10 ч.