Сегодня 09 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Like a Dragon: Pirate Yakuza in Hawaii — якудза в треуголке. Рецензия 9 ч.
В двух регионах РФ заблокировали Telegram — в Госдуме заверили, что на всю страну меры пока что не распространятся 9 ч.
ИИ-боты выяснили, кто из них лучше всех играет в «Мафию» — не обошлось без странностей 20 ч.
Microsoft создаст суверенный «рассуждающий» ИИ, который сможет потягаться с OpenAI и DeepSeek 20 ч.
«Нам потребуется больше времени»: поумневшая Siri задержится до 2026 года, подтвердила Apple 21 ч.
Сотрудник производителя DVD с фильмами продавал диски пиратам до релиза — теперь ему грозит 20 лет тюрьмы 24 ч.
Илону Маску предстоит дать показания по иску акционеров Twitter третьего апреля 08-03 07:45
Новая статья: Rift of the NecroDancer — дофаминовый разлом. Рецензия 08-03 00:04
В раннем доступе Steam вышла комедийная песочница про секретного агента в школе магии, которая выглядит как те самые игры по «Гарри Поттеру» 07-03 23:31
Microsoft навсегда закроет офисное приложение Publisher — его файлы перестанут открываться, но пока что их можно спасти 07-03 22:26
По мнению Трампа, США способны выпускать до 40 % мирового объёма передовых чипов 2 ч.
Первый ЦОД Stargate получит 64 тыс. ИИ-ускорителей NVIDIA GB200 к концу 2026 года 10 ч.
Lenovo представила серверы ThinkSystem SR630 V4 и SR650(a) V4 на базе Intel Xeon Granite Rapids-SP 6500P/6700P 11 ч.
QCT представила компактный edge-сервер QuantaEdge EGX88D-1U с 24 25GbE-портами на базе Intel Xeon Granite Rapids-D 11 ч.
Названа дата «спасения» застрявших на МКС астронавтов NASA 18 ч.
Британским провайдерам предложили тянуть «оптику» по заброшенным газовым трубам и водопроводам 24 ч.
Apple увернулась от запрета на поставки умных часов Watch в США по патентному иску AliveCor 08-03 05:51
Google отключилась от российских IX и ЦОД, но о полном уходе из страны речи нет 08-03 02:05
Зонд Intuitive Machines опрокинулся при посадке на Луну — это становится недоброй традицией 07-03 22:03
Boston Dynamics превратила человекообразного робота Atlas в идеального кладовщика 07-03 21:57