Сегодня 08 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Цукерберг заявил, что ИИ сможет решить проблему одиночества и заменить психолога 9 ч.
Apple добавит в Safari ИИ-поиск на фоне падения популярности поисковика Google 9 ч.
Electronic Arts пока не видит причин повышать стоимость игр до $80, несмотря на пример Microsoft и Nintendo 10 ч.
Энтузиаст возродил «Скрепыша» из старого Microsoft Office в виде ИИ-ассистента 13 ч.
Sony открыла новую внутреннюю студию для создания игр-сервисов — в teamLFG вошли ветераны разработки Halo, League of Legends, Fortnite и Roblox 13 ч.
Вышла операционная система «Альт Рабочая станция К» 11.0: Wayland по умолчанию и мегавыпуск KDE Plasma 6 14 ч.
Моддеры запустили классическую Doom внутри Zelda 64: Recompiled — неофициального порта The Legend of Zelda: Majora's Mask на ПК 14 ч.
Ядро Linux лишится поддержки процессоров Intel 486 и ранних 586 14 ч.
Магия, романтика и приключения: симулятор жизни в мире японских духов Tales of Seikyu готовится к выходу в раннем доступе Steam 18 ч.
Google отдаёт своему ИИ-боту Gemini более качественные данные, чем конкурентам 19 ч.
Microsoft повысила цену устройств Surface на 20 % — 13-дюймовый Surface Pro теперь стоит $1200 13 мин.
Администрация Трампа намерена предложить более простые правила в сфере контроля за экспортом ускорителей вычислений 37 мин.
Новые наушники Sony с шумоподавлением WH-1000XM6 будут дороже, но мощнее предшественников 2 ч.
Samsung договорилась о покупке аудиобизнеса Masimo за $350 млн 2 ч.
Новая статья: Обзор процессорных кулеров Ocypus Iota A40 BK и Delta A40 WH ARGB 8 ч.
MSI представила игровой 4K-монитор MAG 272UP QD-OLED X24 с частотой обновления 240 Гц 9 ч.
Публичный Wi-Fi стал спасением для москвичей на время перебоев мобильной связи 12 ч.
В Москве предупредили о перебоях в работе сотовой связи и сервисов — Кремль призвал отнестись с пониманием 13 ч.
Советская станция «Космос-482» рухнет на Землю 9–10 мая — она никому не навредит, уверены в «Роскосмосе» 13 ч.
AMD получила рекордную квартальную выручку, но ожидает до $1,5 млрд потерь из-за экспортных ограничений США 14 ч.