Сегодня 04 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Минцифры подготовит почву для создания замены SAP — «1С» говорит, что замена уже есть 1 мин.
Представлен российский сервер Java-приложений WildBoss Pro, способный заменить IBM WebSphere Application Server и Oracle GlassFish Server 25 мин.
Надёжный инсайдер: Techland отменила амбициозную фэнтезийную RPG, но занялась новой Call of Juarez 60 мин.
После ухода генерального директора Илья Суцкевер был вынужден возглавить основанный им стартап Safe Superintelligence 2 ч.
Конец эпохи: Intel закрыла приложение Unison для синхронизации ПК и смартфонов 7 ч.
Минюст США убедил Google и Apple не блокировать TikTok, пообещав их не штрафовать 7 ч.
Destiny: Rising не заставит себя долго ждать — дата выхода и новый геймплейный трейлер 10 ч.
Anthem уйдёт в вечный офлайн — Electronic Arts скоро отключит серверы провального шутера 11 ч.
«Базальт СПО» представила в Китае российский ПАК с китайскими чипами Loongson 13 ч.
Петиция «Прекратите убивать игры» набрала миллион подписей для рассмотрения в Евросоюзе, но борьба ещё не окончена 13 ч.
У Tesla Optimus проблемы с «мускулами» и «разумом» — это отложит старт массового производства 9 мин.
Грузовик «Прогресс МС-31» отправился к МКС с припасами и наборами для опытов 20 мин.
Облако с ИИ: Alibaba расширяет ЦОД в Малайзии и на Филиппинах 2 ч.
Китайские регуляторы надеются одобрить первый автомобиль с автопилотом третьего уровня в следующем году 3 ч.
МТС запустит на транспортной сети сервисные маршрутизаторы BRAS/BNG собственной разработки 3 ч.
CoreWeave стала первым облачным клиентом Nvidia, запустившим эксплуатацию ускорителей Blackwell Ultra 6 ч.
E Ink придумала встроить в тачпад ноутбука экран на электронных чернилах — для общения с ИИ и не только 9 ч.
Новая статья: ИИтоги июня 2025 г.: ой, да было бы что заменять! 11 ч.
Transcend выпустила свой самый быстрый SSD для ПК — MTE260S со скоростью до 14 000 Мбайт/с 12 ч.
«Большой прекрасный закон» Трампа сулит тёмные времена солнечной энергетике США 12 ч.