Сегодня 07 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В системе автообновления драйверов AMD обнаружена опасная уязвимость, но компания её не замечает 2 ч.
Команда из 16 ИИ-агентов Anthropic Claude смогла самостоятельно написать компилятор языка Си 2 ч.
Стриминговый сервис Disney+ лишился поддержки Dolby Vision, HDR10+ и 3D на фоне патентного спора 4 ч.
Apple откроет сторонним чат-ботам с ИИ доступ в CarPlay 4 ч.
Проблемное обновление Windows серьёзно замедлило видеокарты Nvidia 8 ч.
Распространяющийся через пиратские копии игр вирус RenEngine loader заразил 400 тыс. ПК 8 ч.
Из-за ошибки в коде программа-вымогатель Nitrogen шифрует файлы жертв безвозвратно 18 ч.
Новая статья: Highguard — хаос с потенциалом. Рецензия 21 ч.
Названы 26 ключевых технологий, которые в ближайшие 5 лет получат широкое применение в российском бизнесе 23 ч.
«Death Stranding в XIII столетии»: игроков впечатлил геймплей симулятора монгольского средневекового курьера The Legend of Khiimori 24 ч.
Китай в четвёртый раз запустил собственный космоплан — миссия засекречена 2 ч.
Asus выпустила внешний контейнер ROG Strix Aiolos для M.2 SSD со скоростью до 20 Гбит/с 3 ч.
AWS: ни один сервер с NVIDIA A100 не выведен из эксплуатации, а некоторые клиенты всё ещё используют Intel Haswell — не всем нужен ИИ 4 ч.
SpaceX разрешили возобновить запуски Falcon 9 после аварии — полёт на МКС намечен на 11 февраля 5 ч.
Акции американских бигтехов вернулись к росту после трёхдневного падения 5 ч.
Nintendo ожидает, что рост цен на память не особо повлияет на бизнес компании до конца марта 5 ч.
Военные США заплатят за разработку фотонных чипов для ИИ — для этого придётся в чём-то обмануть физику 5 ч.
Trump Mobile показала очередной вариант смартфона T1 Phone и рассказала о причинах задержки его запуска 7 ч.
Broadcom представила первые в отрасли решения Wi-Fi 8 для точек доступа и коммутаторов корпоративного класса 7 ч.
Montage Technology представила активные кабели PCIe 6.x/CXL 3.x 7 ч.