Сегодня 19 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В ранний доступ Steam ворвался ролевой роглайк Moonlighter 2: The Endless Vault про двойную жизнь торговца и искателя приключений 48 мин.
Геймплей ролевого экшена Fatekeeper от бывших разработчиков Titan Quest 2 порадовал фанатов Dark Messiah of Might and Magic 2 ч.
Выросшие в интернете зумеры использует пароли слабее, чем их дедушки и бабушки 3 ч.
Первое крупное обновление принесёт в Ghost of Yotei режим «Новая игра +» и не только — геймплейный трейлер и дата выхода 3 ч.
В ЕС готовят конец эпохе раздражающих cookie-окон — всё решится на уровне браузера 4 ч.
The Temple of Elemental Evil не заставит себя долго ждать — объявлена дата выхода в Steam переиздания культовой RPG от соавторов Fallout 4 ч.
В Центробанке не ждут, что россияне массово перейдут на цифровой рубль 5 ч.
Исследователи собрали базу из 3,5 млрд номеров WhatsApp — мессенджер сам их выдавал 5 ч.
TikTok защитит пользователей от ИИ-контента и вознаградит ответственных 5 ч.
Австралиец погиб, не сумев вызвать скорую с Samsung Galaxy — на смартфоне не было обновлено ПО 8 ч.
Представлен «самый мощный серийный Porsche всех времён» — 1139-сильный Cayenne Electric 2 ч.
На Луне открыли свежий метеоритный кратер — это напомнило о рисках колонизации спутника 3 ч.
По одному GPU на каждого американца: ИИ-облако Lambda привлекло ещё $1,5 млрд инвестиций на амбициозное развитие инфраструктуры 4 ч.
Уровень брака у ангстремного техпроцесса Intel 18A падает на 7 % в месяц — процессоры Panther Lake не за горами 4 ч.
TP-Link подала в суд на Netgear за клевету о связях с Китаем — под угрозой продажи на $1 млрд 5 ч.
Honor живьём показала Robot Phone с камерой на роборуке — официальный анонс намечен на март 5 ч.
Noctua выпустила чёрный флагманский кулер NH-D15 G2 chromax.black по цене от $160 5 ч.
Кризис в Красном море повлиял на проекты интернет-кабелей Google и Meta 5 ч.
132 «динамических» Arm-ядра и 12 каналов памяти: Microsoft представила процессоры Cobalt 200 для облака Azure 6 ч.
ЦЕРН разогнал производство антивещества в восемь раз: «10 лет назад это сочли бы научной фантастикой» 7 ч.