Сегодня 12 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Сложная, безжалостная, незабываемая»: критики прониклись философским выживанием The Alters от создателей Frostpunk и This War of Mine 59 мин.
Konami и Bloober Team анонсировали ремейк оригинальной Silent Hill — первый тизер 3 ч.
«Википедия» перестала показывать ИИ-сводки из-за недовольства редакторов 3 ч.
Слухи: разработчики ремейка «Ведьмака» сделают для The Witcher 3: Wild Hunt ещё одно сюжетное дополнение 8 ч.
Meta запустила редактор видео на базе ИИ — пока он работает только по шаблонам 8 ч.
Названы функции iOS 26, которые не будут работать на старых iPhone 9 ч.
The Outer Worlds 2 всё-таки получит официальный перевод на русский язык 10 ч.
В Израиле придумали, как при помощи смарт-часов красть данные из изолированных систем 10 ч.
Безопасность операционных систем в контексте искусственного интеллекта обсудят на конференции OS DAY 2025 11 ч.
После 10 месяцев протестов гильдия актёров США прекратила забастовку против крупных игровых компаний, но это ещё не конец 11 ч.
«Уэбб» засёк самых маленьких коричневых карликов в истории, чем сломал теорию «несостоявшихся звёзд» 59 мин.
Lian Li выпустила беспроводные ПК-вентиляторы Uni Fan SL-INF Wireless с мизерной автономностью 2 ч.
Fujifilm представила беззеркальную камеру X-E5 в лаконичном ретро-стиле за $1700 4 ч.
Земной аппарат впервые в истории запечатлел южный полюс Солнца 5 ч.
Основатель Nvidia объявил десятилетие роботов и автономных машин 6 ч.
Китайская GAC запустила продажи двухместных летающих такси за $234 000 7 ч.
Европе необходим космический монополист, иначе Илон Маск похоронит космическую отрасль ЕС 7 ч.
Одним из первых достижений Трампа в сфере переноса производства в США станет отнюдь не iPhone 7 ч.
Huawei «покроет весь Китай», если США продолжат блокировать поставки чипов Nvidia, — предупредил Дженсен Хуанг 7 ч.
Память HBM будущего потребует сквозного охлаждения и других прорывных технологий 7 ч.