Сегодня 05 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → pdf

Adobe представила Acrobat Studio — платформу на базе ИИ для работы со множеством разношёрстных файлов

Adobe представила новую платформу Acrobat Studio. Она объединяет работу с документами в формате PDF с сервисом создания контента Adobe Express и помощниками на базе ИИ, способными автоматизировать выполнение конкретных рабочих задач. Acrobat Studio позволяет пользователям загружать до 100 документов разных форматов и объединять всю эту информацию в едином рабочем пространстве.

 Источник изображений: Adobe

Источник изображений: Adobe

Замысел Adobe заключается в том, чтобы превратить Acrobat из инструмента для чтения и редактирования PDF в платформу с поддержкой широкого спектра типов файлов и инструментов для повышения производительности, включая веб-страницы и файлы Microsoft 365. Платформа позволяет пользователям работать с несколькими документами одновременно, не выходя из Acrobat, используя среды совместной работы, называемые PDF Spaces (PDF-пространства). Они объединяют информацию из файлов и веб-сайтов в «центры знаний для общения».

PDF Spaces дают возможность просматривать и подписывать соглашения по проектам, объединять исследования и заметки, а также использовать встроенные инструменты Express для преобразования данных в инфографику или визуальные материалы, которыми можно делиться с коллегами и клиентами.

Acrobat Studio также включает настраиваемых агентов ИИ, созданных на основе ранее выпущенных функций искусственного интеллекта для стандартного Adobe Acrobat. ИИ-помощники могут использоваться отдельными пользователями и командами для предоставления аналитических отчётов, рекомендаций и заметок, а также генерировать идеи и цитаты на основе собранных данных.

  Сегодня продукт Acrobat Studio выпущен в раннем доступе для англоязычной аудитории по всему миру. Он предлагается по подписке, которая может заменить тарифные планы Adobe Acrobat Standard и Acrobat Pro. Стоимость раннего доступа начинается с $24,99 в месяц для отдельных пользователей и с $29,99 в месяц для команд при годовом контракте. Пока неясно, изменится ли цена после окончания раннего доступа 31 октября.

Браузер Chrome для Android наконец-то научился открывать PDF-файлы

До настоящего момента для просмотра файла формата PDF на Android пользователям приходилось использовать сторонние приложения. Теперь же Google наконец развернула встроенную поддержку PDF-файлов в веб-обозревателе Chrome для Android. Первые упоминания о нативной поддержке PDF-файлов (Open PDF Inline на Android) появились в коде ещё в феврале 2024 года, но сама эта возможность ранее была заблокирована.

 Источник изображений: androidauthority.com

Источник изображений: androidauthority.com

Эта весьма востребованная функция гарантированно работает в Android 15, но её поддержка в более старых версиях Android пока отсутствует.

Средство отображения PDF-файлов в Chrome для Android предлагает встроенную панель аннотаций с функциями ручки, маркера, ластика, отмены, повтора и видимости. Пользователь может выбирать толщину и цвет линии и прокручивать документ, чтобы выбрать место для аннотации. По умолчанию панель отображается внизу страницы, но её можно переместить вверх.

При просмотре PDF-файлов доступен полнотекстовый встроенный поиск Chrome, который отображает все вхождения искомого текста в документе и позволяет легко перемещаться между ними.

 Источник изображений: androidauthority.com

Первый раз упоминание о возможности просматривать файлы PDF в браузере (Open PDF Inline on Android pre-V) был обнаружено ещё в коде Android 12, но до сих пор эта возможность оставалась заблокированной.

Mistral AI представила инструмент, который превратит любой PDF-документ в текстовый файл для ИИ

Французский разработчик больших языковых моделей (LLM) Mistral AI объявил о выпуске нового API, который предназначен для обработки сложных PDF-документов. Mistral OCR — это API оптического распознавания символов (OCR), с помощью которого любой PDF-документ можно превратить в текстовый файл, чтобы облегчить его обработку алгоритмами на основе искусственного интеллекта.

 Источник изображения: Scott Graham / Unsplash

Источник изображения: Scott Graham / Unsplash

Языковые модели, лежащие в основе популярных генеративных алгоритмов, таких как ChatGPT от OpenAI, особенно хорошо работают с необработанным текстом. Поэтому компании, которые намерены вводить собственные рабочие ИИ-процессы, знают о важности хранения и индексации данных в чистом формате, чтобы эту информацию можно было повторно использовать в процессе обработки ИИ-алгоритмами.

В отличие от многих API OCR, разработка Mistral представляет собой мультимодальный API, который способен распознавать не только текст, но также иллюстрации и фотографии, размещённые между текстовыми блоками. API OCR формирует ограничительные рамки вокруг обнаруженных графических элементов и включает их в вывод. В результате обработки PDF-документа с помощью Mistral OCR формируется отформатированный в Markdown текст, который ИИ-алгоритмы обрабатывают более эффективно.

 Источник изображения: Mistral

Источник изображения: Mistral

«С годами в организациях накапливается множество документов, часто в формате PDF или в виде слайдов, которые недоступны для обработки LLM, особенно для систем RAG [Retrieval-Augmented Generation — техника получения и использования данных в качестве контекста для генеративных ИИ-алгоритмов]. Благодаря Mistral OCR наши клиенты могут преобразовывать сложные документы в читаемый контент на всех языках. Это важнейший шаг на пути к широкому внедрению ассистентов с искусственным интеллектом в компаниях, которым необходимо упростить доступ к обширной внутренней документации», — считает соучредитель и научный руководитель Mistral Гийом Лэмпл (Guillaume Lample).

Mistral OCR доступен на собственной платформе компании, а также в инфраструктуре облачных партнёров Mistral, таких как AWS, Azure и др. Для компаний, которые работают с конфиденциальными или секретными данными, Mistral предлагает версию API для локального развёртывания. В компании заявили, что Mistral OCR работает лучше, чем аналогичные API от Google, Microsoft или OpenAI. Компания протестировала свой API на сложных PDF-документах, в том числе содержащих математические выражения, сложные макеты и таблицы.

Старшеклассник запустил Linux прямо внутри PDF-файла

Старшеклассник Аллен Динг (Allen Ding), который ранее отметился запуском классической стрелялки Doom в файле PDF, усовершенствовал свой проект и встроил в файл PDF возможность запуска Linux.

 Источник изображения: youtube.com/@vk6_

Источник изображения: youtube.com/@vk6_

Этот проект — переосмысление возможностей JavaScript при работе с PDF. Его исходный код доступен на странице разработчика на GitHub, а опробовать LinuxPDF можно по этому адресу — потребуется браузер на базе Chromuim, такой как Chrome, Edge или Opera. LinuxPDF работает в эмуляторе RISC-V на базе TinyEMU; внутренние механизмы проекта имеют много общего с DoomPDF за авторством того же разработчика. Управление системой производится при помощи виртуальной клавиатуры под главным экраном.

Формат PDF разрабатывался для вывода текста и изображений, но поддерживается и запуск кода JavaScript. Программа Adobe Acrobat включает полную спецификацию JavaScript, в том числе функции 3D-рендеринга, обнаружения монитора и HTTP-запросов. Запускаемые через браузеры PDF-файлы несколько ограничены в возможностях, но и их хватает для запуска игр и операционных систем.

Запущенная через PDF система Linux отличается катастрофически низкой производительностью — загрузка ядра занимает около минуты, и исправить это не получится, потому что в Chromium встроена версия движка V8 без поддержки JIT-компилятора. По умолчанию система 32-битная, но на GitHub можно сделать форк проекта и создать 64-битный вариант, который, однако, будет работать ещё медленнее.

Copilot в Microsoft Edge научился обрабатывать PDF-файлы, и это может стать причиной утечки данных

Microsoft стремится интегрировать максимальное количество ИИ-функций в свой веб-обозреватель. Новую порцию ИИ-улучшений получил и встроенный в Microsoft Edge инструмент для чтения документов PDF. ИИ-функция, добавленная в Copilot, сканирует документ, выделяя ключевые слова и фразы, а затем предоставляет пользователю дополнительную информацию. Обработка, вероятно, производится на серверах Microsoft, что может нарушить конфиденциальность.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Новый инструмент доступен при нажатии кнопки, появившейся рядом с существующей кнопкой «Спросить Copilot» в интерфейсе PDF-ридера. Она запускает сканирование всего PDF-документа для генерации соответствующих ключевых слов и фраз. Затем пользователь может выбрать любое из них, чтобы открыть боковую панель Copilot в браузере и получить больше контекста или информации, связанной с этим ключевым словом.

Содержимое PDF-файла, вероятно, обрабатывается и анализируется серверами Microsoft, что потенциально может привести к утечке конфиденциальной информации. Скорее всего, при обработке документов также будет производиться масштабный сбор данных для улучшения модели ИИ и изучения пользовательского опыта. Стоит дважды подумать, прежде чем использовать новую функцию для обработки документов с чувствительной информацией, например, налоговых форм или финансовых договоров.

Весьма вероятно, что в ближайшее время Microsoft расширит область применения новой ИИ-функции, добавив в список обрабатываемых файлов документы Word, электронные таблицы Excel и презентации PowerPoint.

Эта функция — лишь одна из нескольких возможностей на базе ИИ, которые были добавлены в Edge. Ранее обозреватель получил функцию интеллектуального поиска, которая обнаруживает связанные совпадения и слова, что упрощает поиск информации на странице. «Генератор тем» на базе ИИ преобразует текстовые подсказки в визуальные дизайны. ИИ даже научился автоматически присваивать названия группам вкладок для эффективного просмотра.

Сейчас, если судить по предварительной сборке Canary, Microsoft работает над улучшением способности ИИ в Edge предлагать пользователю сайты для просмотра. Точная природа и функциональность этих нововведений пока не известна, но, учитывая стремление Microsoft к массированному внедрению ИИ везде, где только можно, рано или поздно они появятся.


window-new
Soft
Hard
Тренды 🔥
«Жидкое стекло» Apple можно будет заматировать: представлена нова бета iOS 26.1 12 мин.
Сервисы AWS упали второй раз за день — тысячи сайтов по всему миру снова недоступны 8 ч.
Fujitsu влила £280 млн в британское подразделение в преддверии выплат компенсаций жертвам багов в её ПО Horizon 8 ч.
Календарь релизов 20 – 26 октября: Ninja Gaiden 4, Painkiller, Dispatch и VTM – Bloodlines 2 8 ч.
В Windows сломалась аутентификация по смарт-картам после октябрьских обновлений — у Microsoft есть временное решение 9 ч.
Вместо Majesty 3: российские разработчики выпустили в Steam амбициозную фэнтезийную стратегию Lessaria: Fantasy Kingdom Sim 9 ч.
Слухи: Лана Дель Рей исполнит заглавную песню для «Джеймса Бонда», но не в кино, а в игре от создателей Hitman 10 ч.
Зов сердца: разработчики Dead Cells объяснили, почему вместо Dead Cells 2 выпустили Windblown 11 ч.
Adobe запустила фабрику ИИ-моделей, заточенных под конкретный бизнес 11 ч.
Китай обвинил США в кибератаках на Национальный центр службы времени — это угроза сетям связи, финансовым системам и не только 12 ч.
Президент США подписал соглашение с Австралией на поставку критически важных минералов на сумму $8,5 млрд 18 мин.
Новая статья: Обзор смартфона realme 15 Pro: светит, но не греется 5 ч.
Ещё одна альтернатива платформам NVIDIA — IBM объединила усилия с Groq 5 ч.
Учёные создали кибер-глаз, частично возвращающий зрение слепым людям 6 ч.
Samsung выпустила недорогой 27-дюймовый геймерский монитор Odyssey OLED G50SF c QD-OLED, 1440p и 180 Гц 6 ч.
Акции Apple обновили исторический максимум на новостях об отличных продажах iPhone 17 8 ч.
Представлен флагман iQOO 15 с чипом Snapdragon 8 Elite Gen 5 и батареей на 7000 мА·ч по цене меньше $600 9 ч.
Нечто из космоса врезалось в лобовое стекло самолёта Boeing 737 MAX компании United Airlines 10 ч.
Умные кольца Oura научатся выявлять признаки гипертонии, как последние Apple Watch 11 ч.
Дешёвая корейская термопаста оказалась вредна для процессоров и здоровья пользователей 11 ч.