Сегодня 22 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ocr

Google Chrome скоро научится преобразовывать PDF-файлы в текст для чтения их вслух

Google в скором времени обещает упростить взаимодействие с PDF-файлами для людей с плохим зрением. Компания добавляет в свой браузер Chrome технологию OCR (оптическое распознавание символов), которая будет преобразовывать PDF-файлы в текст, что сделает их более доступными, особенно для программ чтения с экрана. Видимо, имеются в виду PDF-файлы, в которых текст представлен в виде изображения. Инструмент также будет предоставлять текстовые описания изображений.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Google обещает, что функция преобразования PDF-файлов в текст станет доступна в «ближайшие месяцы». Компания также планирует расширить подобную функциональность за пределы Chrome в конце этого года, хотя и не сообщила, какие платформы могут получить обновление.

Нововведение от Google является частью более широкой образовательной инициативы, которая включает в себя лицензирование приложений для школьных Chromebook и бесплатный доступ к Adobe Express в США. Администраторы получат более жёсткий контроль над контентом, к которому учащиеся и преподаватели смогут получить доступ на своих Chromebook — они могут запретить учащимся копировать и вставлять текст с определённых сайтов, где используются генеративные инструменты искусственного интеллекта, которые могут помочь учащимся обмануть тесты. Также пользователям станет проще отключить камеру или микрофон независимо от того, где они находятся в Chrome OS.

Функция чтения PDF-файлов вслух в основном предназначена для образовательных заведений, где учащимся с проблемами зрения будет легче читать отсканированные учебные материалы или необходимые исследовательские статьи. Тем не менее, это также сделает интернет более доступным для широкой публики. Веб-сайты нередко помещают условия обслуживания или другую важную информацию в PDF-файлы без текстового слоя. Обновление сделает эту информацию доступной для большего числа пользователей.

Google научила ИИ читать сложный почерк врачей

С проблемой чтения сделанных врачами записей сталкиваются многие пациенты. В помощь им компания Google разработала программное решение для автоматической расшифровки медицинских документов.

 Источник изображения: Google

Источник изображения: Google

Непостижимо сложную каллиграфию медицинских работников помогли разобрать алгоритмы искусственного интеллекта. Техногигант сообщил на конференции в Индии, что работает с фармацевтами — именно они помогли раскрыть секреты письменности докторов.

Функция должна появиться в сервисе Google Lens. Она позволит пользователям либо распознать написанное с помощью камеры смартфона, либо загрузить из памяти готовый файл с рукописным текстом. После обработки текста приложение позволяет распознать лекарства, упомянутые в рецепте. Компания не сообщила, когда планирует сделать функцию общедоступной. Стоит отметить, что т.н. «почерк врачей», продемонстрированный на фото выше, — весьма безобидная версия, которую можно разобрать и без помощи ИИ.

Помимо Google, разработки в сфере нейронных сетей и искусственного интеллекта ведут многие другие компании, осознающие тот факт, что без поиска новых перспективных направлений преуспеть и занять лидирующие позиции на современном IT-рынке не то чтобы проблематично, а попросту невозможно.


window-new
Soft
Hard
Тренды 🔥
Заждались: продажи S.T.A.L.K.E.R. 2: Heart of Chornobyl за два дня после релиза превысили миллион копий 12 мин.
YouTube добавил в Shorts функцию Dream Screen — ИИ-генератор фонов для роликов 2 ч.
ПК с ИИ снижают производительность труда пользователей — люди не умеют правильно общаться с ИИ 3 ч.
Разработчики Path of Exile 2 раскрыли, чего ждать от раннего доступа — геймплей, подробности и предзаказ в российском Steam 4 ч.
Приключение Hela про храброго мышонка в открытом мире получит кооператив на четверых — геймплейный трейлер новой игры от экс-разработчиков Unravel 6 ч.
OpenAI случайно удалила потенциальные улики по иску об авторских правах 6 ч.
Скрытые возможности Microsoft Bing Wallpaper напугали пользователей 7 ч.
В WhatsApp появилась расшифровка голосовых сообщений — она бесплатна и поддерживает русский язык 8 ч.
Новая игра создателей The Invincible отправит в сердце ада выживать и спасать жизни — первый трейлер и подробности Dante’s Ring 9 ч.
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 10 ч.
TSMC начнёт выпускать 1,6-нм чипы через два года 25 мин.
Представлен 80-долларовый смартфон Tecno Pop 9 — с Helio G50 и батареей на 5000 мА·ч 27 мин.
Россия и США активно обсуждают, как будут топить МКС 2 ч.
Magssory Fold 3 в 1 — компактная и функциональная беспроводная зарядная станция для Apple, Samsung и не только 4 ч.
Nokia подписала пятилетнее соглашение о поддержке ЦОД Microsoft Azure с миграцией с 100GbE на 400GbE 4 ч.
Давно упавший на Землю кусочек Марса пролил свет на историю воды на Красной планете 4 ч.
TeamGroup представила SSD T-Force GA Pro на чипе InnoGrit — PCIe 5.0, до 2 Тбайт и до 10 000 Мбайт/с 5 ч.
Провалился крупнейший проект по производству электромобильных батарей в Европе — Northvolt объявила о банкротстве 5 ч.
«Уэбб» открыл в ранней Вселенной три огромные галактики — учёные не понимают, почему они так быстро сформировались 5 ч.
В Зеленограде начнут выпускать чипы для SIM-карт и паспортов — на этом планируется заработать триллионы рублей 5 ч.