Сегодня 23 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → субтитры

Apple представила ИИ-функции для инвалидов — включая управление коляской взглядом

Apple объявила об улучшении эффективности многих функций доступности в своих продуктах. Доработкам подверглись такие инструменты, как VoiceOver, «Лупа», голосовое управление и программа для чтения с ограниченными возможностями. Владельцы инвалидных колясок с электроприводом смогут управлять ими взглядом при помощи гарнитуры Vision Pro. Компания заверила, что добавление перечисленных возможностей ИИ не пошло в ущерб конфиденциальности пользователей.

По словам старшего директора Apple по глобальной политике и инициативам в области доступности Сары Херрлингер (Sarah Herrlinger), компания «предлагает новые, интуитивно понятные варианты ввода, исследования и персонализации, разработанные для защиты конфиденциальности пользователей на каждом этапе».

VoiceOver и «Лупа» помогают пользователям с нарушениями зрения понимать как информацию на экране, так и окружающую обстановку. Функция Image Explorer в VoiceOver использует Apple Intelligence для предоставления более подробных описаний изображений по всей системе, включая фотографии, отсканированные счета, личные записи и другой визуальный контент.

Благодаря обновлениям функции Live Recognition, пользователи VoiceOver могут нажать кнопку Action на iPhone, чтобы быстро задать вопрос о том, что находится в видоискателе камеры, и получить подробный ответ. «Лупа» теперь также работает с кнопкой Action, поэтому пользователи могут быстро задавать вопросы и получать ответы.

 Источник изображений: unsplash.com

Источник изображений: unsplash.com

Управлять самим приложением можно с помощью голосовых команд, таких как «увеличить» или «включить фонарик». Раньше голосовое управление требовало от пользователей запоминания точных слов и фраз. Apple заявляет, что благодаря ИИ эта функция теперь позволяет использовать естественный язык. Возможность «говорить то, что вы видите» подходит для навигации по любому приложению, включая программные продукты с визуальной структурой, такие как Apple Maps или «Файлы», используя интуитивно понятный язык.

«Чтение для людей с ограниченными возможностями» — это персонализированный режим чтения для пользователей с широким спектром нарушений, от дислексии до слабого зрения. Функция теперь работает с более сложными исходными материалами, такими как научные статьи, обрабатывая текст с несколькими столбцами, изображениями и таблицами. Краткие обзоры по запросу позволяют читателям получить общее представление о статье, прежде чем углубляться в детали.

Благодаря новой встроенной функции перевода пользователи могут читать текст на своём родном языке, сохраняя при этом оригинальные форматирование, шрифт и цвета. Любое видео можно дополнить субтитрами, сгенерированными ИИ. Субтитры создаются непосредственно на устройстве для сохранения конфиденциальности.

Не все пользователи инвалидных кресел с электроприводом обладают достаточной подвижностью для использования джойстика. Теперь они смогут использовать управление взглядом при помощи гарнитуры Vision Pro. Отслеживание взгляда не требует частой перекалибровки и работает в различных условиях освещения.

 Источник изображения: The Verge

На начальном этапе эта возможность будет доступна в США с системами привода колясок Tolt и LUCI, с поддержкой как Bluetooth, так и проводного подключения. В дальнейшем Apple пообещала добавить поддержку других моделей инвалидных колясок.

 Источник изображений: unsplash.com

Apple перечислила ещё ряд дополнительных улучшений доступности:

  • Функция распознавания движений в автомобиле (Vehicle Motion Cues) появится в visionOS, что поможет уменьшить укачивание у людей, использующих Apple Vision Pro в качестве пассажира в движущемся транспортном средстве.
  • Vision Pro будет поддерживать жесты лица для выполнения касаний и системных действий, а также новый способ выбора элементов глазами при использовании функции Dwell Control.
  • Функция Touch Accommodations предоставляет новый способ персонализации настроек в iOS и iPadOS.
  • Слуховые аппараты Made for iPhone будут более надёжно сопрягаться и переключаться между устройствами Apple, будет улучшен процесс настройки в iOS, iPadOS, macOS и visionOS.
  • В tvOS появится поддержка увеличенного текста, поэтому пользователи с ослабленным зрением смогут увеличить размер текста на экране для удобства чтения.
  • Функция распознавания имён (Name Recognition), которая может уведомлять глухих или слабослышащих пользователей, если кто-то произносит их имя, теперь работает более чем на 50 языках мира.
  • Для разработчиков приложений перевода языка жестов новый API позволяет добавлять переводчика к текущему видеозвонку FaceTime.
  • Пользователи, испытывающие трудности с использованием традиционных контроллеров, могут подключить контроллер Sony Access к устройствам iOS, iPadOS и macOS. Можно настроить джойстик, девять встроенных кнопок и до четырёх дополнительных внешних кнопок или специальных переключателей для персонализации расположения элементов управления. Также можно объединить два контроллера для индивидуальной настройки игрового процесса.

«Подход Apple к доступности не похож ни на один другой, — заявил генеральный директор Apple Тим Кук (Tim Cook). — Теперь, с Apple Intelligence, мы внедряем новые мощные возможности в наши функции доступности, сохраняя при этом нашу основополагающую приверженность принципу конфиденциальности на этапе проектирования».

Adobe Premiere Pro теперь может находить видеоклипы по словесному описанию

Adobe обновила функцию поиска материалов в Premiere Pro, добавив инструменты визуального распознавания на основе ИИ. Теперь для поиска нужного видеоклипа из подборки достаточно словами описать его содержание. Это всего лишь одна из новых функций, повышающих удобство пользователей, создателей контента и видеоредакторов, которые Adobe добавляет в Premiere Pro, After Effects и Frame.io.

 Источник изображения: Adobe

Источник изображения: Adobe

Поисковый запрос на естественном языке может выглядеть как «человек на коньках с бликом на объективе» или «счастливый рыбак, поймавший огромного сома». Adobe уверяет, что ИИ может автоматически распознавать «объекты, местоположения, углы обзора камеры и многое другое» наряду с произнесёнными словами, правда, при условии, что к видео прикреплена расшифровка.

Новый инструмент поиска не распознаёт звук в видеоклипе и не идентифицирует конкретных людей, но может просматривать любые метаданные, прикреплённые к видеофайлам, что позволяет извлекать клипы на основе дат съёмки, местоположения и модели камеры. Анализ медиа выполняется на устройстве и не требует подключения к интернету. Adobe гарантирует, что видеоконтент пользователей не применяется для обучения каких-либо моделей ИИ.

Одновременно с обновлённым поиском Adobe запустила инструмент перевода субтитров, который на сегодняшний день поддерживает 17 языков. Для упрощения просмотра и редактирования сразу нескольких переводов в Premiere Pro можно открыть несколько дорожек субтитров одновременно. Панель поиска с поддержкой ИИ и перевод субтитров доступны с сегодняшнего дня в бета-версии Premiere Pro, которая доступна всем, у кого есть активная подписка Creative Cloud или Premiere Pro.

В Adobe After Effects появилась поддержка HDR и новая система кэширования, заметно ускоряющая предварительный просмотр или воспроизведение больших проектов. Теперь для повышения производительности используются как оперативная память, так и дисковый кэш ПК. Adobe утверждает, что это позволит старым компьютерам и ноутбукам воспроизводить крупные проекты без задержек «для кэширования или рендеринга». Новые возможности уже доступны в бета-версии After Effects.

Frame.io Camera to Cloud теперь поддерживает интеграцию с камерами Canon C80 и C400, что позволяет автоматически загружать файлы в приложение непосредственно с камеры. Для использования этой возможности владельцам камер необходимо обновить их прошивки до актуальной версии, выпущенной в декабре 2024 года.

Apple и другие без разрешения обучали ИИ-модели на роликах YouTube

Несколько технологических гигантов, включая Apple, Anthropic, Nvidia и Salesforce, обучали свои модели искусственного интеллекта на видео с YouTube без согласия владеющей платформой компании Google и авторов этих видео, показало журналистское расследование Proof News.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Предполагаемым нарушителем авторских прав оказалась некоммерческая организация EleutherAI, которая, по её собственному утверждению, помогает разработчикам в обучении моделей ИИ. Её целевой аудиторией является не технологические гиганты, а небольшие разработчики и учёные. EleutherAI выпустила массив данных Pile, значительная часть которого доступна и открыта для любого желающего в интернете — потребуются лишь ресурсы для их скачивания, хранения и обработки.

В массив данных Pile оказались включены субтитры 173 536 видеороликов YouTube, которые были скачаны с более чем 48 000 каналов — файлы субтитров фактически являются расшифровками видеозаписей, а правила платформы YouTube запрещают скачивать её материалы без разрешения. Тем не менее, Apple, Nvidia и Salesforce — компании с капитализацией в сотни миллиардов и триллионы долларов — сами признавались в своих научных работах, что пользовались Pile при обучении ИИ. Apple, в частности, использовала Pile в обучении представленных в апреле моделей OpenELM, а уже в июне рассказала о новых функциях ИИ, которые появятся на iPhone и Mac.

Если в ходе данного инцидента действительно было допущено нарушение авторского права, то сделала это в первую очередь некоммерческая организация EleutherAI, а технологические гиганты могли оказаться добросовестными пользователями общедоступного набора данных. Данный пример в очередной раз показывает, что сфера обучения ИИ до сих пор недостаточно отлажена с юридической позиции.


window-new
Soft
Hard
Тренды 🔥
Новая статья: INDUSTRIA 2 — черновая отделка. Рецензия 23 мин.
«Горькое разочарование»: амбициозная пошаговая тактика Warhammer 40,000: Mechanicus 2 стартовала в Steam со «смешанными» отзывами 3 ч.
Ролевой шутер Witchfire от экс-разработчиков Painkiller и Bulletstorm скоро получит перевод на русский — подробности The Revelations Update 5 ч.
«Болотный лагерь выглядит великолепно»: 20 минут нового геймплея ремейка «Готики» впечатлили фанатов оригинальной игры 6 ч.
Cisco выяснила, почему безупречные на первый взгляд отчёты ИИ о киберинцидентах нельзя принимать на веру 6 ч.
Заряженное ностальгией и ужасами приключение Midnight Souls отправит искать любовь и бороться со стариками 7 ч.
Google назвала лучшие ИИ-модели для разработки Android-приложений — Gemini проиграл GPT 7 ч.
Сегодня исполнилось 16 лет первой покупке за биткоины — две пиццы теперь стоили бы $770 млн 10 ч.
Microsoft разрешит убирать раздражающую кнопку ИИ-помощника Copilot в Word, Excel и PowerPoint 11 ч.
Новый большой патч для Crimson Desert добавил детёнышей виверн и позволил Клиффу использовать дробовик 11 ч.
Tesla Cybercab оказался самым экономичным электромобилем в США, опередив соперников почти на треть 2 ч.
Китайские контрактные производители чипов начали поднимать цены на услуги, чтобы урвать свой кусок ИИ-пирога 2 ч.
Huawei придумала, как выпускать SSD на 122 Тбайт без передовой флеш-памяти 4 ч.
Создан материал для «неисчерпаемой фляги» — он сам добывает воду из воздуха, пока светит Солнце 4 ч.
Huawei выпустила 122-Тбайт SSD с фирменной технологией DoB 4 ч.
Tesla отзывает тысячи электромобилей Model Y из-за вероятного отсутствия одной наклейки 6 ч.
Realme представила смарт-часы Watch S5 с 1,43-дюймовым AMOLED и автономностью до 20 дней за $80 7 ч.
Bosch поможет стартапу Humanoid выпускать человекоподобных роботов на ногах и колёсах 8 ч.
Creative представила звуковую карту Sound Blaster AE-X с поддержкой 32-битного звука на 384 кГц 8 ч.
Sparkle выпустила тонкую видеокарту Arc Pro B50 Blower с «турбиной» для рабочих станций 8 ч.