Сегодня 25 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Amazon усилила голосового помощника Alexa генеративным ИИ — это поможет лучше понимать людей

Amazon подключила к своему голосовому помощнику Alexa одноимённую большую языковую модель, обученную с прицелом на управление умным домом. Это поможет ассистенту лучше понимать разговорные фразы, эффективнее интерпретировать контекст и производить несколько операций по одной команде. Но в перспективе некоторые функции Alexa могут стать платными.

 Источник изображений: aboutamazon.com

Источник изображений: aboutamazon.com

Большая языковая модель Alexa LLM в корне отличается от платформ, лежащих в основе чат-ботов Bard и ChatGPT, — она оптимизирована для работы в формате голосового помощника и управления умным домом, рассказал ресурсу The Verge старший вице-президент Amazon по устройствам и сервисам Дейв Лимп (Dave Limp). Потребность в кардинальных переменах на рынке голосовых помощников назрела уже давно: десять лет назад, когда они только появились, на них возлагались большие надежды, но за прошедшее время инноваций здесь почти не было, а улучшения носили скорее эволюционный, очень неспешный характер. Шансом на прорыв здесь может оказаться генеративный искусственный интеллект.

После выхода ChatGPT техногиганты Microsoft и Google ринулись внедрять генеративный ИИ в большинство своих сервисов и успели наделать ошибок, поэтому в Amazon решили действовать с осторожностью. Учитывая, что Alexa LLM решили подключить напрямую к умному дому, для компании было важно свести на минимум инциденты с галлюцинациями ИИ. Внедряться он будет постепенно в рамках предварительной программы на протяжении нескольких месяцев и только для американских пользователей. Заявку можно подать прямо через голосового помощника, отдав ему команду: «Алекса, давай поболтаем! (Alexa, let’s chat)».

Учитывая расширенные возможности, которые обещает генеративный ИИ голосовому помощнику, платформа не сможет оставаться бесплатной всегда. В своём теперешнем виде, уточнил господин Лимп, она так и будет бесплатной, но «сверхчеловеческий» голосовой помощник, который сможет выполнять сложные задачи, станет платной услугой. На начальном этапе Alexa научится лучше понимать, что ему говорит пользователь, и перестанет требовать конкретики. Необходимость повторять слова или присваивать элементам умного дома уникальные названия — одна из наиболее распространённых причин недовольства голосовыми помощниками.

Пользователь сможет пожаловаться новой Alexa, что ему холодно, и та прибавит температуру на климатической системе. Получив команду «Алекса, освети эту комнату под Seahawk», ИИ выяснит, в какой цвет окрашивают вертолёт Seahawk, определит, в какой комнате находится владелец дома и сделает соответствующие запросы API. Большая языковая модель поддерживает более двухсот инструментов API умного дома — в сочетании с контекстом диалога с умной колонкой Echo и списком умных устройств это поможет эффективнее ими управлять. Установив дома новый источник освещения, можно будет отдать голосовому помощнику распоряжение включить «новый свет», и тот правильно интерпретирует команду.

Генеративный ИИ поможет Alexa интерпретировать последовательности команд в одной фразе — сценарии можно будет задавать без их настройки в приложении. Вице-президент Amazon Дейв Лимп привёл такой пример регулярного сценария, который он отдал обновлённому голосовому помощнику у себя дома: «Алекса, каждое утро в 8 часов включай свет и музыку в спальне ребёнка, чтобы он проснулся, а на кухне включай кофеварку». Подобные сценарии, несмотря на их сложность, сразу появляются в приложении в списке регулярных. На начальном этапе функция множественных команд будет работать лишь на части устройств умного дома, но в перспективе их набор расширится.

Когнитивными функциями Alexa смогут пользоваться и разработчики стороннего совместимого оборудования — для этого предусмотрены инструменты Dynamic Controller и Action Controller. Данные инструменты помогут им задавать команды, отсутствующие в базовом наборе голосового помощника. Dynamic Controller позволит, например, задавать предустановленные схемы освещения. Установив в помещении многоцветные лампы GE Cync, можно будет отдать команду «Алекса, сделай здесь жуткий вид», и система правильно её интерпретирует, не потребовав дополнительных манипуляций. А Action Controller поможет голосовому помощнику корректно отреагировать на замечание: «Алекса, пол грязный» — и в дело вступит робот-пылесос. Этими инструментами, рассказали в Amazon, уже заинтересовались компании GE Cync, Philips, GE Appliances, iRobot, Roborock и Xiaomi, а в перспективе к программе подключаются и другие разработчики.

Подключение большой языковой модели к Alexa — это лишь начало нового этапа развития голосового помощника. В компании хотят упростить пользователям повседневные задачи, а о дальнейших планах пока не говорят.

Toyota научила роботов готовить завтраки, просто показав, как это делать

В исследовательском институте Toyota (TRI) с помощью генеративного искусственного интеллекта обучили роботов некоторым навыкам приготовления завтрака. И это не потребовало сотен часов программирования и дальнейшей работы над ошибками и исправлением их. Вместо этого исследователи оснастили роботов специальными датчиками, обеспечивающими чувство осязания, подключили их к модели искусственного интеллекта, а затем показали системе, что нужно делать, пишет The Verge.

 Источник изображения: Toyota Research Institute

Источник изображения: Toyota Research Institute

Исследователи отметили, что осязание является «одним из ключевых факторов» в обучении. Благодаря осязанию робот может «чувствовать», что он делает, получая больше информации. Это облегчает выполнение сложных задач по сравнению с использованием только одних камер.

По словам сотрудника лаборатории TRI Бена Берчфилда (Ben Burchfiel), «интересно видеть, как они (роботы) взаимодействуют с окружающей средой». Сначала «учитель» демонстрирует набор навыков, а затем «в течение нескольких часов» модель учится в фоновом режиме. «Мы обычно обучаем робота днём, позволяем ему учиться всю ночь, а на следующее утро приступаем к новому рабочему поведению», — пояснил Берчфилд.

Исследователи рассказали, что они пытаются создать так называемые «большие модели поведения» (Large Behavior Models, LBM). Подобно тому, как большие языковые модели (LLM) обучаются, отмечая закономерности в тексте, модели LBM Toyota учатся путём наблюдения, а затем «обобщают, применяя новый навык, которому их никогда не учили», говорит Расс Тедрейк (Russ Tedrake), профессор робототехники Массачусетского технологического института и вице-президент по исследованиям в области робототехники TRI. Используя этот метод, исследователи научили роботов более чем 60 сложным навыкам, таким как «разлив жидкостей, использование инструментов и манипулирование деформируемыми объектами». Исследователи TRI планируют обучить роботов к концу 2024 года до 1000 навыков.

В аналогичном направлении работает Google, создавшая ИИ-модель RT-2 (Robotics Transformer 2) класса «зрение-язык-действие» (Vision-Language-Action — VLA). Подобно разработке Toyota, роботы на базе RT-2 используют полученный опыт, чтобы делать выводы, как действовать. Теоретически, роботы, обученные искусственным интеллектом, смогут в конечном итоге выполнять задачи практически без каких-либо инструкций, кроме общих указаний, которые обычно дают человеку, например, «очистить пол от пятна».

Как отметила The New York Times, такого рода работа (создание модели подобной RT) обычно «медленная и трудоёмкая», и предоставить достаточное количество обучающих данных гораздо сложнее, чем просто передать в модель ИИ массу данных, которые можно скачать из интернета.

ИИ-помощник программиста GitHub Copilot Chat стал доступен для всех пользователей

GitHub, принадлежащий корпорации Microsoft, расширил доступ к своему ИИ-помощнику для программистов — Copilot Chat. Теперь инструмент доступен не только командам разработчиков, но и рядовым пользователям. С помощью Copilot Chat можно обучаться новым языкам программирования, решать технические проблемы и получать ответы на вопросы по программированию, не покидая интегрированных сред разработки Visual Studio и Visual Studio Code.

 Источник изображений: GitHub

Источник изображений: GitHub

Copilot Chat — это ИИ-помощник, отвечающий на вопросы программиста, касающиеся написания кода. Впервые сервис был представлен в июле в публичной бета-версии для бизнес-пользователей. Теперь он стал доступен рядовым пользователям, помогая им не только находить ошибки в коде, но и обучаться новым языкам программирования и фреймворкам, отвечая на вопросы в простой и понятной форме.

 Источник изображений: github.blog

Для того чтобы воспользоваться новым инструментом, потребуется оформить подписку. GitHub предлагает индивидуальную подписку стоимостью $10 в месяц или $100 в год.

Рынок чат-ботов для программистов продолжает расти благодаря и другим компаниям, вроде Google и Amazon, которые предлагают пользователям собственные ИИ-сервисы. Google представил своего помощника для разработчиков на Android в мае на конференции Google I/O, а Amazon разработал инструмент под названием CodeWhisperer.

Расширение доступа к Copilot Chat подчёркивает растущее влияние ИИ в сфере разработки ПО. Инструмент не просто облегчает процесс создания кода, но и открывает новые горизонты для обучения и совершенствования навыков программистов различного уровня. В будущем можно ожидать, что подобные решения станут неотъемлемой частью арсенала каждого разработчика, способствуя повышению эффективности и качества работы в этой области.

Microsoft завтра расскажет о своём видении будущего ИИ в Windows и других областях

Уже завтра Microsoft планирует провести мероприятие, на котором расскажет о своём «видении будущего» в области интеграции искусственного интеллекта в Windows, службы Microsoft 365, устройства Surface и многие другие продукты. Об этом пишет The Verge со ссылкой на внутренний документ Microsoft.

Опорной точкой назначенного на завтра «специального мероприятия» станет партнёрство Microsoft с OpenAI, и оно является «лишь началом» видения основных продуктов компании на основе ИИ, гласит документ за авторством главы отдела потребительского маркетинга Microsoft Юсуфа Мехди (Yusuf Mehdi). «Мы внедрили эту невероятную технологию в Edge и Bing, Microsoft 365 и, конечно, Windows Copilot — всё от новых ПК под Windows от Surface до наших дорогих OEM-партнёров. В четверг на нашем мероприятии в Нью-Йорке мы поделимся следующим шагом по продолжению этой работы и развитию лидерства в эту захватывающую новую эпоху», — написал топ-менеджер.

Ключевая роль в новой стратегии отводится подразделению Microsoft Surface — компания, гласит документ, хочет в корне изменить то, «как работают устройства и системы». Microsoft поделилась своими планами с некоторыми партнёрами, и те встретили их «с огромным энтузиазмом». По одной из версий, на мероприятии будет представлен Surface Laptop Studio 2, оборудованный NPU — ИИ-сопроцессором собственной разработки Microsoft, ускоряющим обработку алгоритмов искусственного интеллекта; а стратегический план заключается в том, чтобы OEM-производители наладили выпуск ноутбуков с этим ИИ-ускорителем.

Своё обращение к сотрудникам Microsoft Юсуф Мехди заканчивает призывом сплотиться после отставки главы направлений Windows и Surface Паноса Паная (Panos Panay): для достижения поставленных в области ИИ целей компании потребуется тесное сотрудничество различных подразделений.

Российская Just AI запустила свой аналог ChatGPT

Российская компания Just AI запустила инструмент генеративного ИИ для бизнеса Jay CoPilot, созданный на основе собственной большой языковой модели (LLM) JustGPT. Он включает сервисы, представленные в виде веб-приложений, позволяющих решать конкретные бизнес-задачи, рассказали Forbes в компании. Тем самым Just AI присоединилась к «Яндексу» и «Сберу», запустившим в этом году свои ИИ-инструменты — YandexGPT и GigaChat соответственно.

 Источник изображения: Pixabay

Источник изображения: Pixabay

«В основе приложений лежат как лучшие мировые нейросетевые модели, так и собственная разработка Just AI — большая языковая модель JustGPT», — пояснили в Just AI, отметив, что генеративный ИИ Jay CoPilot уже применяется в пилотных проектах «в двух лидирующих частных российских банках», а с 20 сентября открыта программа раннего доступа к ИИ-инструменту для компаний и разработчиков.

Помимо режима диалога, компания создала для Just AI приложения для автоматизации различных задач, будь то: подготовка протоколов встреч, поиск по массивам информации, резюмирование, редактирование и генерация текста, расшифровка аудиозаписей, озвучка текстов в разных форматах разными голосами и на нескольких языках, генерация изображений и т.д. «"Джей" также упрощает работу с различными форматами документов — боту можно отправить ссылку на сайт или файл (txt, docx, pdf, аудио), чтобы перевести текст на другой язык, получить краткое изложение содержания или воспользоваться другими функциями», — рассказали в Just AI.

По словам представителя компании, в отличие от ChatGPT, «Джей» работает с разными модальностями — речь, аудио, текст, изображения. Бот также умеет искать информацию в интернете и имеет API для интеграции непосредственно с информационными системами организаций и рабочими местами сотрудников.

На проведение научно-исследовательских работ, создание продукта и развёртывание соответствующей IT-инфраструктуры компания израсходовала около 90 млн рублей. Разработчики уже определились, как будет происходить монетизация продукта. «При регистрации у каждого пользователя есть определённое количество токенов на счету, пробный период. После того как он их израсходует, он может пополнить баланс, купив подписку или определённое количество токенов», — пояснили в компании, добавив, что такой подход распространяется как на корпоративных пользователей, так и на индивидуальных.

В Just AI рассказали, что Jay CoPilot работает на базе собственной LLM JustGPT, основанной на open-source модели LLaMA-2. Модель была дообучена на собранном Just AI инструктивном датасете и содержит 70 млрд параметров. На основное дообучение потребовалось 12 дней, для чего использовался кластер из восьми ускорителей Tesla A100, а для вспомогательных задач задействовали собственный GPU-кластер Just AI. Дообучение позволило существенно улучшить возможности модели в понимании русскоязычных инструкций и добавить ряд особых полезных функций. «Мы уже на реальных примерах видим, насколько сильно может вырасти продуктивность личной работы людей и эффективность отдельных бизнес-процессов», — говорит сооснователь Just AI Кирилл Петров.

Руководитель Института AIRI и профессор Сколтеха Иван Оселедец заявил, что появление в России новых ИИ-продуктов на базе предобученных LLM закономерно отражает активное развитие отечественных технологий. В то же время он отметил, что исходя из открытых технических характеристик, JustGPT, в отличие от GigaChat и YandexGPT, «это не совсем собственная языковая модель компании, а дообученная под практические задачи русскоязычной аудитории открытая модель Llama2, которая легла в основу продукта».

Рынок генеративного ИИ активно развивается. По оценкам аналитиков Bloomberg Intelligence, его объём может увеличиться к 2032 году до $1,3 трлн, что в 32 раза больше дохода, который рынок принёс в 2022 году, когда прибыль составила $40 млрд. Аналитики ожидают взрывной рост в секторе генеративного ИИ в течение 10 лет, способный коренным образом изменить методы работы технологического сектора.

В России рынок искусственного интеллекта за 2022 год составил 650 млрд рублей, что на 17 % больше, чем в 2021-м, сообщил директор направления «Цифровая трансформация отраслей» АНО «Цифровая экономика» Алексей Сидорюк на конференции Innopolis AI Conference for business. По оценкам Statista, в этом году объём рынка генеративного ИИ в России может превысить $311 млн и достичь $1,479 млрд в 2030-м.

«Тинькофф» натравит «боевых роботов» на телефонных мошенников

Телефонный секретарь «Защитник Олег», разработанный специалистами банка «Тинькофф», обучился новому навыку — теперь он отвлекает телефонных мошенников при помощи «боевых роботов», которые имитируют разговор с реальным человеком.

 Источник изображения: «Тинькофф»

Источник изображения: «Тинькофф»

Когда пользователю «Олега» поступает звонок с номера, предположительно принадлежащего телефонному мошеннику, платформа подключает один из сценариев «фабрики роботов». Среди них указываются, например, «пожилой мужчина, который во время разговора ищет свои очки, чтобы лучше слышать» и «молодая мама, которая пытается справиться с активным ребёнком на детской площадке». Роботы обучены реагировать на ключевые фразы, которые могут произносить мошенники, а также сомневаться в правдивости слов собеседников, задавать дополнительные вопросы или делать вид, что отвлеклись на какие-то события.

Чтобы реализовать эту функцию, в банке «Тинькофф» построили модель искусственного интеллекта, которая была обучена на 40 тыс. минут записей разговоров с настоящими мошенниками — выделены фразы, которые служат для мошенников триггерами и побуждают их продолжать разговор. При участии психологов были созданы уникальные персонажи, каждому из которых присвоили собственный характер и внедрили приёмы, направленные на удержание мошенника на линии. А чем дольше преступник будет оставаться на линии, тем меньше людей он сможет обзвонить.

Пилотный проект «фабрики роботов» действует с февраля — в банке «Тинькофф» уверены, что этот метод поможет сократить число телефонных мошенничеств. Сейчас новый навык «Олега» доступен 500 тыс. пользователям. В ближайший месяц подключить защитную систему смогут все пользователи голосового ассистента «Олег» — для этого не требуется определённый мобильный оператор или статус клиента экосистемы «Тинькофф». Подключить «Олега» можно через приложения банка «Тинькофф» и мобильного оператора «Тинькофф Мобайл», а также через Telegram-бота @OlegOtvetBot. Записанный ботом входящий вызов придет в чат «Защитника Олега», а расшифровка и аудиозапись перехваченного звонка будет доступна в Telegram или мобильном приложении Тинькофф.

В записи реплик роботов принимали участие сотрудники «Тинькофф», а также профессиональный диктор Петр Гланц и актриса Дарья Блохина. Кроме того «Тинькофф» открыл сбор сценариев и реплик для «фабрики роботов», чтобы вместе с пользователями создать целую армию максимально реалистичных персонажей для борьбы с телефонными мошенниками. Для участия необходимо написать команду «Олег, вот как нейтрализовать мошенника», нажать на значок микрофона в правом нижнем углу и наговорить свое предложение в свободной форме. Лучшие и самые реалистичные сценарии будут обработаны командой «Защитника Олега» и начнут защищать людей от мошенников.

TikTok ввёл маркировку для контента, созданного с помощью ИИ

Платформа для создания коротких видеороликов TikTok объявила о запуске новой функциональности, которая позволит авторам явно указывать, что их контент был создан с помощью ИИ. Это нововведение было впервые замечено пользователями ещё в прошлом месяце. Инициатива направлена на повышение прозрачности и честности при создании контента.

 Источник изображения: TikTok

Источник изображения: TikTok

Согласно новым правилам, создатели контента обязаны раскрывать информацию о том, создавался ли материал с использованием ИИ. При создании видео или фото появится напоминание о необходимости включить функцию маркировки. Метка «AI» будет размещаться под именем пользователя в нижнем левом углу видеоролика. Компания подчеркнула, что немаркированный ИИ-контент может быть удалён.

В ближайшее время TikTok планирует начать тестирование автоматической маркировки всего ИИ-контента. Это станет частью стремления компании обеспечить прозрачность и предотвратить распространение поддельного контента, который уже успел набрать миллионы просмотров благодаря использованию программ для клонирования голоса, создания фейковых песен и видео с участием звёзд.

Кроме того, TikTok обязал создателей фильтров и эффектов переименовать инструменты, работающие на основе ИИ, добавив в их название аббревиатуру «AI». Так, например, фильтр для лица Bold Glamour, появившийся в TikTok в марте, пройдёт процедуру переименования.

TikTok стремится создать среду, где пользователи смогут с полной уверенностью отличить настоящий контент от созданного ИИ. Это поможет предотвратить распространение дезинформации и поддержит доверие аудитории к платформе.

ИИ-бот Bard теперь будет искать ответы на вопросы в вашем Gmail, «Диске» и других сервисах Google

Чат-бот Bard компании Google теперь сможет получать информацию для своих ответов пользователям не только в интернете, но и в их электронной почте Gmail, а также других сервисах, которые те ежедневно используют, включая Google Docs, Google Drive, Google Maps, YouTube и Google Flights. Об этом компания сообщила в своём блоге.

 Источник изображения: blog.google

Источник изображения: blog.google

Благодаря интеграции Bard с этими сервисами пользователь сможет попросить ИИ-чат-бот выполнить такие действия, как поиск и обобщение содержимого электронного письма или выделить наиболее важные моменты документа, который он сохранил в Google Drive.

Как отметил ресурс The Verge, интеграции Bard с инструментами Google, получившими название Bard Extensions, могут избавить пользователя от необходимости просматривать горы электронных писем или документов в поисках определённой информации. При этом можно попросить Bard предоставить информацию, например, в виде диаграммы или создать маркированный список. На данный момент функция доступна только на английском языке.

В связи с предоставлением Bard доступа к личной электронной почте и документам пользователей возникают опасения по поводу обеспечения конфиденциальности данных и возможного их использования компанией в своих целях. Google заявила, что не будет использовать эту информацию для обучения публичной модели Bard, и что она не будет видна сотрудникам, проверяющим её. Запустить интеграцию Bard с Gmail, Google Docs и Google Drive можно будет только при получении согласия пользователя, который может отключить её в любой момент.

«Причина, по которой мы начинаем этот эксперимент, в первую очередь заключается в том, что впервые продукт языковой модели действительно интегрируется с вашими личными данными, — сообщил ресурсу The Verge руководитель проекта Bard Джек Кравчик (Jack Krawczyk). — Мы хотим убедиться, что понимаем это правильно». Он добавил, что Google планирует расширить интеграцию Bard на большее количество продуктов Google, а также партнёров компании.

Google также добавила возможность проверки ответов Bard с помощью кнопки «Google It». Теперь, нажав на неё, можно узнать, подтверждает поиск Google информацию ИИ-чат-бота или нет. Проверенная поиском информация будет выделена зелёным цветом, а все непроверенные ответы — оранжевым. Пользователь может навести курсор мыши на выделенные предложения, чтобы узнать больше о том, что Bard мог понять правильно или неправильно. Google также добавила возможность продолжить разговор с ИИ-чат-ботом по общей ссылке, что позволяет пользователю расширить вопрос, который кто-то уже задавал ранее.

Великобритания предложила 7 принципов регулирования ИИ — ответственность, прозрачность и прочие

Власти Великобритании представили 7 принципов регулирования искусственного интеллекта, которыми должны руководствоваться компании, занимающиеся разработкой ИИ-систем. Управление по конкуренции и рынкам (CMA) настаивает на введении ответственности за результаты работы ИИ, обеспечение доступа к ключевым ресурсам, а также на прозрачности рисков и ограничений, связанных с контентом, созданным генеративным ИИ. Инициатива направлена на стимулирование конкуренции и инноваций, предотвращение монополизации рынка и защиту потребителей.

 Источник изображения: herbinisaac / Pixabay

Источник изображения: herbinisaac / Pixabay

Регулятор разработал принципы после первичного обзора текущего состояния отрасли и планирует обсудить их с общественными и потребительскими группами, а также с академическим сообществом:

  • Ответственность: разработчики ИИ-моделей несут ответственность за информацию, предоставляемую потребителям;
  • Доступность: непрерывный доступ к ключевым ресурсам без необоснованных ограничений;
  • Разнообразие: поддержание разнообразия бизнес-моделей, включая как открытые, так и закрытые системы;
  • Выбор: предоставление бизнесу выбора для определения способов использования ИИ-моделей;
  • Гибкость: возможность переключения между различными ИИ-моделями или одновременного использования нескольких из них в зависимости от потребностей;
  • Добросовестность: отсутствие антиконкурентного поведения, навязывания продуктов и услуг;
  • Прозрачность: предоставление потребителям и бизнесу информации о рисках и ограничениях контента, созданного с помощью ИИ-моделей, для осуществления осознанного выбора.

Основное внимание СМА уделило так называемым основным ИИ-моделям, которые лежат в основе многих генеративных ИИ-систем, включая продукты компаний OpenAI, Google, Meta, Microsoft и других. Среди ключевых аспектов, на которые следует обратить внимание обеспечение ответственности за выходные данные ИИ и гарантия доступа к ключевым ресурсам, под которыми, вероятно, также подразумеваются чипы и данные для обучения ИИ.

«Влияние основных ИИ-моделей может позволить большему числу компаний успешно конкурировать, возможно, бросив вызов текущим лидерам рынка», — отметило CMA в своём обзоре. Регулятор подчеркнул, что здоровая конкуренция и инновации могут способствовать экономическому росту благодаря росту производительности.

Инициатива CMA по регулированию ИИ возникла в важный момент, когда правительства по всему миру активно ищут способы контроля над развитием генеративного ИИ. Европейский Союз, Китай и США также работают над созданием собственных нормативных документов в этой области.

Следует отметить, что, несмотря на широкий спектр вопросов, связанных с регулированием ИИ, включая вопросы авторских прав и защиты данных, CMA сосредоточило внимание на конкуренции и защите потребителей, стремясь обеспечить благоприятные условия на текущем этапе развития новой технологии.

Apple привлекла искусственный интеллект к работе активного шумоподавления в AirPods Pro второго поколения

Одновременно с анонсом смартфонов семейства iPhone 15 компания Apple вывела на рынок беспроводные наушники AirPods Pro с портом USB-C на футляре, сохранив их прочие характеристики преимущественно неизменными по сравнению с прошлым годом. При этом программные нововведения в области технологий шумоподавления оказались существенными, как успели подтвердить первые очевидцы, и теперь данными функциями заведует искусственный интеллект.

 Источник изображения: Apple

Источник изображения: Apple

Речь, как отмечается в публикации CNBC, идёт о функциях Adaptive Audio и Conversational Awareness, которые ярче всего проявляют себя по сравнению с базовыми возможностями прошлогодних AirPods Pro второго поколения. Кстати, снабдить новыми функциями свои беспроводные наушники этой серии, купленные после сентября 2022 году, могут все владельцы, скачав программное обновление как для самих наушников, так и для смартфона. Имеется ещё и функция Personalized Volume, которая автоматически выставляет громкость звука в наушниках, базируясь на истории предпочтений пользователя.

Впрочем, два других нововведения заслуживают более пристального внимания. Опробовавший функцию Adaptive Audio новых AirPods Pro представитель ресурса CNBC признался, что она работает не всегда корректно, но позволяет повысить комфорт прослушивания музыки в городской среде. По сути, это активное шумоподавление с элементами искусственного интеллекта, который призван решать, какие звуки извне пользователю важно слышать, а какие нет.

На оживлённой городской улице, в частности, программное обеспечение Apple порой выделяет для допуска к ушам пользователя не те звуки, которые следовало бы, но в целом функция добавляет безопасности, поскольку снижается шанс не услышать сигнал находящихся по близости автомобилей. С другой стороны, объявления по громкоговорителю на железнодорожной станции не были слышны отчётливо, а это уже серьёзно снижает удобство работы с функцией при использовании общественного транспорта.

В офисной среде функция Conversation Awareness должна добавлять удобства при общении с коллегами, позволяя не вынимать наушники из ушей и не ставить музыку на паузу для короткого обмена репликами. Правда, на практике автоматическая остановка воспроизведения осуществляется преимущественно при начале разговора самим пользователем наушников, а не окружающими. Для тех, кто привык подпевать в такт музыке или периодически «разговаривать сам с собой», это может оказаться неудобной особенностью, ведь звук в наушниках в такие моменты будет прерываться. С другой стороны, в разгар корректно распознанной беседы система даже немного усиливает звук разговора, позволяя общаться с наушниками в ушах без потери информации. Опять же, если собеседник вступает в разговор первым, то его начальную фразу пользователь наушников AirPods Pro с высокой вероятностью либо не распознает, либо воспримет с искажениями. Удобно в новых алгоритмах и то, что автоматическое воспроизведение после завершения разговора возвращает громкость на существовавший уровень.

Amazon на этой неделе переосмыслит голосового ассистента Alexa, представив новые умные устройства

Ставка на интернет-торговлю в своё время позволила сделать основателя Amazon Джеффа Безоса (Jeff Bezos) одним из богатейших людей в мире, но не все принятые компанией решения обернулись долгосрочным успехом. Голосовой ассистент Alexa хоть и получил неплохое распространение, приносит Amazon серьёзные убытки, и направление умных устройств тоже развивается не так успешно, как хотелось бы. О реформах на этом направлении представители Amazon расскажут на этой неделе.

 Источник изображения: Chloe Collyer, Bloomberg

Источник изображения: Chloe Collyer, Bloomberg

Как напоминает Bloomberg, в эту среду в США состоится презентация с участием прессы и представителей Amazon, которые в это время года традиционно представляют новые фирменные устройства. Гигант интернет-торговли уже анонсировал некоторые сокращения и оптимизацию на направлении фирменных устройств, но главным кадровым событием в этом году станет уход из Amazon Дэйва Лимпа (Dave Limp), который 13 лет подряд курировал направление Alexa и умных устройств. По сути, для Лимпа это будет последняя профильная презентация, после чего до конца года он передаст дела преемнику и свяжет своё будущее с чем-то, не имеющим отношения к потребительской электронике.

Голосовому ассистенту в наши дни для сохранения актуальности необходимо интегрироваться с системами искусственного интеллекта, и если верить имеющейся информации, Amazon ведёт работу в этом направлении. Специалисты, которые работали над устройствами с поддержкой Alexa, отчасти будут переведены на другие направления деятельности, связанные, например, с созданием магазинов без касс и продавцов. По данным анонимных представителей Amazon и отраслевых аналитиков, на этой неделе компания представит более сфокусированный набор умных устройств и сопутствующих программных технологий, который учитывает взятый ещё в прошлом году курс на оптимизацию профильного бизнеса. Интеграции голосового интерфейса и систем искусственного интеллекта будет уделяться особое внимание на презентации.

Arm считает, что со временем основная нагрузка по вычислениям в сфере ИИ ляжет на клиентские устройства

Наблюдаемая по итогам второго дня торгов акциями Arm коррекция их курса придала уверенности в своей правоте тем скептикам, которые сомневаются в способности компании добиться быстрого успеха за пределами рынка смартфонов. При этом представители самой Arm убеждены, что со временем именно центральные процессоры смартфонов и ноутбуков станут выполнять основные вычисления, связанные с искусственным интеллектом.

 Источник изображения: HP Inc.

Источник изображения: HP Inc.

Подобные оценки прозвучали из уст финансового директора Arm Джейсона Чайлда (Jason Child), как сообщает Barron’s. Сейчас в сегменте смартфонов компания получает до 45 % всей выручки, где она контролирует почти 99 % рынка. Вторым по величине источником выручки является растущий сегмент Интернета вещей, но удельный доход с единицы продукции в нём довольно скромен, а потому приличный оборот набирается только за счёт многочисленности компонентов, поставляемых для нужд этого рынка. В скором времени, как считает представитель Arm, по своим масштабам с рынком Интернета вещей для самой компании сможет начать соперничать сегмент процессоров для облачных систем. Автомобильный сегмент тоже будет расти динамично.

В прошлом фискальном году, который завершился в марте, компания получила лицензионные отчисления с более чем 30 млрд отгруженных клиентами процессоров с Arm-совместимой архитектурой. Это на 70 % больше, чем было отгружено в 2016 году. В среднем Arm получает по $0,06 с каждого реализованного процессора, но сумма будет расти по мере появления более сложных архитектур.

Конъюнктура рынка систем искусственного интеллекта тоже будет меняться, как считает финансовый директор Arm. Сейчас основные инвестиции направлены на построение языковых моделей и их обучение. Для этого нужны ускорители вычислений NVIDIA и прочих компаний, пытающихся составить ей конкуренцию. Со временем же, по мнению Чайлда, вычислительная нагрузка всё сильнее будет смещаться на устройства, способные делать логические выводы, и таковыми как раз станут смартфоны и ноутбуки, оснащаемые центральными процессорами с поддержкой специальных наборов команд.

Intel и AMD в сегменте персональных компьютеров, кстати, уже готовятся к работе в таких условиях, внедряя соответствующие наборы команд в новые поколения своих процессоров. HP Inc. и Dell о намерениях выпустить соответствующие модели ноутбуков тоже говорят вполне открыто. «Самое впечатляющее применение искусственного интеллекта будет заключаться в том, что вы снова полюбите свой ПК», — недавно признался операционный директор Dell Джефф Кларк (Jeff Clarke). Финансовый же директор Arm добавил, что компания ведёт переговоры с производителями ПК о разработке ноутбуков на базе Arm-совместимых процессоров, которые могли бы заменить собой предложения Intel и AMD.

ИИ создал Coca-Cola из 3000 года — напиток со вкусом будущего выпустили ограниченным тиражом

Coca-Cola выпустила ограниченную серию одноимённого напитка со вкусом, созданным с использованием ИИ. Новый вкус, получивший название Coca-Cola Y3000 Zero Sugar, призван продемонстрировать, каким может быть вкус колы в 3000 году. Чтобы угадать, каким будет вкус напитка через 977 лет, Coca-Cola использовала ИИ, чтобы «собирать идеи» и понять, «каким фанаты видят будущее через эмоции, стремления, цвета, вкусы и многое другое».

 Источник изображения: The Coca-Cola Company

Источник изображения: The Coca-Cola Company

«Мы надеемся, что Coca-Cola и в 3000 году будет такой же актуальной, как сегодня, поэтому мы поставили перед собой задачу изучить концепцию того, каким может быть вкус колы в будущем, и какие от него будут впечатления?», — пояснила Оана Влад (Oana Vlad), старший директор по глобальной стратегии компании Coca-Cola.

Как сообщается, ИИ также использовался для создания визуального оформления тары напитка, которое в конечном итоге воплотилось в композицию, «демонстрирующую жидкость в трансформирующемся, развивающемся состоянии, передаваемом через изменения формы и цвета, которые подчёркивают позитивное будущее».

Ограниченная серия Y3000 доступна в Соединённых Штатах, Канаде, Китае, Европе и Африке. Также в США доступна версия, основанная на вкусе напитка компании Coca-Cola 1886 года выпуска. Если взять бутылку кока-колы новой серии и отсканировать QR-код, то вы получите доступ к Центру творчества Coca-Cola (Coca-Cola Creations Hub), и ваши фотографии можно будет обработать в приложении Coca-Cola Y3000 AI Cam с помощью технологии Stable Diffusion, чтобы придать им футуристический вид. Coca-Cola также выпускает ограниченную серию одежды и аксессуаров совместно с Ambush, «вдохновлённую будущим».

В этом году Coca-Cola приняла участие ещё в нескольких совместных проектах с другими компаниями. В январе вышел смартфон Realme 10 Pro Coca-Cola Edition серией всего в 1000 экземпляров, созданный совместно с китайским производителем. А в июне Coca-Cola объединила усилия с Riot Games для создания игры Coke Zero, вдохновлённой League of Legends.

Google скоро выпустит огромную ИИ-систему Gemini — она станет ответом GPT-4 от OpenAI

В скором времени Google представит свой новый продукт в области ИИ — систему Gemini. Некоторые компании уже тестируют её раннюю версию. Согласно источникам, Gemini станет серьёзным конкурентом модели GPT-4 компании OpenAI. Google будет предлагать новинку через собственный облачный сервис Cloud Vertex AI, чтобы укрепить позиции на рынке ИИ.

 Источник изображения: TheDigitalArtist / Pixabay

Источник изображения: TheDigitalArtist / Pixabay

Gemini является коллекцией больших языковых моделей, которые могут управлять всем, начиная от чат-ботов и заканчивая функциями, способными генерировать текст и изображения в соответствии с запросами пользователей. Это может помочь в создании черновиков электронных писем, сочинении текстов песен или написании новостных статей. Кроме того, ожидается, что новый инструмент поможет программистам писать код, а художникам и дизайнерам поможет создавать оригинальные изображения.

В настоящее время разработчикам предоставлен доступ к довольно крупной версии Gemini, но не самой большой, которая была бы более сопоставима с возможностями GPT-4.

В прошлом месяце Google внедрила генеративный ИИ в поисковую систему Search Generative Experience для пользователей из Индии и Японии, которая предлагает развёрнутые текстовые и голосовые ответы на различные поисковые запросы. Кроме того, ИИ-инструменты компании стали доступны корпоративным клиентам по цене $30 в месяц за пользователя.

Ставки для Google высоки, учитывая текущее доминирование на рынке OpenAI с её моделью GPT-4. ИИ-система Gemini обещает открыть новые горизонты в области генеративных нейросетей и предложит широкой аудитории инструменты, которые могут значительно облегчить работу как обычных пользователей, так и профессионалов.

«Яндекс Браузер» научился создавать субтитры для русскоязычных видео с помощью встроенной нейросети

Команда разработчиков «Яндекса» сообщила о расширении возможностей своего фирменного браузера и включении в его состав функции, в автоматическом режиме создающей субтитры для видео и онлайновых трансляций на русском языке. Это стало возможным благодаря нейросети, встроенной в десктопную версию веб-обозревателя.

Новая функция работает на любых сайтах: от видеохостингов и социальных сетей до страниц телеканалов и загруженных в облачные хранилища роликов. Она может быть полезной в ситуациях, когда нужно соблюдать тишину, а наушников под рукой нет, или когда в помещении слишком шумно. Кроме того, автоматическая генерация субтитров поможет комфортно просматривать видео людям с нарушениями слуха.

Чтобы включить субтитры, достаточно в окне с видео нажать на расположенную сверху кнопку. В настройках можно выбрать размер шрифта и изменить прозрачность фона, чтобы субтитры не сливались с изображением на заднем плане.

Генерация субтитров работает в «Яндекс Браузере» для операционных систем Windows и Linux. В macOS новая функция появится до конца сентября. В планах разработчиков — интеграция технологии в мобильную версию веб-обозревателя и добавление поддержки других языков.


window-new
Soft
Hard
Тренды 🔥
Легендарной Windows 95 исполнилось 30 лет 35 мин.
YouTube начал тайно улучшать видео с помощью ИИ — блогеры в бешенстве 40 мин.
Павел Дуров заявил, что его арест год назад — это ошибка французской полиции 2 ч.
Российские компании стали больше тратить на рекламу в YouTube, несмотря на замедление платформы в России 3 ч.
«Речь не о погоне за деньгами»: глава CI Games объяснил, почему Lords of the Fallen 2 стала эксклюзивом Epic Games Store 3 ч.
ФСБ и МВД накрыли крупнейший в Рунете сервис по продаже персональных данных россиян 4 ч.
Создатели «Смуты» анонсировали демоверсию «Земского собора» и выпустили бесплатное образовательное приложение «Смутное время: Казачий круг» 5 ч.
Сразу три надёжных инсайдера сообщили, где и когда Microsoft анонсирует Forza Horizon 6 6 ч.
PS Store рассекретил дату релиза и цену Aces of Thunder — симулятора воздушных боёв от создателей War Thunder 7 ч.
Ubisoft подтвердила сюжетное дополнение к Assassin's Creed Mirage — оно будет бесплатным и выйдет уже скоро 8 ч.