Сегодня 29 сентября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-помощник
Быстрый переход

OpenAI запускает долгожданную функцию — голосового ассистента ChatGPT

Компания OpenAI начала развёртывание функции расширенного голосового режима для подписчиков ChatGPT Plus и пользователей сервиса ChatGPT Team для бизнеса. Как сообщает Bloomberg, пользователи планов Enterprise и Edu начнут получать доступ к этой функции уже на следующей неделе.

 Источник изображений: Andrew Neel/Unsplash

Источник изображений: Andrew Neel/Unsplash

Впервые функция, которая может реагировать на письменные и визуальные подсказки пользователей с помощью голоса, была представлена в мае. Однако компания решила отложить её запуск на несколько месяцев, так как были выявлены некоторые потенциальные проблемы, касающиеся безопасности. Тем не менее, уже в июле функция стала доступна ограниченному числу клиентов ChatGPT Plus.

OpenAI заявила, что в рамках расширенного развёртывания новой опции добавит ещё пять различных голосов, таким образом, доведя их общее количество до девяти. При этом голосовой ассистент не сможет имитировать речь других людей и, соответственно, создавать фейки. Также в целях безопасности, добавлены фильтры, гарантирующие, что алгоритм может определять и отклонять некоторые запросы на создание музыки или других форм аудио, защищённых авторским правом.

Bloomberg отмечает, что голосовой помощник ChatGPT, к сожалению, не получит ряд возможностей, которые изначально анонсировала OpenAI. В частности, на данный момент отсутствует заявленная ранее функция компьютерного зрения, позволяющая при помощи камеры смартфона пользователя взаимодействовать с чат-ботом.

Google запустила ИИ-ассистента Gemini Live с возможностью полного контроля над диалогом

Google запустила бесплатный голосовой режим Gemini Live для всех пользователей Android. Эта функция, доступная через приложение Gemini, позволяет вести голосовой диалог с ИИ-ассистентом в реальном времени, прерывать его ответы и выбирать различные голоса.

 Источник изображения: Google Gemini App / X

Источник изображения: Google Gemini App / X

Google впервые анонсировала Gemini Live на презентации Pixel 9 в прошлом месяце, но до сих пор эта функция была доступна только подписчикам Gemini Advanced. Как сообщает ресурс 9to5Google, для активации режима достаточно выбрать новую иконку в форме волны в правом нижнем углу интерфейса.

Gemini Live предлагает функциональность, схожую с голосовым чатом ChatGPT, но обладает рядом уникальных особенностей. Пользователи могут не только задавать вопросы голосом, но и прерывать ответы ИИ-ассистента в середине фразы, что позволяет вести с ним более естественный и динамичный диалог. Интерфейс предоставляет опции «hold» для приостановки ответа Gemini и «end» для завершения беседы, что даёт пользователю полный контроль над диалогом.

Для ещё большей персонализации взаимодействия с ИИ пользователи могут выбрать для ассистента один из понравившихся голосов. На данный момент Gemini Live работает только на английском языке, но Google уже сообщила о планах расширения языковой поддержки и разработки версии для iOS.

Google запустит ИИ-инструмент Ask Photos для поиска по содержимому фотографий

Google приступил к тестированию новой функции Ask Photos (спроси у фото) на основе искусственного интеллекта, с помощью которой можно задавать вопросы по фотографиям и получать ответы на основе их содержимого. Также обновится функция поиска в приложении Google Photos, сообщает The Verge, позволив искать изображения более интуитивным способом.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

Ask Photos использует ИИ-ассистента Gemini, который анализируют фотографии и предоставляют ответы вместе с показом изображений, соответствующих запросу. Это значительно облегчит поиск информации о прошедших событиях и поможет пользователям вспомнить важные моменты, сохранившиеся на их фотографиях. Google отмечает, что с помощью этой функции можно также выполнять различные задачи, такие как подведение итогов недавних поездок или выбор лучших семейных фотографий для совместного альбома.

Кроме того, Google улучшила традиционный поиск изображений в приложении Google Photos, который теперь называется «классическим поиском» (classic search). Пользователи смогут искать фотографии, используя естественный язык, например, вводя запросы вроде «Алиса и я смеёмся». Для удобства поиск также будет упорядочен по дате или релевантности. Пока эта функция будет доступна на английском языке как для Android, так и для iOS, а поддержка других языков появится в ближайшие несколько недель.

В рамках подготовки к этим изменениям произошла замена вкладки «Библиотека» на новую страницу «Коллекция», которая должна упростить поиск фотографий и видео. Google обещает, что поиск на интуитивно понятном языке поможет пользователям находить конкретные изображения без необходимости прокручивать тысячи снимков или фильтровать их по местоположению.

Носимый диктофон NotePin с поддержкой ChatGPT поможет запомнить всё

Компания Plaud анонсировала носимый диктофон NotePin на основе искусственного интеллекта с поддержкой ChatGPT, предназначенный для записи заметок и встреч. Устройство имеет форму таблетки и может быть использовано как кулон, закреплено на одежде, руке или любом другом месте.

 Источник изображения: Plaud

Источник изображения: Plaud

NotePin продолжает тенденцию развития носимых гаджетов на базе ИИ, которые, в основном, делятся на два типа — устройства для общения, такие как Friend, и устройства для работы и деловых встреч, такие как, например, Limitless. NotePin относится ко второй категории, так как фокусируется на транскрипции, резюмировании и извлечении важных моментов из записей, поясняет The Verge.

Гаджет работает до 20 часов без подзарядки в режиме непрерывной записи, при этом его использование требует ручного запуска, что сделано специально как для повышения конфиденциальности, так и с целью обеспечения согласия всех участников встречи на запись. За счёт своего компактного размера, NotePin делает весь процесс более удобным, так как предоставляет возможность носить его на теле, например пристегнуть к запястью через браслет или прикрепить к карману NotePin в виде булавки или зажима.

Стоимость устройства составляет $169 в базовой версии с самыми простыми функциями искусственного интеллекта, и за дополнительную плату $79 в год в расширенной версии, в которой доступны шаблоны резюме и маркировка докладчиков.

Apple разрабатывает «ИИ-личность» для роботов-помощников, и это не Siri

Apple готовится выпустить вместе с iOS 18.1 обновлённую версию ИИ-помощника Siri, который получит множество интересных функций. При этом, согласно данным 9to5Mac, Apple начала разрабатывать новую «ИИ-личность», которая будет совершенно независима от Siri и предназначена для роботов-помощников.

 Источник изображения: Copilot

Источник изображения: Copilot

Как сообщает Марк Гурман (Mark Gurman) из Bloomberg, Apple активно работает над новым, продвинутым ИИ-ассистентом для своих роботов и роботизированных устройств для использования в быту и не только. Одним из ключевых аспектов этой разработки является создание не просто помощника, а «ИИ-личности».

В то время как Siri является цифровым ассистентом на текущих устройствах Apple, «ИИ-личность», которая уже получила кодовое название J595, будет представлять из себя человекоподобный интерфейс на основе генеративного ИИ. «Мне сказали, что интерфейс может быть внедрён на настольные устройства и другие будущие робототехнические гаджеты Apple», — пишет Гурман в своей рассылке Power On.

J595 будет похож на iPad, но с камерами и основанием, оснащённым роботизированным приводом. Планируется, что этот продукт появится около 2026 или 2027 года, а позднее последуют мобильные роботы и, возможно, даже человекоподобные модели. В основе идеи лежит уверенность Apple в том, что устройство полезно только в том случае, если до него можно дотянуться. При этом довольно много ситуаций, когда необходим компьютер, но его нет поблизости, или руки заняты чем-то другим.

Например, присоединение роботизированной «руки» к iPad потенциально сделает устройство более полезным для видеоконференций или поиска рецептов в интернете. Робот сможет поворачивать и экран, если получит такую команду. Apple уже размышляет над возможностью создания роботов, которые смогут выполнять и домашние дела — например, загружать стиральную машину или мыть грязные тарелки. Однако это идеи будущего, которые пока не выходят за рамки идей и набросков на бумаге.

Китайские ИИ-компании в поисках монетизации нацелились на зарубежные рынки

Геополитическая напряжённость и технологический разрыв вынуждают китайских разработчиков искать новые стратегии для выхода на мировой рынок. Alibaba, ByteDance и другие крупные китайские компании стали запускать приложения на базе искусственного интеллекта не только для домашнего рынка, но и для глобальной аудитории, адаптируя свои продукты к различным рынкам.

 Источник изображения: Copilot

Источник изображения: Copilot

По сообщению издания South China Morning Post со ссылкой на исследование Unique Capital, среди 1500 активных компаний в сфере ИИ по всему миру, 103 китайские фирмы уже начали расширяться на зарубежные рынки. Эта тенденция обусловлена сложностью в убеждении китайских пользователей платить за ИИ-сервисы, что побудило некоторые компании искать возможности роста за рубежом.

Например, компания Alibaba, в соответствии со своей стратегией в области электронной коммерции и облачных вычислений в регионе, запустила ИИ-модель SeaLLMs, адаптированную для рынков Юго-Восточной Азии. Компания ByteDance, владелец TikTok, представила ряд приложений для потребителей на глобальном рынке, включая ИИ-помощника по дому Gauth, приложение с интерактивными персонажами AnyDoor и платформу для ИИ-ботов Coze. Minimax, один из ведущих китайских стартапов в области ИИ, также запустил приложение Talkie AI для международных пользователей.

По мнению экспертов отрасли, зарубежные рынки предлагают больший потенциал для роста на фоне жёсткой конкуренции внутри страны. Райан Чжан Хаоран (Ryan Zhang Haoran), соучредитель Motiff, компании-разработчика платформы для дизайна пользовательского интерфейса на базе ИИ, отмечает: «Зарубежные пользователи более охотно платят за программное обеспечение, и там больше профессионалов, способных предоставить ценную обратную связь». Чжан подчёркивает, что компания с самого начала ориентировалась на возможности бизнеса как внутри страны, так и за рубежом. При этом Motiff удалось довольно быстро привлечь первых клиентов из США, Японии, Юго-Восточной Азии и Латинской Америки.

Другая пекинская компания Kunlun Tech, являющаяся ветераном среди китайских технологических компаний, также нацелена на зарубежных пользователей. Генеральный директор Фан Хан (Fang Han) отмечает, что конкурентная среда за рубежом становится более насыщенной по мере того, как китайские компании выходят на международный рынок. «Контент, генерируемый ИИ, фундаментально снижает барьеры и затраты для создателей, что приводит к революции в индустрии изготовления контента», — говорит Фан. Недавно Kunlun Tech запустила ряд приложений на базе ИИ, включая музыкальный стриминговый сервис Melodio, коммерческую платформу Mureka для создания музыки с помощью ИИ и платформу для генерации короткометражных фильмов SkyReels.

Выход китайских разработчиков ИИ на международный рынок обусловлен также как высокой конкуренцией на внутреннем рынке, так и стремлением к расширению и монетизации своих продуктов. Однако китайским разработчикам ИИ приходится учитывать не только рыночные реалии, но и политическую ситуацию, особенно в свете ухудшения отношений между Вашингтоном и Пекином. Некоторые компании даже пытаются скрыть своё китайское происхождение.

Например, стартап HeyGen, занимающийся генеративным ИИ, переместил свою штаб-квартиру в Лос-Анджелес и призвал своих китайских инвесторов продать акции в пользу американских партнёров, чтобы минимизировать связи с материковым Китаем в условиях ужесточения контроля. «Соблюдение норм является критически важным. Вход на новый рынок означает соответствие его правилам», — отметил Чжан из Motiff. Он добавил, что, несмотря на единообразие продуктов на глобальном уровне, инфраструктура компании адаптирована для различных рынков с использованием различных моделей с открытым исходным кодом и облачных сервисов.

Microsoft скоро перестанет нанимать программистов, которые не используют ИИ

Инвестиции в помощников по программированию на базе ИИ достигли почти $1 млрд с начала прошлого года. Microsoft, Amazon и Google включились в гонку за лидерство в этом сегменте, внедряя технологию в свои продукты, что уже приносит значительную прибыль как компаниям, так и разработчикам. Более того, в Microsoft заявили, что скоро перестанут нанимать программистов, которые не используют ИИ-помощников.

 Источник изображения: Copilot

Источник изображения: Copilot

Компании, разрабатывающие ИИ-ассистентов для программирования, такие как Replit, Anysphere, Magic, Augment, Supermaven и Poolside AI, привлекли $433 млн только в этом году, что в совокупности с инвестициями прошлого года составляет почти $1 млрд. Стремление вкладывать деньги в ИИ-помощников для программирования указывает на то, что кодинг может стать первой областью, которая существенно трансформируется под влиянием последней волны технологий ИИ.

«Сегодня программная инженерия и программирование — это номер один среди областей, на которые влияет ИИ, — заявил Хади Партови (Hadi Partovi), генеральный директор некоммерческой образовательной организации Code.org, давний инвестор проектов Кремниевой долины и советник Airbnb, Uber, Dropbox и Facebook. — На сегодняшний день программирование без ИИ немного похоже на письмо без текстового редактора».

Интересно, что растущая уверенность в преимуществах ИИ-кодирования контрастирует с вопросами некоторых инвесторов об экономической выгоде генеративного ИИ и вероятной окупаемости прогнозируемых триллионных инвестиций в крупнейшие технологические компании (Big Tech) в вычислительную инфраструктуру для поддержки этой технологии в ближайшие годы. Но в то время как некоторые инвесторы сомневаются в экономической выгоде ИИ и рентабельности инвестиций Big Tech в его инфраструктуру, в Кремниевой долине наоборот растёт уверенность.

Ханна Сил (Hannah Seal), партнёр Index Ventures, которая инвестировала в стартап Augment, сказала, что «гораздо проще монетизировать ИИ, если вы можете встроить свой продукт в существующий рабочий процесс и сделать все преимущества мгновенно видимыми». Для неё вопросы монетизации ИИ-инструментов заключаются в следующем: «Каково время получения прибыли и насколько эта прибыль значима?». При этом она отмечает, что с ИИ-помощниками по кодированию таких вопросов уже не возникает.

Энтузиазм в отношении ИИ побудил стартапы и технологических гигантов Microsoft, Amazon, Meta и Google бороться за доминирование в переполненном секторе, создавая ИИ-помощников и агентов, которые могут писать и редактировать программный код. Более того, руководитель совета директоров Code.org, в который входят Дэвид Тредвелл (David Treadwell), глава электронной коммерции Amazon, и Кевин Скотт (Kevin Scott), технический директор Microsoft, недавно сказал Партови, что их компания к концу года прекратит нанимать людей, которые программируют без использования ИИ.

Напомним, GitHub, пионер в области ИИ-кодирования, стал одним из первых, кто интегрировал большие языковые модели (LLM) в свои продукты. «Когда мы начали использовать GPT-3, мы быстро поняли, что он очень хорошо пишет код, и решили создать на его основе GitHub Copilot», — заявил Томас Дохмке (Thomas Dohmke), генеральный директор GitHub. GitHub Copilot, был запущен в 2022 году и уже насчитывает почти 2 млн платных подписчиков и, как утверждает Дохмке, он пишет код гораздо лучше, чем средний разработчик.

 Источник изображения: GitHub

Источник изображения: GitHub

Доход GitHub, по состоянию на апрель, увеличился на 45 % по сравнению с прошлым годом, и по словам генерального директора Microsoft Сатьи Наделлы (Satya Nadella), годовой доход GitHub на начало этого месяца составил $2 млрд. «Copilot стал причиной более чем 40-% роста доходов GitHub в этом году и уже превышает по размеру весь бизнес GitHub с момента его приобретения», — отметил Наделла.

Тем не менее, IT-отделы крупных компаний всё ещё имеют некоторые опасения по поводу безопасности использования автоматизированных инструментов программирования для создания кода, готового к производству. Дохмке подчеркнул, что пока не следует ожидать внедрения сгенерированного искусственным интеллектом кода без ручного тестирования.

Google перестаралась с ИИ-редактором изображений Reimagine — он выдаёт слишком реалистичные результаты

Компания Google вместе со смартфонами Pixel 9 анонсировала новый инструмент редактирования фотографий с применением искусственного интеллекта под названием Reimagine. Эта функция, являющаяся развитием инструмента Magic Editor, позволяет не только изменять фон, но и добавлять объекты на фото с помощью текстовых подсказок.

 Источник изображения: Google for Developers/YouTube

Источник изображения: Google for Developers/YouTube

По словам журналистов из The Verge, тестировавших новую функцию, результаты часто выглядят очень убедительно, с правильно подобранным освещением, тенями и перспективой. Однако, как показало тестирование, Reimagine может быть использован для создания тревожного контента, включая сцены насилия, и добавления запрещённых предметов. Журналисты смогли сгенерировать множество изображения аварий и, соответственно, всё, что с этим может быть связано.

Представитель Google, Алекс Мориконе (Alex Moriconi), прокомментировал ситуацию: «Мы разрабатываем наши инструменты генеративного ИИ с учётом намерений пользователей, но у нас есть чёткие правила и условия использования, определяющие, какой контент допустим, а какой нет». Несмотря на слова Мориконе, журналисты с лёгкостью обошли ограничения, используя креативные формулировки в текстовых запросах.

 Источник изображения: Chris Welch/The Verge

Источник изображения: Chris Welch/The Verge

Хотя редактирование фотографий не является чем-то новым, Reimagine делает этот процесс невероятно простым и доступным. Теперь любой пользователь нового Pixel может реалистично добавить на фотографию любые объекты, в том числе, в обход правил Google, сцены аварий или других тревожных элементов, потратив на это всего несколько секунд.

«Возможно, все будут соблюдать правила Google в отношении ИИ и использовать Reimagine для добавления цветов и радуг на свои фотографии. Это было бы замечательно! Но на всякий случай стоит относиться с некоторым скептицизмом к фотографиям, которые вы видите в интернете», — заключает Allison Johnson из The Verge.

Android получит обновление с ИИ-функцией защиты от кражи устройства

Google тестирует новую функцию безопасности для Android, которая использует искусственный интеллект для определения кражи смартфона и мгновенной блокировки устройства.

 Источник изображения: Google

Источник изображения: Google

Эта функция, получившая название Theft Detection Lock (блокировка при обнаружении кражи), была анонсирована компанией ещё в мае этого года и ожидалась к релизу с Android 15. Как сообщает издание ZDNet со ссылкой на источник, функция уже начала появляться у некоторых пользователей.

Google объясняет, что функция Theft Detection Lock использует гироскоп и акселерометр смартфона для отслеживания «типичных движений, связанных с кражей». Хотя компания не уточнила, какие именно движения подразумеваются, но можно предположить, что речь идёт о резких движениях или толчках, за которыми следует быстрое ускорение. Если такое происходит, экран устройства немедленно блокируется.

На данный момент Theft Detection Lock доступна ограниченному числу пользователей в Бразилии, которые зарегистрировались в бета-программе Google. Ожидается, что после полного запуска функция сначала появится на новых телефонах Google, а затем станет доступна практически на всех современных устройствах с операционной системой Android 10 и выше.

Отметим, что Theft Detection Lock лишь одна из нескольких новых функций безопасности, анонсированных Google. Также появится усложнение процедуры сброса настроек до заводских и усложнение настройки телефона под новой учётной записью, возможность отметить телефон как потерянный в Find My Device для упрощения отслеживания, автоматическая блокировка при чрезмерном количестве неудачных попыток аутентификации, ещё возможность блокировки телефона, если он находится в автономном режиме. Также появится удалённая блокировка, позволяющая заблокировать экран телефона, используя только номер телефона и быструю проверку безопасности.

Google планирует сделать новые инструменты доступными через обновление сервисов Google Play уже в этом году. Некоторые функции будут доступны только в Android 15.

Opera выпустила для iOS браузер Opera One с голосовым ИИ-помощником Aria

Компания Opera выпустила iOS-версию браузера Opera One со встроенным помощником Aria на базе искусственного интеллекта. Мобильное приложение повторяет минималистичный дизайн десктопной версии веб-обозревателя и позволяет скрывать ненужные элементы, обеспечивая комфортный просмотр веб-страниц.

 Источник изображения: Opera

Источник изображения: Opera

Строка поиска для удобства расположена в нижней части интерфейса и предоставляет быстрые подсказки при вводе запроса. В поиск также интегрирован ИИ-ассистент Aria. Кроме того, как сообщает MacRumors, новая функция Swipe to search позволяет активировать строку поиска простым свайпом вниз, аналогично поиску приложений через Spotlight на домашнем экране iPhone. Несмотря на то, что панель поиска по умолчанию располагается внизу, пользователи могут выбрать стандартную навигацию.

Встроенный ИИ-помощник Aria способен выполнять широкий спектр задач — от поиска в интернете до генерации текста и изображений. С помощью функции голосового ввода можно задавать вопросы устно, не прибегая к вводу текста с клавиатуры, а с помощью ИИ-генератора Imagen2 от Google создавать визуальный контент путём ввода текстовых запросов.

Кроме того, в Opera One на стартовом экране появилась новая карусель, которая предназначена для информирования пользователей. В неё интегрированы новости, спортивные результаты и советы по продуктам Opera. В браузер также встроен блокировщик рекламы. Предусмотрена возможность настройки тем оформления.

Скачать Opera One для iOS можно в магазине приложений App Store.

Вышла крупнейшая ИИ-модель Llama 3.1 от Meta✴ — её самая большая версия имеет 405 млрд параметров

Компания Meta объявила о выпуске крупнейшей на сегодня открытой языковой модели искусственного интеллекта Llama 3.1, насчитывающей более 400 миллиардов различных параметров. По заявлению генерального директора Meta Марка Цукерберга (Mark Zuckerberg) модель может превзойти GPT-4 по производительности уже в ближайшее время, а к концу года станет самым популярным ИИ-помощником в мире.

 Источник изображения: Reuters

Источник изображения: Reuters

Как сообщает издание The Verge, разработка новой модели потребовала больших инвестиций. Llama 3.1 значительно сложнее, чем более ранние версии, выпущенные всего несколько месяцев назад. Старшая версия ИИ-модели имеет 405 миллиардов параметров и была обучена с использованием более 16 000 ускорителей H100 от Nvidia. Meta не раскрывает вложенных средств в её разработку, но, исходя из стоимости одних только чипов Nvidia, можно с уверенностью предположить, что речь идёт о сотнях миллионов долларов.

Несмотря на высокую стоимость разработки, Meta решила сделать код модели открытым (Open Source). В письме, опубликованном в официальном блоге компании, Цукерберг утверждает, что ИИ-модели с открытым исходным кодом обгонят проприетарные модели, подобно тому, как Linux стал операционной системой с открытым исходным кодом, которая сегодня управляет большинством телефонов, серверов и гаджетов.

Одним из ключевых обновлений стало расширение географии доступности сервиса Meta AI, который построен на Llama. Теперь ассистент доступен в 22 странах, включая Аргентину, Чили, Колумбию, Эквадор, Мексику, Перу и Камерун. Кроме того, если раньше Meta AI поддерживала только английский язык, то сейчас добавлены французский, немецкий, хинди, итальянский, португальский и испанский. Однако стоит отметить, что некоторые из новых функций пока доступны только в определённых регионах или для конкретных языков.

 Источник изображения: ***

Источник изображения: Meta

Также появилась интересная функция Imagine me (представь меня), которая использует генеративную ИИ-модель Imagine Yourself, сообщает TechCrunch. Эта модель способна создавать изображения на основе фотографии пользователя и текстового запроса в требуемом контексте. Например, «Представь меня сёрфингистом» или «Представь меня на пляже». После чего искусственный интеллект сгенерирует соответствующее изображение. Функция доступна в бета-версии и активируется вводом фразы «Imagine me».

 Источник изображения: ***

Источник изображения: Meta

В ближайшее время Meta AI также получит новые инструменты редактирования изображений. Пользователи смогут добавлять, удалять и изменять объекты на изображениях с помощью текстовых запросов. А со следующего месяца разработчики обещают внедрить кнопку «Edit with AI» (редактирование с помощью ИИ) для доступа к дополнительным опциям тонкой настройки. Позднее появятся новые ярлыки для быстрой публикации изображений, созданных ИИ, в лентах, историях и комментариях в приложениях Meta.

Напомним, запуск Meta AI состоялся в сентябре 2023 года. Сервис основан на большой языковой модели Llama 2 и предоставляет пользователям возможность получать информацию, генерировать текст, делать переводы на различные языки и выполнять другие задачи с помощью искусственного интеллекта.

Proton выпустила ИИ-помощника для электронной почты, который работает на компьютере пользователя

Швейцарская компания Proton, известная своими приложениями, такими как Proton Mail и Proton VPN, ориентированными на конфиденциальность, запустила новый инструмент на основе искусственного интеллекта, который будет помогать пользователям в составлении электронных писем, перерабатывать их и проверять орфографию перед отправкой с помощью простых подсказок.

 Источник изображения: Proton

Источник изображения: Proton

Новый продукт Proton Scribe продолжает воспроизводить функциональность решений, появившихся у Google, отвечая на запуск AI Gemini в Gmail.

Основанный на открытой модели языка Mistral 7B от французского стартапа Mistral, Proton Scribe обеспечивает максимальную безопасность данных пользователей. Как сообщает TechCrunch, инструмент можно устанавливать полностью на локальном уровне, что исключает передачу информации за пределы устройства. Компания также обещает, что ИИ не будет обучаться на пользовательских данных, что особенно важно для корпоративного использования.

«Мы поняли, что независимо от того, разрабатывает ли Proton инструменты ИИ или нет, пользователи всё равно будут использовать искусственный интеллект, часто со значительными последствиями для конфиденциальности», — сказал основатель и генеральный директор Энди Йен (Andy Yen). «Вместо того, чтобы копировать свои сообщения в сторонние инструменты ИИ, которые часто имеют ужасные методы обеспечения конфиденциальности, было бы лучше встроить инструменты ИИ, ориентированные на конфиденциальность, непосредственно в Proton Mail».

 Источник изображения: Proton

Источник изображения: Proton

Интересно, что Proton Scribe также может работать непосредственно на серверах Proton, если пользователи, менее обеспокоенные безопасностью, выберут этот способ взаимодействия с приложением. Это позволит быстрее обрабатывать запросы, в зависимости от аппаратного обеспечения пользователя. При этом компания подчёркивает, что не ведёт никаких журналов и не передаёт данные третьим лицам. «На сервер передаётся только подсказка, введённая пользователем, и никакие данные не сохраняются после создания черновика электронного письма», — сообщил представитель компании изданию TechCrunch.

Хотя Proton Scribe ограничен только электронной почтой, компания заявила, что может расширить инструмент и на другие свои продукты в будущем «в зависимости от спроса». Возможно, в дальнейшем в Scribe появится интеграция с недавно запущенным приложением для совместной работы с документами.

Новый инструмент доступен уже сегодня для Proton Mail в веб-версии и десктопной версии. Компания подтвердила, что в будущем планирует добавить поддержку мобильных устройств. Что касается стоимости, то Proton Scribe в основном ориентирован на бизнес-пользователей и те, кто уже использует тарифные планы Mail Essentials, Mail Professional или Proton Business Suite, могут получить доступ к инструменту за дополнительные $2,99 в месяц. Пользователи устаревших и лимитированных тарифных планов, таких как Visionary или Lifetime, получат доступ к Proton Scribe бесплатно.

Во флагманских смартфонах Samsung появится обновлённый помощник Bixby с фирменным ИИ

Samsung готовится к выпуску обновлённой версии своего голосового помощника Bixby, основанной на технологии генеративного ИИ. Он сможет предоставлять пользователям информацию по запросу подобно ChatGPT от OpenAI. При этом Samsung не откажется от сотрудничества с другими разработчиками ИИ и по-прежнему будет поддерживать голосового помощника Google.

 Источник изображения: Mark Chan / Unsplash

Источник изображения: Mark Chan / Unsplash

Новая версия Bixby будет основана на собственной большой языковой модели (LLM) Samsung, что позволит существенно расширить возможности помощника. «Мы собираемся усовершенствовать Bixby, применяя технологию генеративного ИИ», — заявил в интервью CNBC глава мобильного подразделения компании Тэ Мун Ро (ТМ Roh).

Bixby был запущен в 2017 году вместе со смартфоном Galaxy S8 и с тех пор постоянно развивался. Сейчас помощник поддерживает множество функций, включая синхронный перевод (Live Translate) на другой язык в режиме реального времени, поиск ресторанов и распознавание объектов через камеру смартфона.

 Источник изображения: Samsung

Источник изображения: Samsung

Обновление Bixby — это часть более широкой стратегии Samsung по внедрению искусственного интеллекта в свои устройства, так как компания стремится сделать ИИ-функции ключевым преимуществом своих флагманских смартфонов. «Поскольку потребители всё чаще используют возможности ИИ, они реально могут почувствовать удобство и преимущества, которые приносит эта технология. Я твёрдо верю, что Galaxy AI и мобильный ИИ станет сильной мотивацией для покупки новых продуктов», — отметил Ро. Samsung не планирует отказываться от поддержки других голосовых помощников на своих устройствах. Например, на последних смартфонах компании по-прежнему доступен Google Assistant.

Анонс обновлённого Bixby происходит на фоне растущего интереса к генеративному ИИ, вызванного успехом ChatGPT от OpenAI. Недавно о планах по улучшению своего голосового помощника Siri с помощью ИИ также объявила и Apple. Эксперты в свою очередь отмечают, что конкуренция на рынке голосовых помощников обостряется. Соответственно Samsung стремится не отстать от конкурентов и укрепить свои позиции за счёт инвестиций в ИИ, а её улучшенный Bixby может стать важным фактором в борьбе за покупателей премиальных смартфонов.

Ожидается, что новая версия Bixby дебютирует во флагманских устройствах Samsung в конце этого года. Компания уже начала внедрять новые ИИ-функции в свои последние складные смартфоны Galaxy Z Fold6 и Z Flip6.

WhatsApp тестирует ИИ-редактирование фотографий с помощью текстовых запросов

Популярный мессенджер приступил к тестированию инновационной функции, позволяющей пользователям редактировать фотографии и получать информацию о них с помощью искусственного интеллекта Meta AI.

 Источник изображения: Heiko / Pixabay

Источник изображения: Heiko / Pixabay

Новая функция, о которой рассказал WABetaInfo, была замечена в последней бета-версии WhatsApp 2.24.14.20 для Android. С её помощью пользователи смогут загружать фотографии в чат с ИИ от Meta, который сможет анализировать изображения, отвечать на дополнительные вопросы об этих изображениях.

Например, можно попросить ИИ определить объекты на фотографии или объяснить её смысл. Кроме того, ИИ сможет быстро редактировать изображения по текстовым запросам, введённым в чат. Хотя на данный момент неясно, насколько широкими будут возможности редактирования, WABetaInfo отмечает, что новая функция «добавит удобства в пользовательский опыт» и поможет людям сэкономить время.

 Источник изображения: wabetainfo.com

Источник изображения: wabetainfo.com

Кстати, для пользователей, которые беспокоятся о конфиденциальности, WhatsApp предусмотрел возможность удаления загруженных фотографий в любое время. Помимо этого, как ранее сообщали источники, Meta также разрабатывает генератор аватаров с использованием ИИ, который позволит пользователям создавать свои изображения на различных фонах и в разных стилях.

Новая функция редактирования фото с помощью ИИ пока находится на стадии тестирования и доступна только в бета-версии WhatsApp для Android. О сроках её запуска для всех пользователей без ограничения пока не сообщается.

Геймерский браузер Opera GX получил масштабное обновление встроенного ИИ Aria

Популярный браузер для геймеров Opera GX получил масштабное обновление встроенного искусственного интеллекта Aria. Добавлена функция генерации и анализа изображений, голосового вывода и другие интересные возможности.

 Источник изображения: Opera Software

Источник изображения: Opera Software

Компания Opera Software объявила о значительном обновлении браузера Opera GX, ориентированного на геймеров. Главным нововведением стало расширение функциональности встроенного искусственного интеллекта Aria, который теперь способен работать с изображениями, озвучивать текст и предоставлять более подробную информацию пользователям.

Обновление включает ряд новых функций, ранее доступных только в экспериментальном приложении AI Feature Drops для браузера Opera One. Теперь геймеры Opera GX смогут воспользоваться передовыми технологиями искусственного интеллекта прямо в своем браузере.

 Источник изображения: Opera Software

Источник изображения: Opera Software

Одной из ключевых особенностей стала возможность генерации изображений на основе текстовых описаний. Используя модель Imagen2 от Google, Aria может создавать уникальные визуальные материалы по запросу пользователя. Ограничение установлено на уровне 30 бесплатных изображений в день.

Кроме того, Aria получила функцию анализа изображений. Теперь можно загружать картинки и задавать вопросы о содержании. Например, ИИ может определить марку и модель неизвестной гарнитуры или помочь решить математическую задачу по скриншоту.

 Источник изображения: Opera Software

Источник изображения: Opera Software

Еще одним важным дополнением стала возможность голосового вывода информации. Используя технологию WaveNet от Google, Aria может озвучивать свои ответы, что особенно полезно для людей с ограниченными возможностями или тех, кто предпочитает аудиоформат.

Представители Opera Software отметили, что новые функции значительно расширяют возможности искусственного интеллекта Aria, делая его более эффективным и доступным инструментом для игрового сообщества. Обновление уже доступно для всех пользователей Opera GX и по замыслу разработчиков должно сделать взаимодействие с браузером еще более удобным и интуитивным.


window-new
Soft
Hard
Тренды 🔥
Рождение экосистемы: Intel объявила о доступности ИИ-ускорителей Gaudi3 и решений на их основе 5 ч.
Индия запустила сразу пять суперкомпьютеров за два дня 6 ч.
Корабль SpaceX Dragon Crew-9 с россиянином и американцем отправился на МКС 8 ч.
Министр энергетики США не против иностранных инвестиций в ИИ ЦОД 9 ч.
Google представила технологию проектирования микросхем AlphaChip с помощью ИИ 10 ч.
Xiaomi представила внешний аккумулятор Power Bank 25000 с выходной мощностью до 212 Вт 13 ч.
В Швейцарии придумали роборуку, которая может отсоединяться от манипулятора и самостоятельно ползать 13 ч.
Мировой облачный рынок стремительно растёт: затраты в сегменте ЦОД за полгода подскочили почти на треть 15 ч.
В Ирландии построят первое в Европе хранилище энергии на батареях с обратимой коррозией металла 15 ч.
В Китае впервые представили лунный скафандр — мощный и элегантный 18 ч.