Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → голосовые подсказки

ИИ в Gmail научат понимать голосовые команды и облагораживать письма, а в «Документах» появятся вкладки

Сегодня на конференции Cloud Next в Лас-Вегасе компания Google сообщила, что подписчики Google Workspace вскоре смогут при помощи голосовых запросов пользоваться ИИ-инструментом «Помоги мне написать», чтобы, к примеру, составить письмо в Gmail «на ходу». Google также анонсировала в Gmail для Workspace новую функцию на основе искусственного интеллекта, которая мгновенно умеет «облагораживать» черновики писем.

 Исчтоник изображения: Google

Источник изображений: Google

Представленные инструменты в первую очередь станут доступны платным подписчикам. По словам представителя Google, компания имеет «долгую историю создания действительно полезных и универсальных функций с искусственным интеллектом для всех наших пользователей, включая умный ответ и умное составление сообщения». После получения отзывов от платных подписчиков, которые, получается, выступят в качестве бета-тестеров, Google «рассмотрит возможность распространения их [функций ИИ] на всех пользователей».

В дополнение к новым функциям ИИ Google добавила в пакет Workspace несколько других возможностей, среди которых «Уведомления» для «Таблиц», присылающие настраиваемое оповещение, например, при изменении определённого поля. Кроме того, в «Таблицах» появятся новые шаблоны, которые должны упростить создание новой электронной таблицы.

«Документы» получат поддержку вкладок, так что пользователь «сможет организовывать информацию в одном документе вместо того, чтобы ссылаться на несколько документов». Эта функция может оказаться весьма полезной при работе с большими документами со сложным форматированием. В «Документах» появилась возможность создавать макеты обложек без полей.

Google Chat теперь может обслуживать до 500 000 участников, кроме того, добавлена поддержка обмена сообщениями со Slack и Teams.

По данным Google, Workspace используют около 3 миллиардов пользователей, из которых более 10 миллионов составляют платные подписчики.

ChatGPT научился понимать голосовые команды и работать с изображениями

OpenAI расширила варианты взаимодействия с ChatGPT. Новая версия чат-бота теперь принимает в качестве промтов (подсказок) не только текст, но также изображения и голосовые команды. Для коммерческих пользователей новые возможности станут доступны в ближайшие две недели, а остальным придётся какое-то время подождать.

 Источник изображения: The Verge

Источник изображения: The Verge

Общение голосом с ChatGPT в чём-то похоже на разговор с любым голосовым помощником, но, по утверждению OpenAI, качество ответов значительно выше благодаря улучшенной базовой технологии. Пользователь нажимает кнопку и произносит вопрос, ChatGPT преобразует его в текст и передаёт в большую языковую модель, получает ответ, преобразует его обратно в речь и произносит ответ вслух.

Новые возможности ChatGPT опираются на большую языковую модель Whisper, которая выполняет значительную часть работы по преобразованию речи в текст и обратно. По утверждению OpenAI, новая модель может генерировать «человеческий голос из текста и образца речи длиной в несколько секунд». Пока доступно пять вариантов голоса ChatGPT, но OpenAI видит в этой модели гораздо больший потенциал.

Возможность создать синтезированный голос любого человека, опираясь всего на несколько секунд его речи, даёт широкое поле деятельности для киберпреступников, признаёт OpenAI в анонсе новых функций: «Это новые риски, такие как возможность злоумышленников выдать себя за общественных деятелей или совершить мошенничество». По утверждению компании, модель недоступна для широкого использования именно по этой причине: OpenAI планирует ограничить модель конкретными вариантами использования и партнёрскими соглашениями.

Что касается запроса в ChatGPT при помощи изображения, пользователю достаточно сфотографировать или нарисовать предмет своего интереса и отправить боту. В процессе общения можно применять текстовые или голосовые подсказки, чтобы уточнить запрос или ограничить область поиска.

Очевидно, что использование изображений в качестве подсказки для чат-бота также имеет свои потенциальные проблемы. В первую очередь это касается запроса о личности человека на фотографии, хотя OpenAI заявляет, что ограничила «способность ChatGPT анализировать и делать прямые заявления о людях» как по соображениям точности, так и по соображениям конфиденциальности.

Спустя почти год после первого запуска ChatGPT OpenAI продолжает расширять границы применения и использования своего чат-бота, пытаясь избежать связанных с ним проблем и недоработок. В частности, компания намеренно ограничивает возможности своих новых ИИ-моделей. Но такой подход не будет работать вечно. По мере того, как все больше людей используют голосовое управление и поиск изображений, а ChatGPT становится мультимодальным и полезным виртуальным помощником, удерживать ИИ в рамках будет все труднее и труднее.


window-new
Soft
Hard
Тренды 🔥
Windows 11 получила мелкое, но очень полезное обновление индикатора батареи ноутбука 6 ч.
Хардкорный режим, скачки и три сюжетных дополнения: Warhorse рассказала, как будет поддерживать Kingdom Come: Deliverance 2 после релиза 6 ч.
HPE проводит расследование в связи с заявлением хакеров о взломе её систем 6 ч.
«Мы создали CRPG нашей мечты»: продажи Warhammer 40,000: Rogue Trader превысили миллион копий 7 ч.
Создатели Lineage и Guild Wars отменили MMORPG во вселенной Horizon Zero Dawn и Horizon Forbidden West 7 ч.
Instagram начал переманивать блогеров из TikTok денежными бонусами до $50 тысяч в месяц 8 ч.
Eternal Strands, Starbound, Far Cry New Dawn и ещё шесть игр: Microsoft рассказала о ближайших новинках Game Pass 9 ч.
ИИ превзойдёт человеческий разум в течение двух-трёх лет, уверен глава Anthropic 10 ч.
Keep Driving вышла на финишную прямую — новый трейлер и дата релиза ностальгической RPG о путешествии по стране на своей первой машине 10 ч.
Google стала на шаг ближе к ИИ, который думает как человек — представлена архитектура Titans 12 ч.
GeForce RTX 5000 Kingpin не будет — легендарный оверклокер рассказал о планах на будущее, в которых есть место не только Nvidia 4 ч.
Слухи: OpenAI, Oracle и Softbank вложат $100 млрд в ИИ-инфраструктуру США, а в перспективе — до $500 млрд 4 ч.
Новая статья: Обзор смартфона OPPO Find X8: очень удобный флагман 5 ч.
К мемкоинам приведут настоящих инвесторов — поданы заявки на крипто-ETF в Dogecoin и TRUMP 5 ч.
Fujifilm представила гибридную камеру мгновенной печати Instax Wide Evo с широкоугольным объективом 9 ч.
Новый Apple iPhone SE получит вырез Dynamic Island вместо чёлки 11 ч.
К 2035 году США смогут получать до 84 ГВт из источников возобновляемой энергии на федеральных землях 11 ч.
Maxsun выпустила новые видеокарты на чипах Nvidia Kepler десятилетней давности 11 ч.
«Транснефть» направила повторный иск к Cisco на 56 млн рублей 12 ч.
Sparkle представила видеокарту Arc B580 Titan Luna с белой печатной платой и подпоркой 12 ч.