Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → gemini
Быстрый переход

Международная версия нового флагманского смартфона Xiaomi получит поддержку Google Gemini

Китайский электронный гигант Xiaomi работает с Google над интеграции большой языковой модели Gemini в новый флагманский телефон производителя, предназначенный для международного рынка.

 Источник изображения: x.com/leijun

Источник изображения: x.com/leijun

«Рад работать совместно с Google над будущими флагманскими устройствами Xiaomi для международных рынков. <..> Используя Google Cloud и Gemini, мы собираемся предложить более умные и интуитивно понятные функции», — написал в соцсети X глава Xiaomi Лэй Цзюнь (Lei Jun) после объявления, сделанного на двухдневном мероприятии Google I/O Connect China в Пекине, которое завершилось в минувший четверг.

Смартфоны Xiaomi 15, как ожидается, будут представлены в этом году. О намерении интегрировать какие-либо большие языковые модели в китайскую версию устройств сообщений пока не было, но известно, что Xiaomi разработала собственную модель MiLM — ещё в мае соответствующие документы появились у регуляторов. Система Google Gemini, как и многие другие зарубежные службы ИИ, недоступна в материковом Китае, где местные власти проводят их проверку перед выпуском в общий доступ.

 Источник изображения: blog.google

Источник изображения: blog.google

Совместный проект с Google может придать Xiaomi определённый импульс на международном рынке — компания, по версии аналитиков IDC, во II квартале стала третьим поставщиком смартфонов в мире с долей 14,8 % рынка. Первой и второй стали Samsung и Apple с долями 18,8 % и 15,8 % соответственно. Мировые поставки смартфонов во II квартале выросли на 6,5 % год к году и достигли 285,4 млн единиц, добавили в IDC.

Apple в этом году намеревается интегрировать в свои iPhone собственную систему Apple Intelligence, но в Китае компания, как ожидается, воспользуется услугами местного поставщика ИИ-решений. Пакет функций Galaxy AI, который появился на флагманских Samsung Galaxy S24 в этом году, основан на технологиях Google Gemini, а в Китае их заменит большая языковая модель Baidu Ernie.

Технологии Google Gemini интегрирует в международную версию своего флагмана и китайская Oppo — она вместе с Vivo заняла на мировом рынке смартфонов четвёртое место с долей 9 % рынка. На прошедшем мероприятии Oppo уже продемонстрировала функции на базе Gemini: перевод в реальном времени, составление сводок статей и генерацию мультимодального контента. Функции Gemini уже доступны в международной версии Oppo Reno12, и в этом году их работа будет улучшена.

ИИ поможет блогерам в YouTube с идеями для видео и созданием заголовков

Сервис YouTube тестирует новую функцию под названием Brainstorm with Gemini, с помощью которой блогеры смогут находить новые идеи для своих видео, придумывать интересные заголовки, создавать миниатюры. Упомянутый инструмент был презентован в видеоролике, который появился на канале Creator Insider.

 Источник изображения: yousafbhutta/Pixabay

Источник изображения: yousafbhutta/Pixabay

Появление новой функции может дать видеохостингу определённые преимущества перед конкурентами, поскольку пользователям будет предложено то, чего пока больше нигде нет. Кроме того, Google имеет смысл интегрировать ИИ-бота с YouTube, чтобы побудить блогеров больше использовать ИИ-инструменты компании и меньше взаимодействовать с нейросетями конкурентов, такими как ChatGPT от OpenAI.

Источник отмечает, что YouTube с мая этого года уже тестирует подобный ИИ-инструмент, который, как ожидается, должен дать авторам контента необходимое вдохновение для создания новых роликов. Brainstorm with Gemini предоставляет похожие возможности и разработчики, в том числе, хотят оценить, насколько ИИ-функция будет популярной.

Взаимодействовать с представленной функцией можно через YouTube Studio. На данном этапе Brainstorm with Gemini доступна ограниченному числу пользователей YouTube. Разработчики намерены собрать отзывы участников тестирования, прежде чем принять решение о более масштабном распространении интеграции сервиса с ИИ-ботом.

Искусственный интеллект Gemini появится в приложении Google Home

В Google Home скоро появятся новые функции, такие как автоматизация задач путём текстовых и голосовых команд, озвучивание событий, которые засняла камера видеонаблюдения Nest, а также появится обновлённый Google Assistant с совершенно новым голосом и улучшенной способностью понимать контекст сообщений.

 Источник изображения: Google

Источник изображения: Google

В преддверии осенней презентации новых устройств Google анонсировала три новые функции для своей платформы умного дома, основанные на возможностях искусственного интеллекта Gemini. Эти нововведения, запланированные к запуску в конце этого года, обещают сделать управление Google Home проще и эффективнее.

Первая функция представляет из себя интеллектуальный анализ видео с камер видеонаблюдения Nest. Теперь Nest сможет не только распознавать людей и объекты, но и генерировать подробные описания происходящего. Вместо простого уведомления о движении объектов, пользователь получит текстовое описание, например: «Молодой человек в повседневной одежде стоит рядом с припаркованным чёрным внедорожником. Он несёт пакеты с продуктами. Машина частично находится в гараже, и обстановка кажется довольно спокойной». Алгоритм позволит быстрее понять суть события, не просматривая полностью видеозапись.

 Источник изображения: Google

Источник изображения: Google

Вторая функция «Помогите мне создать» (Help me create) позволит создавать автоматизированные сценарии (рутины) с помощью голосовых или текстовых команд. Например, можно будет сказать: «Закрой двери и выключи свет перед сном», и Google Home создаст соответствующий сценарий.

 Источник изображения: Google

Источник изображения: Google

Третье нововведение касается улучшения базовых функций Google Assistant на умных колонках и дисплеях Nest. Ассистент получит новый голос с различными стилями и акцентом, а также сможет поддерживать более естественный диалог, понимая паузы и междометия. Ещё будут улучшены базовые возможности приложения, такие как воспроизведение музыки и установка таймеров на всех текущих умных колонках и дисплеях Nest.

 Источник изображения: Google

Источник изображения: Google

Анис Каттукаран (Anish Kattukaran), руководитель отдела продуктов Google Home, сказал, что «это только начало внедрения искусственного интеллекта Gemini в платформу умного дома, которое прокладывает путь к следующей эре Google Home». Ещё он отметил, что компания намеренно не торопится и будет постепенно улучшать опции Google Home, чтобы избежать даже самых малых ошибок.

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Google открыла всем пользователям бесплатный доступ к быстрой и лёгкой ИИ-модели Gemini 1.5 Flash

Google представила новую версию генеративной модели ИИ Gemini 1.5 Flash, которая доступна на более чем 40 языках и в более чем 230 странах и территориях. Компания анонсировала «общее улучшение качества и снижение задержек, особенно заметные улучшения в рассуждении и понимании изображений». Значительно увеличился размер контекстного окна, добавлена возможность загрузки файлов из Google «Диска», расширены возможности Gemini для подростков и мобильных приложений.

 Источник изображения: Google

Источник изображения: Google

Google поставила своей приоритетной целью добиться максимальной доступности новой модели Gemini. Компания начала постепенно внедрять Gemini в «Сообщениях» Google для устройств Android в Европейской экономической зоне (ЕС, Исландия, Лихтенштейн и Норвегия), Великобритании и Швейцарии. Пользователям стало доступно общение с Gemini на французском, польском и испанском языках.

Google расширила доступ к мобильному приложению Gemini в большем количестве регионов и стремится привлечь подростков старше 13 лет к использованию инструментов ИИ. Компания представила специальный процесс адаптации для подростков и руководство по грамотности в области ИИ, чтобы помочь пользователям любого уровня подготовки лучше понимать школьные предметы, готовиться к поступлению в университет или получать помощь в творческих проектах.

Google заявила о сотрудничестве с экспертами по безопасности и развитию детей, включая MediaSmarts, Miudos Seguros и Fad Juventud, которые «продолжают предоставлять экспертные знания по удовлетворению уникальных потребностей подростков и семей».

Google утверждает, что новая версия Gemini предложит существенное улучшение общего качества ответов и снижение задержек. Наибольший прогресс обещан в рассуждении и понимании изображений. Контекстное окно увеличено в четыре раза до 32 000 токенов. Для увеличения эффективности использования большого контекстного окна скоро появится возможность загружать файлы пользователя через Google «Диск» или непосредственно с устройства пользователя, что раньше было доступно лишь в Gemini Advanced.

В рамках работы по уменьшению галлюцинаций ИИ Google теперь отображает ссылки на соответствующий контент при ответе на вопросы, требующие подтверждения фактами. В конце абзаца ответа будет отображена ссылка на сайты, где можно прочитать больше по этой теме. Если ответ Gemini ссылается на информацию, найденную с помощью расширения Gmail, пользователь увидит ссылки на соответствующие электронные письма. В настоящее время эта функция ограничена подсказками только на английском языке.

Google подчёркивает, что развитие Gemini «всегда основывалось на приверженности ответственности и безопасности пользователей». Компания проводит политику максимальной открытости и прозрачности, подробно рассказывая о всех этапах разработки Gemini. В блоге Google можно получить подробную информацию о политике компании в отношении ИИ и о том, как компания решает сложные и деликатные вопросы, связанные с общественными интересами, а также политическими, религиозными или моральными убеждениями.

Еврокомиссия выяснит, не мешает ли конкурентам Samsung наличие ИИ-модели Gemini Nano в Galaxy S24

Европейская комиссия начала опрос участников рынка смартфонов по поводу того, как могло отразиться на них использование в смартфонах Samsung Galaxy S24 ИИ-модели Gemini Nano от Google, с целью выяснения, нет ли в сделке двух компаний признаков антиконкурентного сговора, пишет Reuters.

 Samsung Galaxy S24 Ultra

Samsung Galaxy S24 Ultra

В частности, регулятор спрашивает в анкете, не ограничивает ли предварительная установка Gemini Nano и её использование через устройство или облако применение других систем генеративного искусственного интеллекта, которые также могли бы быть предварительно установлены на том же устройстве.

Также Еврокомиссия выясняет, не ограничивает ли предварительная установка Gemini Nano взаимодействие между другими чат-ботами и приложениями, предварительно установленными на смартфонах Samsung.

Также респондентам был задан вопрос, не предпринимали ли они попытку заключить сделку с производителями устройств о предварительной установке их чат-ботов на базе ИИ. И если подобная попытка предпринималась, но в итоге оказалась безуспешной, то в чём была причина отказа.

Ответы на данную восьмистраничную анкету регулятора должны быть предоставлены участниками рынка на этой неделе.

Приложение Google Vids сможет быстро создавать видеопрезентации с помощью ИИ Gemini

Google запускает новое приложение Vids для создания видеопрезентаций с помощью искусственного интеллекта. Инструмент, доступный в рамках платформы Workspace Labs, позволяет создавать видеоконтент так же легко, как слайды в PowerPoint.

 Источник изображения: Google

Источник изображения: Google

Vids предоставляет возможность комбинировать документы, слайды, голосовое сопровождение и видеозаписи на временной шкале для создания презентационных роликов, которыми можно поделиться с коллегами. Доступ к приложению через Workspace Labs позволяет администраторам Workspace включить эту функцию для пользователей, желающих опробовать видеоредактор с поддержкой ИИ.

 Источник изображения: Google

Источник изображения: Google

Как отмечает The Verge, Vids не следует путать с такими инструментами, как Sora от OpenAI, которые могут создавать реалистичные видео на основе текстовых запросов. Vids фокусируется на создании презентаций с помощью ИИ-ассистента Gemini, который генерирует контент на основе описания пользователя, но с возможностью последующего редактирования.

Пользователи также могут начать работу над презентацией вручную, выбрав один из многочисленных шаблонов. Кроме того, приложение предоставляет доступ к бесплатной библиотеке стоковых изображений и видео для улучшения и разнообразия создаваемых материалов.

Однако главной особенностью Vids, как показано в демонстрационном видео, является возможность использования Gemini для автоматической вставки стоковых видеоматериалов, генерации сценария и даже создания ИИ-озвучки для презентации без необходимости записи собственного голоса.

Нейросеть Gemini уличили в сканировании PDF-файлов пользователей Google «Диска»

Стремительное развитие нейросетей давно вызывает опасения экспертов по поводу обеспечения конфиденциальности при взаимодействии с такими алгоритмами. На этой неделе появилось очередное подтверждение того, что эти опасение не напрасны. Пользователь соцсети X Кевин Бэнкстер (Kevin Bankster) обратил внимание на то, что нейросеть Gemini компании Google автоматически сканирует хранящиеся в Google Диске PDF-файлы, не получив на это явного согласия пользователя.

 Источник изображения: Google

Источник изображения: Google

«Только что открыл свою налоговую декларацию в Google Документах и Gemini без разрешения резюмировал её. Итак… Gemini автоматически сканирует даже личные документы, которые я открывают в Google Документах? <…> Я не просил об этом. Теперь мне нужно найти новые настройки, о которых мне никогда не сообщалось, чтобы отключить это», — написал Бэнкстер в своём аккаунте в сети X.

Что именно стало причиной такого поведения Gemini пока не ясно. По мнению самого алгоритма, настройки конфиденциальности, используемые для информирования Gemini, должны быть открыто доступны, но это не так. Это может означать, что, либо алгоритм выдаёт ложную информацию, либо некоторые внутренние системы Google явно функционируют некорректно. В любом случае, это выглядит не очень хорошо, даже если предположить, что нейросеть не использует личные данные пользователей для обучения.

Что касается Бэнкстера, то спустя некоторое время он написал, что смог найти в настройках опцию, активация которой позволяет Gemini сканировать документы в Gmail, Google Документах и Google Диске. При этом он отметил, что опция была отключена, но алгоритм по каким-то причинам всё равно просканировал документ и создал обобщённый текст на его основе. Бэнкстер считает, что проблема может быть связана с тем, что он зарегистрировался в Google Workspace Labs в 2023 году, из-за чего настройки Gemini могли примениться некорректно.

Google научила робота выполнять команды и ездить по офису с помощью нейросети Gemini

Команда Google DeepMind Robotics продемонстрировала на этой неделе, как обученный с помощью нейросети Google Gemini 1.5 Pro робот RT-2 может выполнять команды, озвученные на естественном языке, и перемещаться по офисному помещению.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

DeepMind Robotics опубликовала статью под названием «Mobility VLA: мультимодальная навигация по инструкциям с помощью VLM с длинным контекстом и топологическими графами», в которой в серии видеороликов робот выполняет различные задачи в офисном помещении площадью 9000 кв. футов (836 м2).

В одном из видеороликов сотрудник Google просит робота отвести его куда-нибудь, чтобы порисовать. «Хорошо, — отвечает тот, — дай мне минутку. Размышляем вместе с Gemini...». Затем робот подводит человека к лекционной доске размером со стену.

Во втором видео другой сотрудник предлагает роботу следовать указаниям на доске. Он рисует простую карту, на которой показано, как добраться до «Синей зоны». И снова робот на мгновение задумывается, прежде чем отправиться по указанному маршруту к месту, которое оказывается площадкой для испытаний робототехники. «Я успешно выполнил указания на доске», — докладывает робот.

Перед записью видеороликов роботов ознакомили с пространством с помощью решения «Мультимодальная навигация по инструкциям с демонстрационными турами (MINT)». Благодаря этому робот может перемещаться по офису в соответствии с указанными с помощью речи различными ориентирами. Затем DeepMind Robotics использовала иерархическую систему «Видение-Язык-Действие» (VLA), «которая сочетает в себе понимание окружающей среды и силу здравого смысла». После объединения процессов робот получил способность реагировать на написанные и нарисованные команды, а также на жесты и ориентироваться на местности.

Как утверждает Google, примерно в 90 % из 50 взаимодействий с сотрудниками роботы успешно выполняли данные им инструкции.

ИИ Gemini оказался совсем не так хорош в обработке больших объёмов данных, как заявляла Google

Новые исследования ставят под сомнение заявления Google о возможностях больших языковых моделей моделей Gemini по обработке больших объёмов данных, показывая, что их эффективность в анализе длинных текстов и видео значительно ниже заявленной.

 Источник изображения: Google

Источник изображения: Google

Недавние исследования выявили существенные недостатки в работе флагманских генеративных моделей искусственного интеллекта Google Gemini 1.5 Pro и 1.5 Flash, пишет издание TechCrunch. Google неоднократно подчёркивала способность Gemini обрабатывать огромные объёмы данных благодаря большому контекстному окну, утверждая, что модели могут анализировать документы объёмом в сотни страниц и искать информацию в видеозаписях. Однако два независимых исследования показали, что на практике эти модели справляются с такими задачами гораздо хуже.

Учёные из Массачусетского университета в Амхерсте (UMass Amherst), Института Аллена по искусственному интеллекту (Allen Institute for AI) и Принстона (Princeton University) тестировали Gemini на способность отвечать на вопросы о содержании художественных книг. Представленная для теста книга содержала около 260 000 слов (около 520 страниц). Результаты оказались неутешительными. Gemini 1.5 Pro правильно ответил только в 46,7 % случаев, а Gemini 1.5 Flash лишь в 20 % случаев. Далее усреднив результаты, выяснилось, что ни одна из моделей не смогла достичь точности ответов на вопросы выше случайной.

Маржена Карпинска (Marzena Karpinska), соавтор исследования, отметила: «Хотя такие модели, как Gemini 1.5 Pro, технически могут обрабатывать длинные контексты, мы видели много случаев, указывающих на то, что модели на самом деле не понимают содержание».

Второе исследование, проведённое учёными из Калифорнийского университета в Санта-Барбаре, фокусировалось на способности Gemini 1.5 Flash анализировать видеоконтент, а точнее слайды с изображениями. Результаты также оказались неудовлетворительными — из 25 изображений ИИ дал правильные ответы только в половине случаев, а при увеличении количества картинок точность ответов понизилась до 30 %, что ставит под сомнение эффективность модели в работе с мультимедийными данными.

Правда отмечается, что ни одно из исследований не прошло процесс рецензирования, и к тому же не тестировались самые последние версии моделей с контекстом в 2 миллиона токенов. Тем не менее, полученные результаты вызывают серьёзные вопросы в отношении реальных возможностей генеративных моделей ИИ в целом, и о том, насколько обоснованы маркетинговые заявления технологических гигантов.

Данные исследования появились на фоне растущего скептицизма в отношении генеративного ИИ. Так, недавние опросы международной консалтинговой компании Boston Consulting Group показали, что около половины опрошенных руководителей высшего звена не ожидают существенного повышения производительности от использования генеративного ИИ и обеспокоены возможными ошибками и проблемами с безопасностью данных.

Эксперты же призывают к разработке более объективных критериев оценки возможностей ИИ и к большему вниманию и независимой критике. Google пока не прокомментировал результаты этих исследований.

Apple может объявить о сделке с Google по интеграции Gemini в iPhone уже осенью

В рамках WWDC 2024 ранее в этом месяце Apple объявила о сотрудничестве с OpenAI для интеграции ChatGPT в свои устройства. Вместе с тем компания сообщила, что в будущем будут интегрированы и другие ИИ. Теперь сообщается, что Apple планирует заключить партнёрское соглашение с Google и позднее с Anthropic. Ожидается, что компания объявит о новых сделках этой осенью, одновременно с запуском собственной системы искусственного интеллекта Apple Intelligence в бета-версии.

 Источник изображения: Daniel Romero / Unsplash

Источник изображения: Daniel Romero / Unsplash

По информации Марка Гурмана (Mark Gurman) из Bloomberg, Apple готовится к значительному расширению возможностей искусственного интеллекта в своих устройствах. Помимо уже анонсированной интеграции с ChatGPT, компания планирует объявить о партнёрстве с Google для добавления чат-бота Gemini в свои продукты. Это объявление ожидается осенью, и намёки на потенциальную сделку уже были сделаны руководителем отдела программного обеспечения Apple Крейгом Федериги (Craig Federighi), также передаёт издание The Verge.

Кроме того, судя по слухам, фигурирует возможное сотрудничество с компанией Anthropic, хотя точные сроки анонса этого партнёрства пока неизвестны. В то же время, Гурман отмечает, что Apple отказалась от сотрудничества с Meta из-за вопросов конфиденциальности, связанных с её чат-ботом Llama.

Параллельно с интеграцией сторонних решений, Apple будет развивать собственную систему искусственного интеллекта, получившее название Apple Intelligence. Ожидается, что первая бета-версия этой системы будет представлена также осенью, однако пока неясно, будет ли она достаточно функциональна, чтобы стать основным стимулом для обновления устройств, таких как iPhone 15 Pro и Pro Max на более новые.

Эксперты полагают, что Apple рассматривает искусственный интеллект не только как набор функций для продвижения своих устройств, но и как потенциальный источник прямой прибыли. В будущем компания может внедрить платную подписку на некоторые возможности Apple Intelligence, а также получать долю от покупок в приложениях, связанных с подписками на чат-боты своих партнёров.

Интеграция сторонних ИИ-сервисов может стать хорошей временной альтернативой для Apple, так как компания не очень быстро разрабатывает собственную систему генеративного ИИ. При этом пользователи получат больший выбор и разнообразие функций искусственного интеллекта на устройствах Apple.

Google позволит создавать кастомных чат-ботов для индивидуального общения — в том числе, на основе знаменитостей и блогеров

Google разрабатывает технологию создания персонализированных чат-ботов, с которыми можно общаться как с реальными людьми или вымышленными персонажами. Пользователи смогут создавать собственных ботов, настраивая их стиль общения и характер.

 Источник изображения: Google

Источник изображения: Google

По данным The Information, подразделение Google Labs разрабатывает продукт для создания и общения с настраиваемыми чат-ботами, которые могут быть смоделированы на основе знаменитостей или созданы непосредственно самими пользователями. Чат-боты будут построены на основе моделей Gemini и позволят задавать их индивидуальную личность, а также внешний вид виртуального собеседника. Google рассматривает возможность официального сотрудничества с инфлюенсерами для создания ботов на их основе.

Учитывая возможности ИИ-моделей по работе с большими объёмами данных, проект отлично впишется в концепцию Google Labs и может быть запущен уже в этом году в качестве отдельного продукта. В перспективе планируется интегрировать этот продукт в YouTube, что даст пользователям возможность общаться с персонализированными чат-ботами прямо на платформе видеохостинга. Это будет эксперимент, который уже предлагает Meta в Instagram, правда, не вызывая пока особого интереса со стороны пользователей.

Отметим, что новый проект отличается от проекта Gems, который является просто кастомизированной версией Gemini для определённых нужд. Например, в Gemini Gems по умолчанию будет тренер по йоге, репетитор по математике и кулинарный гуру. А чтобы создать собственного личного помощника, придётся купить подписку Gemini Advanced. Gems был анонсирован на конференции Google I/O 2024 в мае и станет доступен широкой аудитории в ближайшее время.

Motorola и Google объединились для внедрения ИИ-функций в смартфоны Razr

Производитель смартфонов Motorola, принадлежащий китайской Lenovo Group Ltd., и Google Cloud объявили о заключении многолетнего партнёрства. Совместная деятельность компаний будет сконцентрирована на внедрении ИИ-функций Google в смартфоны Motorola, начиная с флагманской раскладушки Razr 50 Ultra.

 Источник изображения: Motorola

Источник изображения: Motorola

Новый сервис Moto AI будет интегрирован во все приложения для смартфона и предоставит пользователям расширенные возможности в плане взаимодействия с устройством. Речь идёт об использовании ИИ-алгоритмов для выполнения разного рода задач, включая генерацию изображений, создание контента, поиск информации, помощь в написании электронных писем и многом другом.

«Moto AI даёт пользователям возможность интуитивно создавать контент, персонализировать своё устройство, получать искомую информацию и достигать большего за меньшее время — всё это стало возможным благодаря самому передовому искусственному интеллекту Google», — заявил Дэн Дери (Dan Dery), вице-президент Motorola по искусственному интеллекту, экосистеме и интернет-сервисам.

По данным производителя, ИИ-функции будут доступны в новых смартфонах Razr сразу с момента их запуска. Цель Motorola заключается в том, чтобы максимально глубоко и естественно интегрировать новый опыт взаимодействия с нейросетями в свои устройства, сделав процесс работы с ИИ-функции максимально простым. Компания задействовала большие языковые модели из облачного сервиса Google Cloud Vertex AI, который обеспечивает доступ к флагманской нейросети Google Gemini и генератору изображений по текстовому описанию Imagen.

Во время объявления о партнёрстве между Motorola и Google были анонсированы две ИИ-функции: Magic Canvas и Style Sync. Magic Canvas — это интегрированный в смартфон генератор изображений по текстовому описанию. Созданный с его помощью контент пользователь может тут же добавить в SMS-сообщение, мессенджер, отправить по электронной почте или просто сохранить. Style Sync позволяет изменять пользовательский интерфейс, чтобы смартфон соответствовал стилю пользователя. С помощью камеры устройство распознаёт внешний облик владельца и автоматически настраивает обои, темы и ярлыки в соответствии с внешним видом пользователя.

В Motorola заявили, что Moto AI будет учиться по мере взаимодействия с пользователями, собирать контекст для лучшего понимания привычек и поведения, чтобы повысить уровень удобства при работе со смартфоном. Новые функции первым получит Moto Razr 50 Ultra, презентация которого должна состояться в ближайшее время.

Браузер Firefox версии Nightly получил ИИ-помощников ChatGPT и Gemini

Компания Mozilla добавила в экспериментальную версию своего браузера Firefox Nightly полный набор популярных чат-ботов. Интеграция ИИ-помощников в браузер позволит анализировать и обобщать найденную в интернете информацию.

 Источник изображения: Mozilla

Источник изображения: Mozilla

Уже на этой неделе пользователи смогут добавить в боковую панель ChatGPT, Google Gemini, HuggingChat и других известных чат-ботов. Правда, чтобы их протестировать в Firefox, необходимо установить экспериментальную версию браузера Nightly — это специальная «нестабильная платформа для тестирования и разработки».

После установки Nightly, перейдите в «Настройки» — «Nightly Experiments» и активируйте опцию «AI Chatbot Integration», далее выберите бота. Для его постоянного размещения на панели, нужно кликнуть правой кнопкой мыши по верхней панели браузера и выбрать «Настроить панель инструментов». Затем следует перетащить иконку чат-бота на верхнюю панель.

 Источник изображения: Mozilla

Источник изображения: Mozilla

Компания отмечает, что все модели чат-ботов находятся на стадии разработки и имеют как сильные, так и слабые стороны. «Ни один из них не идеален, и каждый выполняет какую-то задачу лучше, какую-то хуже». Кстати, использование чат-ботов полностью опционально и не встроено в основные функции Firefox.

Mozilla, на самом деле, следует тенденции, заданной другими разработчиками браузеров, которые внедряют чат-ботов в свои продукты. Например, Microsoft и Google уже представили Copilot и Gemini для Edge и Chrome, а Opera и DuckDuckGo также уже зашли в этот «океан», экспериментируя с ИИ. В компании отметили, что будут продолжать тестирование версии Nightly, прежде чем внедрять эту функцию в бета-версию и официальный релиз Firefox.

Политические дипфейки оказались самой популярным направлением в злоупотреблениях ИИ

Исследование Google DeepMind выявило, что злоупотребления искусственным интеллектом (ИИ) в форме дипфейков — реалистичных поддельных изображений политиков и знаменитостей или их видео и аудио — намного превосходят использование ИИ для кибератак.

 Источник изображения: Kandinsky

Источник изображения: Kandinsky

Согласно анализу, проведённому совместно с исследовательским подразделением группы Jigsaw, наиболее распространённой целью злоупотреблений генеративным ИИ стало формирование общественного мнения или влияние на него, что составило 27 % всех случаев использования искусственного интеллекта, сообщает Ars Technica.

Такие данные вызывают у экспертов серьёзные опасения по поводу влияния дипфейков на предстоящие во многих странах мира выборы в 2024 году. Отмечается, что в последние месяцы в социальных сетях, таких как TikTok, X и Instagram, появились дипфейки премьер-министра Великобритании Риши Сунака (Rishi Sunak) и других мировых лидеров. Избиратели Великобритании пойдут на всеобщие выборы уже на следующей неделе, и существует обеспокоенность тем, что, несмотря на усилия платформ социальных сетей по маркировке или удалению такого контента, аудитория может не распознать его как фейк, что потенциально повлияет на решения избирателей.

Арди Янжева (Ardi Janjeva), научный сотрудник Института Алана Тьюринга (The Alan Turing Institute), отмечает, что распространение контента, созданного ИИ, может «искажать наше коллективное понимание социально-политической реальности», что представляет долгосрочные риски для демократических процессов, даже если прямое влияние на поведение избирателей пока не доказано.

По мере роста популярности генеративных ИИ-продуктов, таких как ChatGPT от OpenAI и Gemini от Google, компании, разрабатывающие ИИ, начинают более пристально следить за потенциально вредным или неэтичным контентом, создаваемым их инструментами. Например, в мае OpenAI опубликовала исследование, показавшее использование их инструментов для создания и распространения дезинформации, связанное с Россией, Китаем, Ираном и Израилем.

Второй по распространённости мотивацией злоупотреблений стало получение финансовой выгоды, например, через предложение услуг по созданию дипфейков, включая создание изображений реальных людей, или использование генеративного ИИ для создания фейковых новостных статей.

Исследование показало, что в большинстве инцидентов используются легкодоступные инструменты, не требующие глубоких технических знаний, что в свою очередь только может увеличивать рост числа злоумышленников в среде ИИ.

Одновременно результаты исследования Google DeepMind повлияют на действия ИИ-компаний для проверки моделей на безопасность и оценку не только пользы, но и потенциального вреда от использования генеративного ИИ.


window-new
Soft
Hard
Тренды 🔥
Microsoft отныне разрешает OpenAI пользоваться облачными сервисами конкурентов 12 мин.
Windows 11 получила игровой оверлей Edge Game Assist в стиле Steam с подсказками и гайдами 2 ч.
Хардкорный режим, скачки и три сюжетных дополнения: Warhorse рассказала, как будет поддерживать Kingdom Come: Deliverance 2 после релиза 9 ч.
HPE проводит расследование в связи с заявлением хакеров о взломе её систем 9 ч.
«Мы создали CRPG нашей мечты»: продажи Warhammer 40,000: Rogue Trader превысили миллион копий 10 ч.
Создатели Lineage и Guild Wars отменили MMORPG во вселенной Horizon Zero Dawn и Horizon Forbidden West 11 ч.
Instagram начал переманивать блогеров из TikTok денежными бонусами до $50 тысяч в месяц 11 ч.
Eternal Strands, Starbound, Far Cry New Dawn и ещё шесть игр: Microsoft рассказала о ближайших новинках Game Pass 12 ч.
ИИ превзойдёт человеческий разум в течение двух-трёх лет, уверен глава Anthropic 13 ч.
Keep Driving вышла на финишную прямую — новый трейлер и дата релиза ностальгической RPG о путешествии по стране на своей первой машине 13 ч.