Опрос
|
реклама
Быстрый переход
Google добавила в Gemini поддержку аудиофайлов для всех платформ, включая iOS
08.09.2025 [21:10],
Анжелла Марина
Google добавила в приложение Gemini возможность загрузки аудиофайлов на всех платформах: Android, iOS и в веб-версии. Теперь можно загружать аудиозаписи в форматах MP3, M4A, WAV и других через меню «Файлы» на мобильных устройствах или через пункт «Загрузить файлы» в браузерной версии. ![]() Источник изображений: 9to5google.com Подписчики Google AI Pro или Google AI Ultra могут загружать аудио общей длительностью до трёх часов, тогда как бесплатные пользователи имеют ограничение в 10 минут, сообщается на сайте поддержки компании. Новая функция особенно полезна для транскрибирования аудиоматериалов и реализована в ответ на многочисленные запросы пользователей, так как процесс преобразования устной речи из аудио- или видеофайла в письменный текст оказался одним из самых востребованных. ![]() Ранее аналогичная поддержка уже была добавлена для видео — до 5 минут для бесплатных аккаунтов и до одного часа для платных, при максимальном размере файла 2 Гбайт, все остальные поддерживаемые типы файлов ограничены размером в 100 Мбайт. Дополнительно в чат Gemini можно добавить одну папку с кодом или один репозиторий GitHub, содержащий до 5000 файлов и не превышающий 100 Мбайт, уточняет 9to5Google. ZIP-архивы могут включать до 10 файлов. В общей сложности за одну сессию допускается загрузка до 10 файлов любого формата. ASML намеревается стать крупным инвестором ИИ-стартапа Mistral AI
08.09.2025 [04:58],
Алексей Разин
Нидерландская компания ASML является крупнейшим поставщиком литографических сканеров в мире, и опосредованно зарабатывает на буме систем искусственного интеллекта, поставляя соответствующее оборудование для выпуска чипов. Более близкое участие в бурно растущей отрасли ASML готова обеспечить через инвестиции в капитал французской Mistral AI. ![]() Источник изображения: ASML Последняя, как отмечает Reuters, в рамках привлечения средств через раунд C намерена получить 1,7 млрд евро, из которых 1,3 млрд евро могут поступить от ASML. Сделка позволит производителю литографического оборудования получить место для своего представителя в совете директоров Mistral AI. Без учёта раунда C, капитализация Mistral AI достигнет 10 млрд евро и сделает компанию самым дорогим представителем сегмента ИИ в Европе. В прошлом году Mistral AI оценивалась в $6 млрд, стартап поддерживает финансами и компания Nvidia. Наиболее оптимистичные источники оценивают капитализацию компании в $14 млрд с учётом новых раундов финансирования. Принято считать, что прогресс в развитии Mistral AI позволит европейским компаниям снизить зависимость от китайских и американских больших языковых моделей. Для самой ASML сделка с Mistral AI выгодна тем, что языковые модели этого стартапа позволят ускорить разработку новых литографических технологий и повысить эффективность использования уже выпускаемого оборудования. Конкурент ChatGPT от Apple может появиться раньше, чем все ожидали
08.09.2025 [01:08],
Анжелла Марина
Компания Apple готовит к выпуску собственный генеративный ИИ-движок для поиска и генерации ответов, который может дебютировать уже через шесть месяцев в составе обновлённой версии Siri. По сообщению 9to5Mac со ссылкой на Марка Гурмана (Mark Gurman) из Bloomberg, новый инструмент, известный внутри компании под кодовым названием World Knowledge Answers (WKA), создаётся как конкурент Perplexity и ChatGPT. ![]() Источник изображения: сгенерировано AI Первоначально функция будет доступна исключительно через переработанный интерфейс Siri, а в дальнейшем может быть интегрирована в браузер Safari и поисковую систему Spotlight. При этом внутри Apple продолжается тестирование технологии искусственного интеллекта (ИИ), в ходе которого выяснится, будут ли в основе нового поколения Siri использоваться собственные ИИ-алгоритмы компании или же технологии от внешних партнёров — таких как Google, Anthropic или OpenAI. Несмотря на то, что разработка продукта началась лишь несколько месяцев назад, выбор партнёров не повлияет на сроки запуска нового Siri на собственном движке WKA, что, вероятно, произойдёт в марте 2026 года. Google тайком удалила обещание стать углеродно-нейтральной к 2030 году — всему виной аппетиты ИИ
06.09.2025 [00:41],
Анжелла Марина
Google тихо удалила упоминание о цели по достижению нулевых выбросов углерода к 2030 году с главной страницы своего раздела об устойчивом развитии. Изменение совпало с резким ростом энергопотребления в связи со строительством дата-центров для искусственного интеллекта (ИИ). ![]() Источник изображения: Copilot Как пишет Tom's Hardware со ссылкой на канадское издание National Observer, компания переименовала раздел «Устойчивое развитие» и убрала заголовок, декларирующий эту амбициозную цель. Вместо этого акцент сместился на экологичность новых аппаратных решений, например, на использовании переработанного алюминия в смартфонах Google Pixel, при этом без упоминания общей углеродной политики компании. Представитель Google в своём заявлении подтвердил, что цель на 2030 год остаётся в силе. Он отметил, что по данным последнего отчёта компании, выбросы от центров обработки данных сократились на 12 % в 2024 году благодаря подключению новых источников чистой энергии, несмотря на растущие потребности. Однако на странице, посвящённой устойчивому развитию ЦОДов, формулировка вокруг обязательства изменились, теперь это подаётся скорее как смелая цель, а не как гарантия. На исчезновение формулировки на сайте об устойчивом развитии, по мнению экспертов, вероятно, повлияли два фактора: стремительный рост энергозатрат из-за масштабирования ИИ-инфраструктуры и смена курса климатической политики в США при администрации Дональда Трампа (Donald Trump). Также в прошлом году Google сообщила, что выбросы парниковых газов компании выросли на 48 % и в основном из-за строительства новых дата-центров под ИИ, что, по признанию Google, ставит под вопрос достижимость цели 2030 года. В свою очередь, американская администрация, убрав ряд государственных сайтов, посвящённых изменению климата, начала продвигать концепцию «супер чистых» угольных электростанций. Теперь, когда Google официально рассматривает свои климатические планы скорее как долгосрочную цель с неопределённым исходом, чем как твёрдое обязательство, дальнейшая стратегия компании в этой сфере, видимо, будет корректироваться. Google запустила ИИ-клавиатуру Gboard для всех пользователей Android
04.09.2025 [16:59],
Анжелла Марина
Google выпустила масштабное обновление для пользователей Android в рамках релиза Android 16 QPR1, внедрив ИИ-инструменты экранной клавиатуры Gboard на всех поддерживаемых устройствах и представив интерфейс для функции Quick Share. Ранее доступные только для смартфонов Pixel 10 функции умного редактирования текста теперь стали доступны всем владельцам Android-устройств. ![]() Источник изображений: Google Новые инструменты для написания текста в Gboard позволяют проверять текст, перефразировать его или добавлять больше деталей, при этом вся обработка происходит локально, без передачи данных в облако. Как отмечают в Google, хотя не каждому пользователю это пригодится, те, кто хочет сделать своё сообщение более профессиональным или, наоборот, более непринуждённым, найдут эту функцию полезной. Кроме того, ИИ-инструмент Gboard, анонсированный в прошлом месяце, теперь доступен на смартфонах других производителей. Ещё более интересным нововведением стал редизайн функции Quick Share, ранее известной как Nearby Share и предназначенной для быстрой и удобной передачи файлов. Quick Share включает отдельные вкладки для отправки и приёма файлов, упрощая выбор учётной записи, поиск подключённых устройств и передачу нескольких файлов одновременно. Вкладка «Получить» особенно удобна, так как отображает индикаторы прогресса загрузки, позволяет быстро отменить передачу или просмотреть содержимое, загружающееся на устройство пользователя. ![]() Также Google официально запустила навигацию по стикерам из Emoji Kitchen, ранее замеченную в тестовых сборках ещё весной. Теперь можно просматривать доступные комбинации стикеров без необходимости первоначального выбора двух разных эмодзи для создания нового уникального гибридного стикера. По данным 9to5Google, функция уже могла быть предустановлена на некоторых устройствах, но теперь активна для всех. Дополнительно вводится поддержка совместного прослушивания аудио через Bluetooth на устройствах с поддержкой LE Audio (стандарт для беспроводной передачи звука, построенный на базе Bluetooth Low Energy), что позволяет пользователям синхронно транслировать звук сразу на несколько гарнитур. Команда специалистов Meta✴ по ИИ, на которую Цукерберг потратил миллиарды долларов, уже трещит по швам
31.08.2025 [07:23],
Алексей Разин
В июне этого года Meta✴ вложила $14,3 млрд в капитал компании Scale AI, но главным приобретением по итогам этой сделки принято считать переход под крыло Марка Цукерберга (Mark Zuckerberg) её основателя Александра Вана (Alexandr Wang). Попытки сформировать костяк команды по разработке ИИ на основе крупных специалистов из других компаний, как отмечает TechCrunch, уже показывают несостоятельность инициативы. ![]() Источник изображения: Unsplash, Bojun Liu Поводом для источника говорить о наличии проблем с лояльностью у вновь испечённых сотрудников Meta✴ стало решение старшего вице-президента Scale AI Рубена Мэйера (Ruben Mayer) покинуть компанию всего через два месяца после перехода на новую работу. В Scale AI он потратил в общей сложности пять лет, а на новом месте в Meta✴ курировал работу команд, имеющих отношение к ИИ, но не вошёл в состав TBD Labs — вновь созданного подразделения, которое должно создавать сильный искусственный интеллект. При этом в эту команду вошли многие видные специалисты OpenAI, которых удалось переманить Цукербергу. Сам Мэйер в комментариях TechCrunch пояснил, что его роль в Meta✴ сводилась к общим организационным вопросам, непосредственно с данными и разработками она взаимодействовать не позволяла. Он также утверждает, что с первого дня был частью команды TBD Labs. На новом месте работы он не подчинялся непосредственно Александру Вану и был весьма доволен новым назначением, а покинуть компанию в сжатые сроки его вынудили «личные причины». Впрочем, для теперь уже бывшего работодателя это вряд ли сильно меняет результат. Примечательно, что после покупки крупного пакета акций Scale AI компания Meta✴ продолжает пользоваться услугами её конкурентов в сегменте маркировки данных для систем ИИ — Mercor и Surge. Инвестиции в Scale AI, по мнению некоторых источников, не особо влияют на ситуацию, поскольку представители TBD Labs считают её услуги не столь качественными, отдавая предпочтение решениям конкурентов. Исторически Scale AI использовала модель краудсорсинга и не очень-то тратилась на обработку данных, но современная конъюнктура рынка отдаёт предпочтение более качественным участникам процесса маркировки данных, которые являются экспертами в своей области. Это требует более высоких затрат на обработку массивов информации. Конкуренты движутся вперёд более уверенными темпами, чем Scale AI, которая вынуждена их догонять. Представители Meta✴ открыто отказываются признавать наличие проблем с качеством услуг Scale AI. Ситуация усугубляется тем, что если Meta✴ не ограничивает себя в работе с конкурентами Scale AI, то сохранившая частичную самостоятельность Scale AI столкнулась с отказом OpenAI и Google продолжать сотрудничество с ней после сделки с Meta✴. В июле Scale AI пришлось уволить около 200 сотрудников на направлении маркировки данных. Компания сохраняет надежду, что расширит штат на других направлениях деятельности. Не все руководители Scale AI после сделки с Meta✴ получили значимые кадровые позиции в структуре последней. Расширение штата специалистов ИИ компании Meta✴, как отмечают некоторые бывшие и настоящие сотрудники, происходит всё более хаотично, а некоторых «новобранцев» пугают бюрократические трудности, присущие большой корпорации, коей является Meta✴ Platforms. Она не только переманивала ценных специалистов у конкурентов в последние месяцы, но и заявила о готовности вложить десятки миллиардов долларов в строительство вычислительной инфраструктуры в США. На определённом этапе Марк Цукерберг понял, что Александр Ван является не лучшим кандидатом на руководство профильной лабораторией по разработке ИИ, поскольку он не обладает профильной подготовкой. При этом попытки привлечь на эту роль других кандидатов из конкурирующих стартапов успехом не увенчались. Некоторые выходцы из OpenAI, которых Meta✴ переманила, уже успели покинуть компанию. Уволились и некоторые сотрудники Meta✴, которые занимались разработкой генеративного искусственного интеллекта до всех этих структурных изменений. Часть из них на полном соблазнов рынке труда просто ухватилась за другие шансы. xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно
30.08.2025 [14:04],
Анжелла Марина
Компания xAI Илона Маска (Elon Musk), представила новую модель искусственного интеллекта для задач программирования под названием Grok Code Fast 1. Модель, которую компания описывает как «быструю и экономичную», призвана сократить время на медленные циклы обработки, характерные для других ИИ-ассистентов. ![]() Источник изображения: Mariia Shalabaieva/Unsplash Grok Code Fast 1 построена на новой архитектуре, для предварительного обучения которой был специально сформирован массив данных, содержащий готовый к применению программный код. Дополнительно модель была дообучена на реальных запросах на внесение изменений в код (Pull Request, PR) и эталонных задачах по написанию кода, что, по утверждению xAI, позволило адаптировать её к практическому использованию. Система обучена работе с такими инструментами и командами, как grep (глобальный поиск регулярных выражений), терминал и редакторы файлов, что делает её пригодной для интеграции в повседневные рабочие процессы внутри популярных интегрированных сред разработки (IDE). Модель поддерживает несколько языков программирования, включая TypeScript, Python, Java, Rust, C++ и Go. Компания заявляет, что Grok Code Fast 1 способна создавать проекты с нуля, отвечать на сложные вопросы по структуре кодовой базы и исправлять ошибки при минимальном участии разработчика. На тестовом наборе SWE-Bench-Verified, который широко используется для оценки возможностей ИИ в программировании, модель показала результат в 70,8%. При этом в xAI подчёркивают, что ключевую роль в формировании функциональности сыграла обратная связь от реальных разработчиков. Особое внимание xAI уделила отзывчивости модели. Благодаря новым методам обслуживания и оптимизации кеширования она может практически мгновенно выполнять множественные вызовы инструментов, что позволяет разработчикам видеть результаты в реальном времени без задержек. Главный директор по продукту GitHub Марио Родригес (Mario Rodriguez) отметил в ходе тестирования и скорость, и качество модели в решении агентных задач кодирования, добавив, что эта разработка представляет собой убедительную новую опцию для разработчиков. xAI подтвердила, что планирует регулярно обновлять Grok Code Fast 1, внедряя улучшения в течение нескольких дней, а не недель. Уже ведётся обучение новой версии модели, которая получит поддержку параллельных вызовов инструментов и увеличенной длины контекста. Как отмечает eWeek, тем самым xAI вступает в гонку с такими компаниями, как Microsoft (с GitHub Copilot) и OpenAI (с Codex), активно развивающими направление автономных ИИ-ассистентов для разработчиков. Для привлечения первых пользователей модель будет доступна бесплатно в течение одной недели через партнёрские платформы, включая GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, Opencode и Windsurf. По истечении пробного периода стоимость использования через API xAI составит $0,20 за миллион входных токенов, $1,50 за миллион выходных токенов и $0,02 за миллион закешированных входных токенов. xAI также опубликовала руководство по созданию эффективных промптов для Grok Code Fast. Хакер сделал конкурента ChatGPT соучастником вымогательской кампании: ИИ искал уязвимости и писал угрозы
27.08.2025 [23:15],
Анжелла Марина
Компания Anthropic раскрыла детали беспрецедентной хакерской атаки, в которой злоумышленник использовал её ИИ-ассистента для полной автоматизации масштабной кампании по краже данных с целью вымогательства. Инцидент затронул не менее 17 организаций, включая государственные учреждения, больницы, экстренные службы, религиозные организации и подрядчика оборонной отрасли. ![]() Источник изображения: Max Bender/Unsplash По сообщению PCMag, хакер автоматизировал атаку, использовав агентную среду выполнения Claude Code для поиска уязвимостей, сбора учётных данных и проникновения в защищённые сети организаций. ИИ помог злоумышленнику похитить личные записи, включая медицинские данные, финансовую информацию и правительственные идентификационные документы. Затем Claude проанализировал их на предмет размера выкупа, который варьировался от 75 000 до 500 000 долларов в биткоинах, а также сгенерировал визуально пугающие тексты с требованиями, отображавшиеся на компьютерах жертв. Несмотря на встроенные средства защиты, хакер смог обойти ограничения, загрузив в чат файл конфигурации с легендой о проведении тестирования сетевой безопасности якобы по официальному контракту. Этот файл содержал детальные методики атак и схемы последовательности выполнения задач на основе их значимости. В ходе всего процесса Claude использовался для сканирования уязвимых сетей с высоким процентом успеха, а также для создания вредоносного программного обеспечения и других инструментов, предназначенных для обхода защитных механизмов антивирусной программы Windows Defender. В отличие от предыдущих случаев, когда ИИ применялся хакерами лишь для вспомогательных задач, таких как написание фишинговых писем или анализ уязвимостей, в данном инциденте ИИ-модель выступала не только консультантом, но и активным исполнителем атак. Представители Anthropic подчеркнули, что это «свидетельствует о новом этапе в развитии киберпреступности с участием искусственного интеллекта, когда ИИ становится полноценным оператором в цепочке атак». Компания ожидает, что всё больше хакеров будут применять подобные методы. В том же отчёте упоминается о другом, возможно начинающем злоумышленнике, который использовал Claude для разработки, продвижения и продажи нескольких вариантов программ-вымогателей. По словам Anthropic, данный пользователь был полностью зависим от ответов ИИ и без помощи Claude не смог бы реализовать или устранить неполадки ключевых компонентов вредоносного ПО. Отдельно сообщается, что компания-разработчик антивирусного программного обеспечения ESET также обнаружила новую программу-вымогателя, использующую открытую модель OpenAI для генерации злонамеренного кода на заражённых устройствах. Google открыла доступ к Vids для всех: ИИ-видеоредактор стал бесплатным, но не без ограничений
27.08.2025 [19:21],
Анжелла Марина
Google запустила бесплатную версию видеоредактора Vids, работающего на базе искусственного интеллекта (ИИ). Ранее этот инструмент был доступен исключительно подписчикам Google Workspace и специальных тарифов с ИИ, но теперь все пользователи смогут использовать его базовую версию, которая включает шаблоны, стоковый медиаконтент и ограниченный набор ИИ-возможностей. ![]() Источник изображений: Google Vids, представленный в прошлом году как часть пакета Workspace, предназначен для быстрого создания видео-презентаций. Он помогает пользователям формировать раскадровки, предлагая сцены, подбирая стоковые изображения и фоновую музыку с помощью алгоритмов. Как сообщает The Verge, ссылаясь на слова директора по продукту Вишну Шиваджи (Vishnu Sivaji), упрощённая версия сохраняет значительную часть основных возможностей приложения, однако в ней отсутствуют некоторые новейшие ИИ-функции, анонсированные одновременно с открытием доступа. В частности, бесплатная версия не позволяет использовать ИИ-аватары для озвучивания текста от имени пользователя. ![]() В рамках обновления платные подписчики получат доступ к выбору из 12 готовых аватаров с уникальной внешностью и голосом, в которые можно загружать собственный сценарий. При этом функция создания персонального ИИ-аватара, аналогичная реализованной в Zoom, в Vids пока недоступна. На вопрос о такой возможности Шиваджи ответил, что компания не готова делиться планами на этот счёт. ![]() Также Google расширила возможности генерации видео: теперь можно создавать 8-секундные ролики на основе конкретного изображения, например фотографии нового продукта. Кроме того, появился инструмент, автоматически удаляющий из записи слова-паразиты и паузы, что полезно при подготовке собственных видео для презентаций. В компании считают, что новые функции помогут бизнесу сэкономить время и деньги при производстве видеоконтента различного назначения, в том числе обучающих роликов, так как, по словам Шиваджи, традиционное производство даже 10-минутного видео с живыми актёрами может занимать до полугода и обходиться в десятки тысяч долларов из-за затрат на написание сценария, его согласование, аренду студии, съёмку и монтаж. Microsoft представила VibeVoice — открытый ИИ, превращающий текст в полуторачасовые подкасты
27.08.2025 [17:36],
Анжелла Марина
Microsoft представила проект с открытым исходным кодом VibeVoice в области искусственного интеллекта — новую систему синтеза речи, способную генерировать из текста аудиоподкасты длительностью до 90 минут на английском или китайском языке. Технология уже доступна для тестирования любому желающему онлайн или с установкой на локальное устройство пользователя. ![]() Источник изображения: AI Разработчики охарактеризовали VibeVoice как новаторский фреймворк, созданный для генерации продолжительного по времени аудиоконтента с несколькими участниками непосредственно из текста. Как пишет Windows Central, система решает ключевые проблемы традиционных синтезаторов речи (TTS), такие как масштабируемость, согласованность характеристик голоса и естественность чередования реплик в диалоге. Модель способна синтезировать аудио продолжительностью до 90 минут с участием до четырёх уникальных голосов, что превосходит ограничения в 1-2 спикера, характерные для многих предыдущих ИИ-моделей. В настоящее время для тестирования доступны две версии модели: на 1,5 и 7 млрд параметров. Первая может генерировать до 90 минут аудио с длиной контекста 64 тыс. токенов, тогда как вторая, предположительно более качественная из-за большего размера, ограничена 45 минутами и окном в 32 тысячи токенов. Также ожидается выпуск облегчённой версии на 0,5 млрд параметров, предназначенной для работы в реальном времени. Для локальной работы меньшая модель требует около 7 Гбайт видеопамяти, а для большей может потребоваться до 18 Гбайт VRAM. На текущий момент ИИ-модель VibeVoice обучена только на английском и китайском языках, включая мандаринскую разновидность (севернокитайский или путунхуа). Однако в Microsoft отмечают, что в будущих версиях планируется расширение поддержки других языков. Система способна передавать эмоции, управлять сменой реплик между участниками и генерировать естественные диалоги, хотя попытки воспроизведения музыки пока остаются неудачными. Голоса звучат довольно реалистично, однако их искусственное происхождение остаётся заметным. В перспективе разработчики рассматривают возможность интеграции функции клонирования голоса. Разработчики отмечают, что при запуске потоковой версии аудиогенерации VibeVoice может быть интегрирована в чат-ассистенты, позволяя обходиться без внешних серверов. Дополнительные сведения, включая инструкции по установке и настройке, доступны в официальном репозитории VibeVoice в GitHub и на платформе Hugging Face. ИИ-браузер Perplexity Comet без раздумий слил мошенникам данные банковской карты
22.08.2025 [00:47],
Анжелла Марина
Новый ИИ-браузер Comet, разработанный компанией Perplexity, оказался уязвим к фишинговым атакам и инъекциям промптов. Исследователи из Guardio продемонстрировали, что система может выполнять действия от имени пользователя без проверки подлинности сайтов и ссылок, включая ввод конфиденциальных данных, сообщает PCWorld. ![]() Источник изображения: Disney/Perplexity Специалисты Guardio провели серию тестов, моделирующих реальные сценарии атак. В одном из случаев ИИ получил указание помочь с покупкой Apple Watch на поддельном сайте, имитирующем Walmart. Браузер не распознал мошеннический URL-адрес (walmart-cart-cash.lovable.app) и без проверки подлинности страницы автоматически ввёл данные кредитной карты и адрес пользователя, завершив процесс оформления заказа. Аналогичным образом Comet отреагировал и на фальшивое письмо от Wells Fargo, отправленное с адреса в домене Proton Mail. При получении ссылки из письма браузер перешёл по ней без проверки источника и автоматически заполнил учётные данные пользователя. В обоих случаях система не применила базовых мер предосторожности, которые ожидаются от ИИ, обладающего функциями агентного поведения, подчеркнули в Guardio. Кроме того, исследователи обнаружили, что через атаку с помощью инъекции промптов можно заставить Comet обходить капчу (CAPTCHA) в сценариях, где это предусмотрено. Эта уязвимость потенциально позволяет использовать браузеры в составе распределённой сети для автоматизированных атак, напоминающей ботнет, но с участием ИИ-агентов. Браузер Comet был запущен только в прошлом месяце и доступен исключительно для подписчиков Perplexity с оплатой $200 в год, хотя в компании планируют сделать его бесплатным в будущем. При этом Perplexity рассматривает возможность покупки браузера Chrome в случае, если Google будет вынуждена его продать. Однако, как отмечают эксперты, у компании нет необходимых для такой сделки средств, хотя ранее, как сообщал 3DNews, Perplexity предлагала выкупить Google Chrome за $34,5 млрд. Google отлучила «Ассистента» от умного дома — представлен продвинутый ИИ-помощник Gemini for Home
21.08.2025 [00:08],
Анжелла Марина
Google объявила о запуске нового голосового помощника Gemini for Home для умного дома. Ассистент, работающий на основе искусственного интеллекта Gemini, заменит стандартный Google Assistant на умных колонках и дисплеях Nest уже в октябре этого года, сообщает издание The Verge. ![]() Источник изображения: Curtis Berry/Unsplash Новый помощник будет управлять умным домом, музыкой, таймерами и отвечать на вопросы, активируясь по фразе «Hey Google». По словам руководителя отдела продуктов Google Home и Nest Аниша Каттукарана (Anish Kattukaran), использование Gemini for Home будет восприниматься как нечто принципиально новое. Ассистент применяет продвинутое логическое мышление и возможности поиска, выполняет более сложные задачи и взаимодействует на естественном языке. Он способен лучше понимать контекст, нюансы и намерения пользователя. Например, он корректно обработает запросы вроде «выключи свет везде, кроме спальни», «поставь песню из летнего блокбастера этого года про гоночные машины», а также упростит создание списков, напоминаний и событий в календаре. Ключевым улучшением станет интеграция функции Gemini Live, которая обеспечит продолжительный голосовой диалог без необходимости постоянно повторять «Hey Google». Это откроет новые сценарии использования — от детализированной помощи в приготовлении еды из имеющихся продуктов и планирования крупных покупок до решения бытовых проблем или генерации сказок на ночь. Интересно, что аналогичные возможности уже присутствуют в Alexa Plus от Amazon, что ставит Google в условия прямой конкуренции. Развёртывание нового помощника будет проходить постепенно и осторожно, через программу предварительного тестирования Google Home Public Preview. Такая стратегия связана с повышенными рисками интеграции генеративного ИИ в умный дом, где он потенциально может управлять критически важными устройствами, такими как замки, бытовая техника и системы климат-контроля. Стоимость платного тарифа Gemini for Home пока не раскрыта, но расширенные функции Gemini Live, скорее всего, войдут в премиальную подписку. Google может пойти по пути Amazon и включить тариф в свои пакеты Nest Aware или Google One. Это предположение подкрепляется недавним повышением цены на Nest Aware до $10 в месяц без существенных обновлений функциональности. Помощник будет работать для всех членов семьи и гостей. Запуск начнётся через программу раннего доступа, при этом Google предложит не только платный, но и бесплатный уровень подписки. Тысячи приватных диалогов с Grok утекли в поиск Google
20.08.2025 [18:27],
Анжелла Марина
Тысячи диалогов пользователей с чат-ботом Grok компании xAI Илона Маска (Elon Musk), оказались доступны через поисковые системы, сообщает TechCrunch со ссылкой на Forbes. Каждый раз, когда пользователь Grok нажимает кнопку «Поделиться» в разговоре с чат-ботом, создаётся уникальный URL-адрес, который затем можно передать по электронной почте, в текстовом сообщении или в социальных сетях. ![]() Источник изображения: Mariia Shalabaieva/Unsplash Эти URL-адреса с приватными диалогами могут быть проиндексированы поисковыми роботами Google, Bing и DuckDuckGo и появиться в результатах поиска глобальной сети. Функция, позволяющая генерировать публичные URL, аналогичным образом недавно затронула и пользователей чат-ботов от компаний Meta✴ и OpenAI, и в случае с Grok она также привела к утечке диалогов с небезопасным контентом — среди них запросы о взломе криптокошельков, откровенные беседы с персонифицированными ИИ-персонажами и просьбы предоставить инструкции по синтезу запрещённых препаратов. Хотя в правилах использования сервиса xAI прямо запрещено применять бота для поощрения действий, «критически вредящих человеческой жизни», а также для разработки «биологического, химического оружия или оружия массового уничтожения», однако это не помешало пользователям направлять соответствующие запросы к Grok. Согласно анализу диалогов, оказавшихся в открытом доступе через Google, бот предоставлял пошаговые инструкции по изготовлению запрещённых препаратов, перечислял методы совершения суицида, давал советы по созданию взрывоопасных устройств и даже сформулировал детальный план убийства самого Маска. Представители xAI пока не ответили на запрос о комментарии, а также не уточнили, с какого времени ссылки на диалоги с Grok начали индексироваться поисковыми системами. Напомним, что в конце прошлого месяца пользователи ChatGPT сообщили о похожей ситуации — их переписки также попадали в поисковую выдачу Google, на что OpenAI отреагировала, назвав это «кратковременным экспериментом». В ответ в Х появилось сообщение от компании Маска с фразой «Grok ftw» с комментарием, что в xAI «нет функции "Поделиться"» и что «конфиденциальность — её приоритет». Meta✴ снова «перезагрузила» свою ИИ-команду в попытке догнать OpenAI и Google
20.08.2025 [04:29],
Анжелла Марина
Meta✴ официально подтвердила реорганизацию своего подразделения искусственного интеллекта (ИИ), расформировав существующую структуру и создав четыре новые специализированные группы в ответ на растущее отставание от таких конкурентов, как OpenAI, Anthropic и Google DeepMind. Изменения, о которых стало известно из внутренней служебной записки, были объявлены основателем Scale AI Александром Ваном (Alexandr Wang), присоединившимся к Meta✴ в качестве директора ИИ-подразделения в июне. ![]() Источник изображения: Meta✴ Новая структура получила название Meta✴ Superintelligence Labs (MSL). Её центральным элементом, как сообщает TechCrunch, станет группа под названием TBD Labs, которую возглавит лично Ван. Основное внимание этой команды будет сосредоточено на разработке базовых моделей, включая серию Llama, последняя версия которой была выпущена в апреле. Остальные три подразделения займутся фундаментальными исследованиями, интеграцией ИИ в продукты и развитием инфраструктуры. По данным Bloomberg, генеральный директор Meta✴ Марк Цукерберг (Mark Zuckerberg) лично участвовал в подборе кадров для нового подразделения, что свидетельствует о стратегической важности этого направления для компании. На прошлой неделе сообщалось о том, что компания Meta✴ в четвёртый раз за последние шесть месяцев намеревается изменить структуру своих подразделений, занимающихся разработкой искусственного интеллекта. Окончательное подтверждение последовало 19 августа от Bloomberg и The New York Times. Meta✴ запустила ИИ-дубляж с липсинком для роликов в Instagram✴ и Facebook✴
20.08.2025 [00:32],
Анжелла Марина
Компания Meta✴ начала внедрять инструмент искусственного интеллекта (ИИ) для автоматического перевода видео на другой язык в формате коротких вертикальных видеороликов (Reels) на Facebook✴ и Instagram✴. Новая функция призвана стереть языковые барьеры для создателей контента и расширить их аудиторию не только за счёт перевода, но и за счёт синхронизации движений речевого аппарата человека. ![]() Источник изображений: Meta✴ Функция изначально доступна для перевода между английским и испанским языками и активируется через переключатель «Перевод голоса с помощью Meta✴ AI» (Translate voices with Meta✴ AI) в меню публикации. ИИ также адаптирует, точнее подгоняет озвучку под тембр голоса пользователя. На данный момент инструмент доступен авторам в Facebook✴ с числом подписчиков от тысячи и выше, а также всем пользователям с публичными аккаунтами в Instagram✴, сообщает The Verge. ![]() Перед публикацией пользователь может добавить синхронизацию губ и проверить результат перевода. После публикации система автоматически покажет переведённые видео пользователям, предпочитающим соответствующий язык, а на сами ролики добавится метка, указывающая, что перевод выполнен с помощью ИИ от Meta✴. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |