Сегодня 17 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ai
Быстрый переход

Создатели Shorts на YouTube получат ИИ для оживления фото

На YouTube появятся новые инструменты на основе искусственного интеллекта для создания коротких видео (Shorts). В рамках мероприятия Made on YouTube компания анонсировала адаптированную версию модели Google Veo 3, а также функции редактирования, создания ремиксов и стилизации контента. Нововведение станет доступно в ближайшие месяцы.

 Источник изображения: YouTube

Источник изображения: YouTube

Адаптированная версия Veo 3 Fast позволяет генерировать видеоклипы с разрешением 480 пикселей, низкой задержкой передачи данных и возможностью добавления звукового сопровождения. Появится функция наложения видео на статичное изображение, благодаря технологии, фиксирующей и передающей движения между объектами, которая позволит «оживлять» картинки. Также появится возможность применять к роликам различные художественные стили, например, поп-арт или оригами, и добавлять по текстовому описанию новые объекты.

Другим интересным инструментом стал Speech to Song, позволяющий превращать диалоги из видео в музыкальные треки. Для создания таких треков используется музыкальная ИИ-модель Google Lyria 2, при этом авторы смогут задавать любое настроение композиции.

Отдельно будет внедрена функция Edit with AI для преобразования необработанных видеозаписей из камеры в черновики Shorts с последующим автоматическим редактированием и выбором лучших моментов, а также добавлением музыки, переходов и даже озвучки с реакцией на происходящее в кадре — правда, пока только на английском или хинди. Эксперименты с этой функцией уже ведутся в приложении YouTube Create, а в ближайшие недели её распространение расширится на отдельные рынки.

Новые функции начнут распространяться в США, Великобритании, Канаде, Австралии и Новой Зеландии, с последующим расширением на другие регионы.

Китайская Tencent увела топ-учёного из OpenAI — цена вопроса $14 млн

Компания Tencent — один из крупнейших в мире технологических и интернет-холдингов из Китая, наняла ведущего исследователя в области искусственного интеллекта (ИИ) из американской компании OpenAI. Об этом сообщил Bloomberg со ссылкой на осведомлённые источники, которые назвали этот переход одним из самых громких случаев перехода американских ИИ-специалистов на работу в Китай.

 Источник изображения: Tencent

Источник изображения: Tencent

Tencent, базирующаяся в Шэньчжэне (Китай), известная разработкой и распространением видеоигр, онлайн-сервисов, платёжных систем и других продуктов, наняла Яо Шунью (Yao Shunyu) для работы по интеграции искусственного интеллекта в свои сервисы. Согласно его профилю в LinkedIn, до прихода в OpenAI он работал в Google и Принстонском университете.

После публикаций в местных СМИ о том, что Яо присоединится к компании за пакет выплат, превышающий 100 миллионов юаней (около $14 млн), Tencent разместила в своём аккаунте в WeChat скриншот заголовка на эту тему, который был помечен словом «слухи». При этом не было уточнено, какая именно часть информации была некорректной. В OpenAI подтвердили факт ухода Яо из компании, но не указали его дальнейшее место работы. Представители Tencent и сам Яо Шунью не ответили на запросы о комментариях.

Согласно его странице на GitHub, Яо является автором и соавтором около 10 научных работ и специализируется на изучении ИИ-агентов. Среди его работ — «Языковые агенты: от предсказания следующего токена к цифровой автоматизации» и «Когнитивная архитектура для языковых агентов». Согласно его профилю в LinkedIn, он окончил ведущий китайский научно-инженерный университет Цинхуа и получил докторскую степень в области компьютерных наук в Принстонском университете.

В этом году технологические компании стали вести ожесточённую борьбу за специалистов в сфере ИИ. Как ранее сообщал 3DNews, такие корпорации, как Meta, предлагали бонусы за переход на работу в размере до $100 млн, пытаясь переманить сотрудников у конкурентов. По словам одного из источников, Tencent, предложив Яо компенсационный пакет в размере до 100 миллионов юаней, не уточнила условий для достижения верхнего предела этого диапазона оплаты.

«Британская энциклопедия» подала в суд на Perplexity за копирование текстов

«Британская энциклопедия» (Encyclopedia Britannica) и её дочерняя компания Merriam-Webster подали иск в федеральный суд Нью-Йорка против компании Perplexity AI, обвинив её в нарушении авторских прав и товарных знаков. В иске обе компании утверждают, что система ответов Perplexity копирует их веб-сайты, крадёт интернет-трафик и занимается плагиатом их материалов, защищённых авторским правом.

 Источник изображения: Perplexity

Источник изображения: Perplexity

Суть иска заключается в одном слове: «плагиат». Сетевой журнал The Verge ссылается на судебные документы, в которых представлены сравнительные скриншоты, демонстрирующие, что ответы Perplexity идентичны определениям из словаря Merriam-Webster. Также система выдаёт неполные или придуманные искусственным интеллектом ответы, используя имена данных компаний, имеющих многовековую историю деятельности.

Perplexity, позиционирующая себя как конкурента Google Search, ранее уже подвергалась нападкам за то, что якобы «неправомерно заимствует и перерабатывает оригинальный контент без надлежащих ссылок», а также применяет веб-скрапинг, нелегально обходя систему блокировок сайтов от роботов. В частности, претензии были предъявлены со стороны таких медиа-гигантов, как Forbes, The New York Times, BBC, News Corp — материнской компании The Wall Street Journal и New York Post.

Тем не менее, некоторые издания, включая Time и Los Angeles Times, участвуют в программе совместного распределения рекламных доходов с Perplexity, а World History Encyclopedia, ещё одна крупная энциклопедия, запустила 8 сентября чат-бота на базе технологии Perplexity, позволяющего пользователям исследовать её базу академических источников.

Власти США начали расследование безопасности ИИ-чат-ботов для детей: под прицелом Google, Meta✴, OpenAI и xAI

Федеральная торговая комиссия США (FTC) инициировала расследование в отношении семи крупных технологических компаний, включая Alphabet, Meta, OpenAI, xAI и Snap, с целью выяснения, может ли их искусственный интеллект (ИИ) негативно влиять на детей и подростков. Регулятор издал приказы, обязывающие эти компании предоставить подробную информацию о мерах безопасности, применяемых к их чат-ботам, которые способны имитировать человеческое общение и межличностные отношения.

 Источник изображения: Emiliano Vittoriosi/Unsplash

Источник изображения: Emiliano Vittoriosi/Unsplash

Регулятор направил компаниям предписания с требованием раскрыть подробности о мерах безопасности, применяемых к чат-ботам, способным имитировать человеческое общение и межличностные отношения. В частности, FTC интересуется, как компании оценивают риски, связанные с ИИ-компаньонами, каким образом они монетизируют вовлечённость пользователей, разрабатывают и утверждают виртуальных персонажей, используют или передают личные данные, а также какие механизмы контроля и снижения возможного вреда применяют.

Глава FTC Эндрю Фергюсон (Andrew Ferguson) подчеркнул, что защита детей в интернете остаётся для ведомства ключевым приоритетом наряду с поддержкой инноваций в критически важных секторах экономики.

Реакция компаний оказалась разной. Meta отказалась от комментариев для CNBC, а Alphabet, Snap и xAI пока не ответили на запросы. Представитель OpenAI заявил в интервью CNBC, что приоритетом компании является обеспечение одновременно полезности и безопасности ChatGPT для всех пользователей, особенно для молодых, и что OpenAI готова к открытому сотрудничеству с регулятором. В список проверяемых также вошли Character Technologies (создатель чат-бота Character.ai) и принадлежащий Meta Instagram✴.

Повышенное внимание FTC к этой теме связано с недавними инцидентами. Так, после расследования Reuters сенатор Джош Хоули (Josh Hawley) инициировал проверку в отношении Meta: репортаж показал, что её чат-боты могли вести опасные беседы с детьми. В ответ Meta временно ужесточила правила для своих ИИ, запретив обсуждение тем, связанных с суицидом, членовредительством и расстройствами пищевого поведения, а также ограничив «чувственные» диалоги. Аналогичные меры предпринимает и OpenAI: компания объявила о пересмотре работы ChatGPT после иска семьи, обвинившей чат-бота в косвенной причастности к смерти подростка.

Google добавила в Gemini поддержку аудиофайлов для всех платформ, включая iOS

Google добавила в приложение Gemini возможность загрузки аудиофайлов на всех платформах: Android, iOS и в веб-версии. Теперь можно загружать аудиозаписи в форматах MP3, M4A, WAV и других через меню «Файлы» на мобильных устройствах или через пункт «Загрузить файлы» в браузерной версии.

 Источник изображения: 9to5google.com

Источник изображений: 9to5google.com

Подписчики Google AI Pro или Google AI Ultra могут загружать аудио общей длительностью до трёх часов, тогда как бесплатные пользователи имеют ограничение в 10 минут, сообщается на сайте поддержки компании. Новая функция особенно полезна для транскрибирования аудиоматериалов и реализована в ответ на многочисленные запросы пользователей, так как процесс преобразования устной речи из аудио- или видеофайла в письменный текст оказался одним из самых востребованных.

Ранее аналогичная поддержка уже была добавлена для видео — до 5 минут для бесплатных аккаунтов и до одного часа для платных, при максимальном размере файла 2 Гбайт, все остальные поддерживаемые типы файлов ограничены размером в 100 Мбайт.

Дополнительно в чат Gemini можно добавить одну папку с кодом или один репозиторий GitHub, содержащий до 5000 файлов и не превышающий 100 Мбайт, уточняет 9to5Google. ZIP-архивы могут включать до 10 файлов. В общей сложности за одну сессию допускается загрузка до 10 файлов любого формата.

ASML намеревается стать крупным инвестором ИИ-стартапа Mistral AI

Нидерландская компания ASML является крупнейшим поставщиком литографических сканеров в мире, и опосредованно зарабатывает на буме систем искусственного интеллекта, поставляя соответствующее оборудование для выпуска чипов. Более близкое участие в бурно растущей отрасли ASML готова обеспечить через инвестиции в капитал французской Mistral AI.

 Источник изображения: ASML

Источник изображения: ASML

Последняя, как отмечает Reuters, в рамках привлечения средств через раунд C намерена получить 1,7 млрд евро, из которых 1,3 млрд евро могут поступить от ASML. Сделка позволит производителю литографического оборудования получить место для своего представителя в совете директоров Mistral AI. Без учёта раунда C, капитализация Mistral AI достигнет 10 млрд евро и сделает компанию самым дорогим представителем сегмента ИИ в Европе. В прошлом году Mistral AI оценивалась в $6 млрд, стартап поддерживает финансами и компания Nvidia. Наиболее оптимистичные источники оценивают капитализацию компании в $14 млрд с учётом новых раундов финансирования.

Принято считать, что прогресс в развитии Mistral AI позволит европейским компаниям снизить зависимость от китайских и американских больших языковых моделей. Для самой ASML сделка с Mistral AI выгодна тем, что языковые модели этого стартапа позволят ускорить разработку новых литографических технологий и повысить эффективность использования уже выпускаемого оборудования.

Конкурент ChatGPT от Apple может появиться раньше, чем все ожидали

Компания Apple готовит к выпуску собственный генеративный ИИ-движок для поиска и генерации ответов, который может дебютировать уже через шесть месяцев в составе обновлённой версии Siri. По сообщению 9to5Mac со ссылкой на Марка Гурмана (Mark Gurman) из Bloomberg, новый инструмент, известный внутри компании под кодовым названием World Knowledge Answers (WKA), создаётся как конкурент Perplexity и ChatGPT.

 Источник изображения: сгенерировано AI

Источник изображения: сгенерировано AI

Первоначально функция будет доступна исключительно через переработанный интерфейс Siri, а в дальнейшем может быть интегрирована в браузер Safari и поисковую систему Spotlight. При этом внутри Apple продолжается тестирование технологии искусственного интеллекта (ИИ), в ходе которого выяснится, будут ли в основе нового поколения Siri использоваться собственные ИИ-алгоритмы компании или же технологии от внешних партнёров — таких как Google, Anthropic или OpenAI.

Несмотря на то, что разработка продукта началась лишь несколько месяцев назад, выбор партнёров не повлияет на сроки запуска нового Siri на собственном движке WKA, что, вероятно, произойдёт в марте 2026 года.

Google тайком удалила обещание стать углеродно-нейтральной к 2030 году — всему виной аппетиты ИИ

Google тихо удалила упоминание о цели по достижению нулевых выбросов углерода к 2030 году с главной страницы своего раздела об устойчивом развитии. Изменение совпало с резким ростом энергопотребления в связи со строительством дата-центров для искусственного интеллекта (ИИ).

 Источник изображения: Copilot

Источник изображения: Copilot

Как пишет Tom's Hardware со ссылкой на канадское издание National Observer, компания переименовала раздел «Устойчивое развитие» и убрала заголовок, декларирующий эту амбициозную цель. Вместо этого акцент сместился на экологичность новых аппаратных решений, например, на использовании переработанного алюминия в смартфонах Google Pixel, при этом без упоминания общей углеродной политики компании.

Представитель Google в своём заявлении подтвердил, что цель на 2030 год остаётся в силе. Он отметил, что по данным последнего отчёта компании, выбросы от центров обработки данных сократились на 12 % в 2024 году благодаря подключению новых источников чистой энергии, несмотря на растущие потребности. Однако на странице, посвящённой устойчивому развитию ЦОДов, формулировка вокруг обязательства изменились, теперь это подаётся скорее как смелая цель, а не как гарантия.

На исчезновение формулировки на сайте об устойчивом развитии, по мнению экспертов, вероятно, повлияли два фактора: стремительный рост энергозатрат из-за масштабирования ИИ-инфраструктуры и смена курса климатической политики в США при администрации Дональда Трампа (Donald Trump). Также в прошлом году Google сообщила, что выбросы парниковых газов компании выросли на 48 % и в основном из-за строительства новых дата-центров под ИИ, что, по признанию Google, ставит под вопрос достижимость цели 2030 года. В свою очередь, американская администрация, убрав ряд государственных сайтов, посвящённых изменению климата, начала продвигать концепцию «супер чистых» угольных электростанций.

Теперь, когда Google официально рассматривает свои климатические планы скорее как долгосрочную цель с неопределённым исходом, чем как твёрдое обязательство, дальнейшая стратегия компании в этой сфере, видимо, будет корректироваться.

Google запустила ИИ-клавиатуру Gboard для всех пользователей Android

Google выпустила масштабное обновление для пользователей Android в рамках релиза Android 16 QPR1, внедрив ИИ-инструменты экранной клавиатуры Gboard на всех поддерживаемых устройствах и представив интерфейс для функции Quick Share. Ранее доступные только для смартфонов Pixel 10 функции умного редактирования текста теперь стали доступны всем владельцам Android-устройств.

 Источник изображения: Google

Источник изображений: Google

Новые инструменты для написания текста в Gboard позволяют проверять текст, перефразировать его или добавлять больше деталей, при этом вся обработка происходит локально, без передачи данных в облако. Как отмечают в Google, хотя не каждому пользователю это пригодится, те, кто хочет сделать своё сообщение более профессиональным или, наоборот, более непринуждённым, найдут эту функцию полезной. Кроме того, ИИ-инструмент Gboard, анонсированный в прошлом месяце, теперь доступен на смартфонах других производителей.

Ещё более интересным нововведением стал редизайн функции Quick Share, ранее известной как Nearby Share и предназначенной для быстрой и удобной передачи файлов. Quick Share включает отдельные вкладки для отправки и приёма файлов, упрощая выбор учётной записи, поиск подключённых устройств и передачу нескольких файлов одновременно. Вкладка «Получить» особенно удобна, так как отображает индикаторы прогресса загрузки, позволяет быстро отменить передачу или просмотреть содержимое, загружающееся на устройство пользователя.

Также Google официально запустила навигацию по стикерам из Emoji Kitchen, ранее замеченную в тестовых сборках ещё весной. Теперь можно просматривать доступные комбинации стикеров без необходимости первоначального выбора двух разных эмодзи для создания нового уникального гибридного стикера. По данным 9to5Google, функция уже могла быть предустановлена на некоторых устройствах, но теперь активна для всех.

Дополнительно вводится поддержка совместного прослушивания аудио через Bluetooth на устройствах с поддержкой LE Audio (стандарт для беспроводной передачи звука, построенный на базе Bluetooth Low Energy), что позволяет пользователям синхронно транслировать звук сразу на несколько гарнитур.

Команда специалистов Meta✴ по ИИ, на которую Цукерберг потратил миллиарды долларов, уже трещит по швам

В июне этого года Meta вложила $14,3 млрд в капитал компании Scale AI, но главным приобретением по итогам этой сделки принято считать переход под крыло Марка Цукерберга (Mark Zuckerberg) её основателя Александра Вана (Alexandr Wang). Попытки сформировать костяк команды по разработке ИИ на основе крупных специалистов из других компаний, как отмечает TechCrunch, уже показывают несостоятельность инициативы.

 Источник изображения: Unsplash, Bojun Liu

Источник изображения: Unsplash, Bojun Liu

Поводом для источника говорить о наличии проблем с лояльностью у вновь испечённых сотрудников Meta стало решение старшего вице-президента Scale AI Рубена Мэйера (Ruben Mayer) покинуть компанию всего через два месяца после перехода на новую работу. В Scale AI он потратил в общей сложности пять лет, а на новом месте в Meta курировал работу команд, имеющих отношение к ИИ, но не вошёл в состав TBD Labs — вновь созданного подразделения, которое должно создавать сильный искусственный интеллект. При этом в эту команду вошли многие видные специалисты OpenAI, которых удалось переманить Цукербергу.

Сам Мэйер в комментариях TechCrunch пояснил, что его роль в Meta сводилась к общим организационным вопросам, непосредственно с данными и разработками она взаимодействовать не позволяла. Он также утверждает, что с первого дня был частью команды TBD Labs. На новом месте работы он не подчинялся непосредственно Александру Вану и был весьма доволен новым назначением, а покинуть компанию в сжатые сроки его вынудили «личные причины». Впрочем, для теперь уже бывшего работодателя это вряд ли сильно меняет результат.

Примечательно, что после покупки крупного пакета акций Scale AI компания Meta продолжает пользоваться услугами её конкурентов в сегменте маркировки данных для систем ИИ — Mercor и Surge. Инвестиции в Scale AI, по мнению некоторых источников, не особо влияют на ситуацию, поскольку представители TBD Labs считают её услуги не столь качественными, отдавая предпочтение решениям конкурентов. Исторически Scale AI использовала модель краудсорсинга и не очень-то тратилась на обработку данных, но современная конъюнктура рынка отдаёт предпочтение более качественным участникам процесса маркировки данных, которые являются экспертами в своей области. Это требует более высоких затрат на обработку массивов информации. Конкуренты движутся вперёд более уверенными темпами, чем Scale AI, которая вынуждена их догонять. Представители Meta открыто отказываются признавать наличие проблем с качеством услуг Scale AI.

Ситуация усугубляется тем, что если Meta не ограничивает себя в работе с конкурентами Scale AI, то сохранившая частичную самостоятельность Scale AI столкнулась с отказом OpenAI и Google продолжать сотрудничество с ней после сделки с Meta. В июле Scale AI пришлось уволить около 200 сотрудников на направлении маркировки данных. Компания сохраняет надежду, что расширит штат на других направлениях деятельности.

Не все руководители Scale AI после сделки с Meta получили значимые кадровые позиции в структуре последней. Расширение штата специалистов ИИ компании Meta, как отмечают некоторые бывшие и настоящие сотрудники, происходит всё более хаотично, а некоторых «новобранцев» пугают бюрократические трудности, присущие большой корпорации, коей является Meta Platforms. Она не только переманивала ценных специалистов у конкурентов в последние месяцы, но и заявила о готовности вложить десятки миллиардов долларов в строительство вычислительной инфраструктуры в США.

На определённом этапе Марк Цукерберг понял, что Александр Ван является не лучшим кандидатом на руководство профильной лабораторией по разработке ИИ, поскольку он не обладает профильной подготовкой. При этом попытки привлечь на эту роль других кандидатов из конкурирующих стартапов успехом не увенчались. Некоторые выходцы из OpenAI, которых Meta переманила, уже успели покинуть компанию. Уволились и некоторые сотрудники Meta, которые занимались разработкой генеративного искусственного интеллекта до всех этих структурных изменений. Часть из них на полном соблазнов рынке труда просто ухватилась за другие шансы.

xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно

Компания xAI Илона Маска (Elon Musk), представила новую модель искусственного интеллекта для задач программирования под названием Grok Code Fast 1. Модель, которую компания описывает как «быструю и экономичную», призвана сократить время на медленные циклы обработки, характерные для других ИИ-ассистентов.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

Grok Code Fast 1 построена на новой архитектуре, для предварительного обучения которой был специально сформирован массив данных, содержащий готовый к применению программный код. Дополнительно модель была дообучена на реальных запросах на внесение изменений в код (Pull Request, PR) и эталонных задачах по написанию кода, что, по утверждению xAI, позволило адаптировать её к практическому использованию. Система обучена работе с такими инструментами и командами, как grep (глобальный поиск регулярных выражений), терминал и редакторы файлов, что делает её пригодной для интеграции в повседневные рабочие процессы внутри популярных интегрированных сред разработки (IDE).

Модель поддерживает несколько языков программирования, включая TypeScript, Python, Java, Rust, C++ и Go. Компания заявляет, что Grok Code Fast 1 способна создавать проекты с нуля, отвечать на сложные вопросы по структуре кодовой базы и исправлять ошибки при минимальном участии разработчика. На тестовом наборе SWE-Bench-Verified, который широко используется для оценки возможностей ИИ в программировании, модель показала результат в 70,8%. При этом в xAI подчёркивают, что ключевую роль в формировании функциональности сыграла обратная связь от реальных разработчиков.

Особое внимание xAI уделила отзывчивости модели. Благодаря новым методам обслуживания и оптимизации кеширования она может практически мгновенно выполнять множественные вызовы инструментов, что позволяет разработчикам видеть результаты в реальном времени без задержек. Главный директор по продукту GitHub Марио Родригес (Mario Rodriguez) отметил в ходе тестирования и скорость, и качество модели в решении агентных задач кодирования, добавив, что эта разработка представляет собой убедительную новую опцию для разработчиков.

xAI подтвердила, что планирует регулярно обновлять Grok Code Fast 1, внедряя улучшения в течение нескольких дней, а не недель. Уже ведётся обучение новой версии модели, которая получит поддержку параллельных вызовов инструментов и увеличенной длины контекста. Как отмечает eWeek, тем самым xAI вступает в гонку с такими компаниями, как Microsoft (с GitHub Copilot) и OpenAI (с Codex), активно развивающими направление автономных ИИ-ассистентов для разработчиков.

Для привлечения первых пользователей модель будет доступна бесплатно в течение одной недели через партнёрские платформы, включая GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, Opencode и Windsurf. По истечении пробного периода стоимость использования через API xAI составит $0,20 за миллион входных токенов, $1,50 за миллион выходных токенов и $0,02 за миллион закешированных входных токенов. xAI также опубликовала руководство по созданию эффективных промптов для Grok Code Fast.

Хакер сделал конкурента ChatGPT соучастником вымогательской кампании: ИИ искал уязвимости и писал угрозы

Компания Anthropic раскрыла детали беспрецедентной хакерской атаки, в которой злоумышленник использовал её ИИ-ассистента для полной автоматизации масштабной кампании по краже данных с целью вымогательства. Инцидент затронул не менее 17 организаций, включая государственные учреждения, больницы, экстренные службы, религиозные организации и подрядчика оборонной отрасли.

 Источник изображения: Max Bender/Unsplash

Источник изображения: Max Bender/Unsplash

По сообщению PCMag, хакер автоматизировал атаку, использовав агентную среду выполнения Claude Code для поиска уязвимостей, сбора учётных данных и проникновения в защищённые сети организаций. ИИ помог злоумышленнику похитить личные записи, включая медицинские данные, финансовую информацию и правительственные идентификационные документы. Затем Claude проанализировал их на предмет размера выкупа, который варьировался от 75 000 до 500 000 долларов в биткоинах, а также сгенерировал визуально пугающие тексты с требованиями, отображавшиеся на компьютерах жертв.

Несмотря на встроенные средства защиты, хакер смог обойти ограничения, загрузив в чат файл конфигурации с легендой о проведении тестирования сетевой безопасности якобы по официальному контракту. Этот файл содержал детальные методики атак и схемы последовательности выполнения задач на основе их значимости. В ходе всего процесса Claude использовался для сканирования уязвимых сетей с высоким процентом успеха, а также для создания вредоносного программного обеспечения и других инструментов, предназначенных для обхода защитных механизмов антивирусной программы Windows Defender.

В отличие от предыдущих случаев, когда ИИ применялся хакерами лишь для вспомогательных задач, таких как написание фишинговых писем или анализ уязвимостей, в данном инциденте ИИ-модель выступала не только консультантом, но и активным исполнителем атак. Представители Anthropic подчеркнули, что это «свидетельствует о новом этапе в развитии киберпреступности с участием искусственного интеллекта, когда ИИ становится полноценным оператором в цепочке атак».

Компания ожидает, что всё больше хакеров будут применять подобные методы. В том же отчёте упоминается о другом, возможно начинающем злоумышленнике, который использовал Claude для разработки, продвижения и продажи нескольких вариантов программ-вымогателей. По словам Anthropic, данный пользователь был полностью зависим от ответов ИИ и без помощи Claude не смог бы реализовать или устранить неполадки ключевых компонентов вредоносного ПО.

Отдельно сообщается, что компания-разработчик антивирусного программного обеспечения ESET также обнаружила новую программу-вымогателя, использующую открытую модель OpenAI для генерации злонамеренного кода на заражённых устройствах.

Google открыла доступ к Vids для всех: ИИ-видеоредактор стал бесплатным, но не без ограничений

Google запустила бесплатную версию видеоредактора Vids, работающего на базе искусственного интеллекта (ИИ). Ранее этот инструмент был доступен исключительно подписчикам Google Workspace и специальных тарифов с ИИ, но теперь все пользователи смогут использовать его базовую версию, которая включает шаблоны, стоковый медиаконтент и ограниченный набор ИИ-возможностей.

 Источник изображений: Google

Источник изображений: Google

Vids, представленный в прошлом году как часть пакета Workspace, предназначен для быстрого создания видео-презентаций. Он помогает пользователям формировать раскадровки, предлагая сцены, подбирая стоковые изображения и фоновую музыку с помощью алгоритмов. Как сообщает The Verge, ссылаясь на слова директора по продукту Вишну Шиваджи (Vishnu Sivaji), упрощённая версия сохраняет значительную часть основных возможностей приложения, однако в ней отсутствуют некоторые новейшие ИИ-функции, анонсированные одновременно с открытием доступа. В частности, бесплатная версия не позволяет использовать ИИ-аватары для озвучивания текста от имени пользователя.

В рамках обновления платные подписчики получат доступ к выбору из 12 готовых аватаров с уникальной внешностью и голосом, в которые можно загружать собственный сценарий. При этом функция создания персонального ИИ-аватара, аналогичная реализованной в Zoom, в Vids пока недоступна. На вопрос о такой возможности Шиваджи ответил, что компания не готова делиться планами на этот счёт.

Также Google расширила возможности генерации видео: теперь можно создавать 8-секундные ролики на основе конкретного изображения, например фотографии нового продукта. Кроме того, появился инструмент, автоматически удаляющий из записи слова-паразиты и паузы, что полезно при подготовке собственных видео для презентаций.

В компании считают, что новые функции помогут бизнесу сэкономить время и деньги при производстве видеоконтента различного назначения, в том числе обучающих роликов, так как, по словам Шиваджи, традиционное производство даже 10-минутного видео с живыми актёрами может занимать до полугода и обходиться в десятки тысяч долларов из-за затрат на написание сценария, его согласование, аренду студии, съёмку и монтаж.

Microsoft представила VibeVoice — открытый ИИ, превращающий текст в полуторачасовые подкасты

Microsoft представила проект с открытым исходным кодом VibeVoice в области искусственного интеллекта — новую систему синтеза речи, способную генерировать из текста аудиоподкасты длительностью до 90 минут на английском или китайском языке. Технология уже доступна для тестирования любому желающему онлайн или с установкой на локальное устройство пользователя.

 Источник изображения: AI

Источник изображения: AI

Разработчики охарактеризовали VibeVoice как новаторский фреймворк, созданный для генерации продолжительного по времени аудиоконтента с несколькими участниками непосредственно из текста. Как пишет Windows Central, система решает ключевые проблемы традиционных синтезаторов речи (TTS), такие как масштабируемость, согласованность характеристик голоса и естественность чередования реплик в диалоге. Модель способна синтезировать аудио продолжительностью до 90 минут с участием до четырёх уникальных голосов, что превосходит ограничения в 1-2 спикера, характерные для многих предыдущих ИИ-моделей.

В настоящее время для тестирования доступны две версии модели: на 1,5 и 7 млрд параметров. Первая может генерировать до 90 минут аудио с длиной контекста 64 тыс. токенов, тогда как вторая, предположительно более качественная из-за большего размера, ограничена 45 минутами и окном в 32 тысячи токенов. Также ожидается выпуск облегчённой версии на 0,5 млрд параметров, предназначенной для работы в реальном времени. Для локальной работы меньшая модель требует около 7 Гбайт видеопамяти, а для большей может потребоваться до 18 Гбайт VRAM.

На текущий момент ИИ-модель VibeVoice обучена только на английском и китайском языках, включая мандаринскую разновидность (севернокитайский или путунхуа). Однако в Microsoft отмечают, что в будущих версиях планируется расширение поддержки других языков. Система способна передавать эмоции, управлять сменой реплик между участниками и генерировать естественные диалоги, хотя попытки воспроизведения музыки пока остаются неудачными. Голоса звучат довольно реалистично, однако их искусственное происхождение остаётся заметным. В перспективе разработчики рассматривают возможность интеграции функции клонирования голоса.

Разработчики отмечают, что при запуске потоковой версии аудиогенерации VibeVoice может быть интегрирована в чат-ассистенты, позволяя обходиться без внешних серверов. Дополнительные сведения, включая инструкции по установке и настройке, доступны в официальном репозитории VibeVoice в GitHub и на платформе Hugging Face.

ИИ-браузер Perplexity Comet без раздумий слил мошенникам данные банковской карты

Новый ИИ-браузер Comet, разработанный компанией Perplexity, оказался уязвим к фишинговым атакам и инъекциям промптов. Исследователи из Guardio продемонстрировали, что система может выполнять действия от имени пользователя без проверки подлинности сайтов и ссылок, включая ввод конфиденциальных данных, сообщает PCWorld.

 Источник изображения: Disney/Perplexity

Источник изображения: Disney/Perplexity

Специалисты Guardio провели серию тестов, моделирующих реальные сценарии атак. В одном из случаев ИИ получил указание помочь с покупкой Apple Watch на поддельном сайте, имитирующем Walmart. Браузер не распознал мошеннический URL-адрес (walmart-cart-cash.lovable.app) и без проверки подлинности страницы автоматически ввёл данные кредитной карты и адрес пользователя, завершив процесс оформления заказа.

Аналогичным образом Comet отреагировал и на фальшивое письмо от Wells Fargo, отправленное с адреса в домене Proton Mail. При получении ссылки из письма браузер перешёл по ней без проверки источника и автоматически заполнил учётные данные пользователя. В обоих случаях система не применила базовых мер предосторожности, которые ожидаются от ИИ, обладающего функциями агентного поведения, подчеркнули в Guardio.

Кроме того, исследователи обнаружили, что через атаку с помощью инъекции промптов можно заставить Comet обходить капчу (CAPTCHA) в сценариях, где это предусмотрено. Эта уязвимость потенциально позволяет использовать браузеры в составе распределённой сети для автоматизированных атак, напоминающей ботнет, но с участием ИИ-агентов.

Браузер Comet был запущен только в прошлом месяце и доступен исключительно для подписчиков Perplexity с оплатой $200 в год, хотя в компании планируют сделать его бесплатным в будущем. При этом Perplexity рассматривает возможность покупки браузера Chrome в случае, если Google будет вынуждена его продать. Однако, как отмечают эксперты, у компании нет необходимых для такой сделки средств, хотя ранее, как сообщал 3DNews, Perplexity предлагала выкупить Google Chrome за $34,5 млрд.


window-new
Soft
Hard
Тренды 🔥
Microsoft хочет запретить перепродажу корпоративных лицензий Office и Windows — дело дошло до суда 4 мин.
Китайский ИИ-оптимизм на взлёте: национальные технокомпании кратно наращивают траты на инфраструктуру 28 мин.
Sony планирует активнее использовать ИИ при создании видеоигр 2 ч.
Ведомства поспорили, каких гаджетов касается требование об установке RuStore и Max — всех или не всех 3 ч.
Сэм Фишер снова в деле: Netflix показала динамичный трейлер анимационного сериала Splinter Cell: Deathwatch 3 ч.
YouTube Live получил крупнейшее обновление: двухформатные эфиры, мини-игры и многое другое 4 ч.
YouTube представил новые ИИ-инструменты для всесторонней оптимизации контента 4 ч.
TikTok в США будет на 80 % американским, но алгоритм останется китайским, и это кое-кому не нравится 4 ч.
YouTube захотел стать торговой платформой — ИИ наполнит видеоролики ссылками на товары 4 ч.
Душевное приключение Sopa: Tale of the Stolen Potato отправит в волшебную страну за картошкой для супа бабушки — новый трейлер и дата выхода 5 ч.
Keychron представила первую в мире керамическую клавиатуру Q16 HE 8K весом в килограмм 33 мин.
SanDisk нагнетает: дефицит флеш-памяти продлится как минимум до 2026 года, и SSD будут дорожать 2 ч.
Looking Glass анонсировала голографические «гололюминесцентные» дисплеи с ценой от $1500 3 ч.
NVIDIA и партнёры развернут в Великобритании ИИ-фабрики со 120 тыс. ускорителей Blackwell 3 ч.
Собственный ЦОД Stargate и крупнейший в стране ИИ-суперкомпьютер: американские IT-гиганты вложат более $40 млрд в развитие ИИ в Великобритании 3 ч.
Новость из будущего: квантовая компания совершила рекордную закупку добытого на Луне гелия-3 3 ч.
Принудительное импортозамещение: Пекин запретил ByteDance и Alibaba покупать ускорители у Nvidia 3 ч.
Камчатку полностью отключат от интернета на несколько дней 3 ч.
Доставка припасов на МКС под угрозой — у космогрузовика Cygnus XL засбоил двигатель 4 ч.
Google, Microsoft, OpenAI и Nvidia инвестируют более £31 млрд в ИТ-инфраструктуру Великобритании 4 ч.