Сегодня 29 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Геймер собрал внутри Minecraft рабочий ChatGPT — на это ушло 439 млн блоков

Игра Minecraft представляет собой «песочницу», ограниченную только вашим воображением и творческими способностями, что в полной мере демонстрируется в видео от YouTube-блогера sammyuri. Используя механику материала редстоун из оригинальной версии Minecraft, геймер сумел создать функциональную небольшую языковую модель ИИ, работающую внутри игры.

 Источник изображений: YouTube / sammyuri

Источник изображений: YouTube / sammyuri

Если вы видели предыдущие примеры экстремальной инженерии в Minecraft, то наверняка знакомы с работами sammyuri. Его последний проект, получивший название CraftGPT, занимает объём 1020 × 260 × 1656 блоков (439 млн). Он настолько большой, что для его демонстрации в видео понадобился мод District Horizons.

Небольшая языковая модель имеет 5 087 280 параметров и была обучена на Python с помощью набора данных TinyChat. По данным некоторых пользователей, отметившихся в комментариях к видео, языковая модель CraftGPT примерно в 23 раза меньше модели GPT-1 и примерно в 175 тыс. раз меньше модели GPT-3. Несмотря на заявленные характеристики, sammyuri советует смягчить ожидания от CraftGPT: модель часто может отклоняться от темы и выдавать грамматически неверные ответы или просто ответы, не соответствующие запросу.

Кроме того, CraftGPT — очень медленная модель. Даже несмотря на использование высокопроизводительного сервера Minecraft Redstone для увеличения тикрейта в 40 000 раз, CraftGPT может генерировать ответ примерно за два часа. Без увеличения тикрейта ждать ответа пришлось бы более 10 лет.

Те, кто хочет попробовать CraftGPT, могут скачать все необходимые файлы на GitHub. Sammyuri рекомендует использовать ПК с объёмом ОЗУ не менее 32 Гбайт, в идеале — 64 Гбайт. На GitHub также есть инструкции по настройке и несколько полезных советов по максимально эффективному использованию небольшой языковой модели.

Anthropic представила Claude Sonnet 4.5 — «лучший в мире» ИИ для программирования и сложных вычислений

Компания Anthropic анонсировала Claude Sonnet 4.5 — самую мощную на сегодняшний день большую языковую модель в семействе Claude. По словам разработчиков, она ориентирована на программирование, построение ИИ-агентов и решение сложных задач. A Anthropic заверили, что Sonnet 4.5 стал не только лидером в профильных бенчмарках, но и демонстрирует заметный скачок в понимании программного кода, математических вычислениях и управлении компьютером.

Claude Sonnet 4.5 занял первую строчку в SWE-bench Verified — отраслевом тесте, который измеряет реальные способности ИИ-моделей к написанию и анализу программного кода. По данным Anthropic, Sonnet 4.5 способен поддерживать концентрацию более 30 часов при работе над сложными многоэтапными задачами, обходя предыдущие версии Claude и ближайших конкурентов.

В тесте OSWorld, проверяющем работу ИИ с реальными компьютерными задачами, Sonnet 4.5 показал результат 61,4 % против 42,2 % у версии Sonnet 4, что иллюстрирует резкий рост производительности за последние месяцы.

Новая модель показала себя не только в программировании. По результатам внутренних и независимых тестов, Sonnet 4.5 демонстрирует серьёзный прогресс в задачах логического вывода и математики, а также в специализированных областях: финансах, медицине, праве и STEM-дисциплинах. Разработчики отмечают рост качества генерации и анализа кода, управление файлами и сложными вычислениями в реальном времени.

Появился и экспериментальный режим Imagine with Claude: теперь ИИ может создавать программные решения буквально «на лету», полностью адаптируя код под текущие запросы пользователя.

Одновременно с выпуском Sonnet 4.5 компания представила крупные обновления экосистемы Claude. В сервисе Claude Code появились чекпоинты для сохранения прогресса, обновлённый терминал и нативное расширение для Visual Studio Code. В приложениях Claude теперь доступна непосредственная работа с кодом, создание файлов (включая таблицы, презентации и документы) прямо в диалоге, а пользователи с подпиской Max получили расширение для Chrome.

Для разработчиков открыт новый набор инструментов — Claude Agent SDK. Он позволяет создавать собственных интеллектуальных агентов на базе тех же технологий, что лежат в основе Claude Code. SDK реализует сложную работу с памятью, управлением правами и координацией подзадач между агентами — то есть открывает возможности построения продвинутых решений под любые задачи.

Помимо того, что Claude Sonnet 4.5 стала самой способной, она также стала самой «воспитанной» ИИ-моделью компании: снижено количество опасных и нежелательных паттернов поведения, таких как подыгрывание пользователю, попытки обойти ограничения или выполнение вредных запросов. В рамках защиты пользователей, Anthropic применяет многоуровневые фильтры (AI Safety Level 3), особенно в отношении тем, связанных с химическими, биологическими, ядерными и другими видами оружия. Также фильтры стали точнее: количество ложных срабатываний удалось снизить в 10 раз по сравнению с предыдущими релизами.

Claude Sonnet 4.5 уже доступен для всех пользователей через веб-версию чат-бота, а также в мобильных приложениях. Также новая ИИ-модель доступна API по цене старой (от $3 за миллион токенов). Новые возможности Claude Code и Agent SDK доступны всем разработчикам и корпоративным клиентам.

Браузер Brave обновил фирменный ИИ-поиск: теперь он даёт развёрнутые ответы

Компания Brave обновила в своём браузере ИИ-поиск, добавив функцию Ask Brave, которая будет предоставлять развёрнутые ответы на основе пользовательских запросов. Ask Brave дополнит существующий режим AI Answers, запущенный в прошлом году для кратких резюме, и будет работать параллельно с ним.

 Источник изображения: Brave

Источник изображений: Brave

Новый режим, по данным TechCrunch, не потребует переключения в специальный интерфейс, так как поисковая система автоматически определяет тип запроса и формирует соответствующий ответ. Пользователи могут инициировать такой поиск с помощью кнопки «Спросить» (Ask) рядом со строкой поиска Brave, перейти в этот режим через вкладку на странице результатов или добавить к запросу двойной вопросительный знак, если Brave Search установлен в качестве поисковика по умолчанию.

Как отметили в компании, в отличие от режима AI Answers, дающего краткие сводки, Ask Brave предлагает более длинные ответы, возможность задавать уточняющие вопросы и чат-режим с функцией Deep Research, а также контекстно релевантные дополнения в виде видео, новостных материалов, товаров, информации о компаниях, предложений для шопинга и других полезных данных.

По словам руководителя поискового отдела Brave Хосепа Пухоля (Josep M. Pujol), в компании ожидают, что при помощи новой функции можно будет генерировать дополнительные ответы, исчисляемые миллионами в день, благодаря мощной комбинации ИИ-поиска и крупных языковых моделей (LLM). При этом формат ответов в Ask Brave напоминает ответы ChatGPT или Perplexity: он включает ссылки, видео и изображения, а после получения ответа пользователь может преобразовать его в другой формат или задать уточняющие вопросы. Для обеспечения точности Brave использует собственный API и глубокое исследование для определённых запросов.

Примечательно, что компания также заявляет о своём конкурентном преимуществе в области конфиденциальности. В частности, Brave утверждает, что шифрует все пользовательские чаты и удаляет их после 24 часов неактивности.

В ChatGPT появился полный родительский контроль после трагической гибели подростка из США

Компания OpenAI объявила о внедрении системы родительского контроля в десктопные и мобильные версии ChatGPT после судебного иска родителей подростка из Калифорнии, который, по их утверждениям, покончил с собой после общения с искусственным интеллектом (ИИ), сообщает Reuters.

 Источник изображения: Emiliano Vittoriosi/Unsplash

Источник изображения: Emiliano Vittoriosi/Unsplash

Новые меры, анонсированные компанией, позволят гибко настраивать уровень безопасности и конфиденциальности для несовершеннолетних пользователей. Согласно заявлению OpenAI, родители получат возможность ограничивать доступ подростков к чувствительному контенту, управлять функцией запоминания истории переписок и решать, могут ли диалоги использоваться для дообучения моделей компании. Кроме того, появится возможность устанавливать «режим тишины», в течение которого доступ к сервису будет заблокирован, а также отключать голосовой режим и функцию генерации и редактирования изображений.

При этом OpenAI подчёркивает, что родители не смогут получить непосредственный доступ к переписке подростка. В редких случаях, когда автоматические системы и модераторы обнаружат признаки серьёзной угрозы безопасности, родителям может быть передана только та информация, которая необходима для оказания поддержки подростку.

Данный шаг происходит на фоне ужесточения контроля со стороны американских регуляторов за компаниями, работающими в сфере искусственного интеллекта, из-за потенциального негативного влияния чат-ботов.

Крупнейший разработчик технологий для чипов будущего Imec сменит гендира, чтобы преуспеть в эпоху ИИ

В наше время технологии производства полупроводниковых компонентов обретают первостепенное значение, поэтому предстоящая смена генерального директора Imec может оказать серьёзное влияние на всю отрасль. Эта бельгийская исследовательская компания за счёт кадровых перестановок в руководстве надеется лучше адаптироваться под потребности рынка.

 Источник изображения: TSMC

Источник изображения: TSMC

О своём готовящемся назначении на пост генерального директора Imec в интервью Reuters рассказал Патрик Ванденамель (Patrick Vandenameele), добавив, что нынешний глава компании Люк ван ден Хов (Luc van den Hove) пойдёт на повышение и станет председателем совета директоров. В условиях бума искусственного интеллекта Imec заинтересована в углублении собственных связей с крупными игроками рынка облачных вычислений, поскольку те становятся крупнейшими заказчиками полупроводниковых компонентов и начинают некоторые из них разрабатывать самостоятельно.

Amazon (AWS), Microsoft, Meta✴ и Google (Alphabet) сообща контролируют примерно половину мировых серверных вычислительных мощностей и стремительно расширяют инфраструктуру на фоне бума систем искусственного интеллекта. Масштабы бизнеса заставляют их задумываться о создании более эффективных чипов, которые позволили бы снизить энергопотребление и повысить производительность эксплуатируемых систем. «Они остро нуждаются в решениях для масштабирования с одновременным сохранением энергетического баланса. Энергия в данном случае является ключевой проблемой», — пояснил будущий глава Imec.

Начав свою карьеру в 90-е годы прошлого века, 52-летний Ванденамель основал четыре стартапа, прежде чем ему предложили руководящие должности в Qorvo и Huawei. При новом руководителе Imec намерена активнее создавать дочерние компании, которые делились бы своими разработками с молодыми разработчиками и в целом позволяли бы европейским компаниям преодолевать имеющиеся технологические и финансовые трудности. Мелким компаниям сейчас очень сложно конкурировать за доступ к передовым технологиям с крупными игроками рынка. Сейчас Imec стоит пилотную линию по производству чипов с использованием литографических норм менее 2 нм, чтобы предоставить европейским компаниям доступ к данной технологии. На строительство линии власти Евросоюза выделили 2,5 млн евро субсидий. Ведётся плотное сотрудничество между Imec и ASML, которая создаёт передовые литографические сканеры. Кроме того, Imec привлечена к реализации проекта Rapidus по организации производства 2-нм чипов в Японии.

Разработчики сосредоточились на ИИ-моделях мира для создания сверхразума

Ведущие разработчики ИИ, такие как Google DeepMind, Meta✴ и Nvidia, уделяют всё больше внимания так называемым моделям мира, которые могут лучше понимать окружающую среду, в стремлении создать машинный «сверхразум», пишет The Financial Times.

 Источник изображения: julien Tromeur/unsplash.com

Источник изображения: julien Tromeur/unsplash.com

Модель мира имитирует причинно-следственные связи и законы физики посредством симуляций, основанных на обучении, для которого требуется огромный объём данных из реальных или моделируемых сред и большие вычислительные мощности. Они рассматриваются как важный шаг в развитии беспилотных автомобилей, робототехники и так называемых ИИ-агентов.

«ИИ по-прежнему ограничен цифровой сферой, — говорит Шломи Фрухтер (Shlomi Fruchter), соруководитель Genie 3 в Google DeepMind. — Создавая среды, которые выглядят или ведут себя как реальный мир, мы получаем гораздо более масштабируемые способы обучения ИИ без реальных последствий совершения ошибок в реальном мире».

Янн Лекун (Yann LeCun), возглавляющий исследовательскую лабораторию Meta✴ AI (прежнее название — Facebook✴ Artificial Intelligence Research, FAIR), заявил, что большие языковые модели (LLM) никогда не достигнут способности рассуждать и планировать как люди.

Одной из ближайших областей применения моделей мира станет индустрия развлечений, где они позволяют создавать интерактивные и реалистичные сцены. Например, стартап World Labs разрабатывает модель, которая генерирует трёхмерные среды, похожие на видеоигры, из одного изображения.

Runway, стартап по созданию видео, в числе партнёров которого голливудские студии, включая Lionsgate, в прошлом месяце выпустил продукт, использующий модели мира для создания игровых сред с персонализированными историями и персонажами, генерируемыми в реальном времени.

Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) заявил, что следующим крупным этапом роста компании станет «физический ИИ», так как новые модели позволят добиться прорыва в области робототехники. По мнению Лекуна, реализация концепции по созданию ИИ-систем, обеспечивающих машины интеллектом человеческого уровня, может занять 10 лет.

Вместе с тем эксперты указывают на большой потенциал новых ИИ-технологий. «Модели мира открывают возможность обслуживания всех отраслей и усиливают тот же эффект, который компьютеры сделали для интеллектуального труда», заявил Рев Лебаредян (Rev Lebaredian), вице-президент Nvidia по технологиям моделирования.

Китай отстал от США в сфере ИИ-чипов буквально на наносекунды, как считает основатель Nvidia

Заинтересованность Nvidia в сохранении позиций на китайском рынке ускорителей вычислений не раз демонстрировалась главой и основателем компании Дженсеном Хуангом (Jensen Huang). В конце прошлой недели он заявил, что и китайские разработчики отстают от США буквально «на наносекунды», и важно сохранять конкуренцию с ними.

 Источник изображения: Nvidia

Источник изображения: Nvidia

По данным South China Morning Post, на прошлой неделе генеральный директор Nvidia Дженсен Хуанг выступил в подкасте BG2, в очередной раз высказав идею о важности сохранения присутствия американских компаний по всему миру для «максимизации экономического успеха и геополитического влияния Америки». В Китае, как убеждён Хуанг, достаточно талантливых специалистов, имеется традиция много трудиться, а между различными провинциями страны существует внутренняя конкуренция. Китайскую отрасль он назвал динамично развивающейся, высокотехнологичной, современной и насыщенной духом предпринимательства. Китай отстаёт от США на считанные наносекунды, а потому им нужно конкурировать, как образно выразился Хуанг.

Власти КНР, как он подчеркнул, готовы сохранять рынок открытым. «Это в лучших интересах Китая, чтобы иностранные компании инвестировали в Китае, конкурировали в Китае, и чтобы у них сохранялась активная конкуренция. Они смогли бы выйти за пределы Китая и работать на мировом рынке», — заявил глава Nvidia.

Одновременно руководитель доминирующей на мировом рынке ИИ-ускорителей компании отверг все идеи по поводу скорого насыщения этого сегмента. «Пока мы полностью на переведём все классические вычисления в ускоренные и ИИ, я думаю, что шансы перенасыщения рынка крайне малы. Никому не нужны атомные бомбы, всем нужен ИИ», — образно охарактеризовал ситуацию со спросом основатель Nvidia.

ИИ-аватар позволяет пообщаться с покойным создателем комиксов о человеке-пауке и героях Marvel

Стэн Ли (Stan Lee), создатель серии комиксов о человеке-пауке и героях вселенной Marvel, ушёл из жизни в 2018 году в возрасте 95 лет, но накопленные при его жизни интервью и публикации позволили обучить искусственный интеллект для создания голографического аватара, способного общаться с посетителями Comic Con.

 Источник изображения: The Real Stan Lee

Стэн Ли, на фото второй слева. Источник изображения: The Real Stan Lee

Это регулярное мероприятие в Лос-Анджелесе Стэн Ли любил посещать при жизни, поэтому организаторы в текущем году приложили усилия для возрождения возможности посетителей пообщаться с легендой индустрии, задействовав современные технологии. Специальное оборудование создаёт голографическое изображение Стэна Ли в полный рост, которое обладает правдоподобной мимикой и жестикуляцией, а главное — позволяет давать связные и развёрнутые ответы на вопросы посетителей. Это технологическое решение по реинкарнации деятелей культуры организаторы Comic Con демонстрировали в особом «уголке Стэна Ли», если так можно выразиться.

По словам создателей аватара, на его подготовку к демонстрации публике ушло несколько лет с привлечением различных сторон: «Мы хотели создать что-то, способное стать частью поддержки и расширения наследия Стэна, в качестве признательности ему за всё созданное». Для обеспечения информационной поддержки виртуального двойника Стэна Ли использовалась специализированная большая языковая модель, которая сконцентрирована только на обсуждении его творчества. Например, если спросить аватар о политике или спорте, он не станет отвечать на данные темы. За право пообщаться с аватаром Стэна Ли посетители Comic Con должны заплатить $15, но в эту сумму входит и посещение импровизированного музея.

Разработчики интерактивного дисплея Proto, который позволяет воссоздавать полномасштабное изображение человека, предлагают также использовать его в музеях, учебных заведениях и даже в процессе переговоров в режиме видеоконференции. Устройство позволяет сформировать ощущение присутствия собеседника, который находится далеко. Даже в телемедицине найдётся применение, поскольку пациент может физически демонстрировать проблемные части тела специалистам, находящимся на значительном удалении.

Meta✴ хотела бы стать крупным поставщиком ПО для человекоподобных роботов

В основном героями новостей становятся производители человекоподобных роботов, но американская компания Meta✴ Platforms готова связать своё будущее с разработкой исключительно программного обеспечения для них. По своим масштабам этот бизнес для неё может оказаться сопоставим с очками дополненной реальности.

 Источник изображения: ***

Источник изображения: Facebook✴

Соответствующие высказывания прозвучали в штаб-квартире Meta✴ Platforms из уст технического директора компании Эндрю Босворта (Andrew Bosworth), как отмечает PCMag со ссылкой на Sources. Представитель компании подчеркнул, что её не прельщает перспектива превращения в производителя аппаратного обеспечения, но в сфере робототехники она готова лицензировать использование создаваемого ею программного обеспечения для других производителей.

В какой-то мере, как поясняет источник, подобная бизнес-модель напоминает тактику Google, которая контролирует 72,5 % рынка программного обеспечения для смартфонов, но самостоятельно реализует лишь 2 % соответствующей продукции на мировом рынке под маркой Pixel. Босворт пояснил мотивацию Meta✴ в части концентрации именно на программном обеспечении для человекоподобных роботов: «Я не думаю, что создавать железо труднее. При этом я не говорю, что его создавать просто, но оно не является узким местом. Им является программное обеспечение».

Поскольку Meta✴ хочет со временем увеличить масштаб своего бизнеса по разработке программного обеспечения для человекоподобных роботов до уровня сегмента AR, можно предположить, что компания вложит в новую инициативу не менее $100 млрд, хотя официальные представители никак этот вопрос не комментируют.

Meta✴ уже наметила проблемные места в сфере разработки ПО для человекоподобных роботов. Их манипуляторы плохо справляются с некоторыми типами манипуляций. Например, при попытке поднять со стола стакан с водой робот либо рискует раздавить его, либо пролить воду, поскольку пока плохо справляется с взаимодействием с нестабильными объектами. Ему будет не по силам и вытащить пару автомобильных ключей из кармана джинсов.

Meta✴ силами своего подразделения Superintelligence AI Lab пытается создать виртуальную модель мира, которая позволит на уровне симуляций обучить роботов адекватно управлять своими руками. Сторонние источники предполагают, что пройдёт несколько лет, прежде чем программная платформа Meta✴ для роботов будет готова к распространению на рынке. Основатель и руководитель Nvidia Дженсен Хуанг (Jensen Huang) предрекает рынку человекоподобных роботов достижение ёмкости в $38 млрд в ближайшие пару десятилетий.

Spotify начнёт маркировать музыку с ИИ и запретит клонированные голоса

Spotify объявила о ряде изменений в своей политике в отношении искусственного интеллекта (ИИ), направленной на повышение прозрачности использования ИИ в музыке, борьбу со спамом и несанкционированное клонирование голоса. Компания планирует внедрить отраслевой стандарт маркировки ИИ-контента DDEX и запустить новый фильтр для выявления и блокировки манипулятивных тактик распространения музыки.

 Источник изображения: Spotify

Источник изображения: Spotify

Согласно новым правилам, лейблы, дистрибьюторы и партнёры в музыкальной индустрии будут обязаны предоставлять стандартизированные сведения об использовании ИИ в метаданных треков через систему DDEX. Эта система позволит указывать конкретные детали применения искусственного интеллекта, например, в генерации вокала или создании инструментального сопровождения песни.

Сэм Дубофф (Sam Duboff), руководитель отдела маркетинга и политики Spotify, отметил на пресс-брифинге, что использование ИИ в музыке представляет собой спектр, а не чёткое разделение на «ИИ» и «не ИИ», и что новый стандарт обеспечит более точное раскрытие информации. Одновременно в Spotify уточнили свою позицию по вопросам персонализации с использованием ИИ: вокальные клоны, дипфейки и любые формы репликации или имитации голоса без разрешения правообладателя запрещены и будут удаляться с платформы. Несмотря на то, что стандарт DDEX всё ещё находится в стадии разработки, компания уже получила подтверждение от 15 лейблов и дистрибьюторов о его внедрении.

Помимо маркировки ИИ-контента и борьбы со спамом, Spotify намерена совместно с дистрибьюторами решать проблему несоответствий профилей — мошеннической практики, при которой треки незаконно публикуются под именами других исполнителей. Компания будет выявлять и блокировать такие случаи ещё до выхода музыки в эфир. При этом руководство Spotify подчёркивает, что не выступает против творческого и этичного использования ИИ. Чарли Хеллман (Charlie Hellman), вице-президент и руководитель музыкального направления сервиса, заявил, что цель изменений — не ограничивать артистов, а защитить платформу от злоупотреблений, без чего невозможно раскрыть весь потенциал ИИ в музыке.

В целом, компания рассматривает свои действия, как сигнал для всей индустрии о необходимости перехода к маркировке музыки с ИИ. Принятые меры стали ответом на стремительный рост генерируемого контента, который у слушателей вызывает недовольство ввиду отсутствия прозрачности применения искусственного интеллекта в композициях артистов.

«Бро постит ИИ-бурду у себя в приложении»: Meta✴ запустила платформу Vibes для коротких ИИ-видео

Meta✴ Platforms представила новую платформу Vibes для создания с помощью ИИ и публикации коротких видеороликов. Начиная с четверга Vibes доступна в приложении Meta✴ AI и на сайте meta✴.ai, пишет Reuters. О запуске Vibes объявил в Instagram✴ генеральный директор Meta✴ Марк Цукерберг (Mark Zuckerberg), где также была представлена ​​серия видеороликов, созданных с помощью ИИ.

 Источник изображения: Jonas Leupe/unsplash.com

Источник изображения: Jonas Leupe/unsplash.com

В одном из видеороликов группа пушистых существ прыгает с одного пушистого куба на другой. В другом — кошка месит тесто, а в третьем женщина делает селфи на балконе с видом на Древний Египет.

С помощью платформы можно создавать видео с нуля или использовать имеющийся контент, а также делать ремиксы видео из ленты, добавляя новые визуальные эффекты или накладывая музыку. Созданное видео можно опубликовать в ленте Vibes, отправить его другим пользователям или сделать кросс-пост в Instagram✴, Facebook✴ Stories и Reels.

Глава ИИ-команды Meta✴ Александр Ванг (Alexandr Wang) сообщил, что компания сотрудничала с генераторами изображений на базе ИИ Midjourney и Black Forest Labs с целью запуска ранней версии Vibes, продолжая также разрабатывать собственные ИИ-модели.

Поскольку никто на самом деле не хочет версию TikTok, созданную с помощью искусственного интеллекта, комментарии пользователей в ответ на объявление Цукерберга были вполне ожидаемыми. Самый популярный комментарий к посту гласит: «Никто этого не хочет», а в другом популярном комментарии говорится: «Бро выкладывает ИИ-бурду у себя в приложении». В еще одном комментарии написано: «Думаю, я выражу мнение всех, когда скажу: Чтооо…?», пишет TechCrunch. Ресурс отметил, что нынешний анонс кажется «странным» с учётом того, что ранее в этом году компания заявила о борьбе с «неоригинальным» контентом в Facebook✴ и посоветовала авторам сосредоточиться на «аутентичном повествовании», а не на коротких видеороликах, не представляющих особой ценности.

YouTube Music превратили в подобие радио с ИИ-ведущими, которые «расширят музыкальные горизонты»

В радиостанциях и подборках композиций на платформе YouTube Music появились созданные искусственным интеллектом виртуальные ведущие. Это первый проект в рамках новой программы YouTube Labs — ИИ-ведущие «расширят горизонты вашего восприятия музыки, поделятся интересным историями, интересными фактами от поклонников и забавными комментариями о вашей любимой музыке». По описанию напоминает некий аналог радио, где музыкальные композиции перемежаются с речью ведущих

 Источник изображения: blog.youtube

Источник изображения: blog.youtube

Новая программа YouTube Labs посвящена экспериментам с ИИ на платформе, но пока «протестировать ранние прототипы и эксперименты сможет лишь ограниченное число участников из США». Впрочем, отмечает ресурс The Verge, услышать созданных ИИ ведущих пока довелось не всем, кто зарегистрировался в YouTube Labs. Инициатива обещает быть интересной — нечто подобное Google ранее развернула в популярном приложении NotebookLM, где ИИ-ассистенты помогают исследовать и изучать отдельные темы.

Администрация YouTube также объявила о расширении некоторых функций для подписчиков премиум-версии на большее количество платформ. Так, функция Jump Award, которая на основе ИИ-анализа позволяет быстро переходить к самой интересной части видео, теперь в полной мере заработала в версиях YouTube для телевизоров и игровых приставок.

Apple разработала аналог ChatGPT — приложение Veritas для iPhone, но никому его не показывает

Как стало известно специализирующемуся на подобной информации Марку Гурману (Mark Gurman) из Bloomberg, компания Apple разработала приложение Veritas, которое призвано подготовить грядущее обновление Siri в следующем году. Пока оно используется внутри компании для тестирования новых функций голосового ассистента, связанных с работой с персональными данными и действиями внутри других приложений.

 Источник изображения: Apple

Источник изображения: Apple

По данным источника, обновлённый ассистент Siri должен дебютировать в марте следующего года, и от успешности этого события будет зависеть способность Apple осуществить реванш в сфере ИИ, а в случае неудачи она ещё сильнее отстанет от соперников в сегменте смартфонов. Сейчас Veritas используется сотрудниками Apple для оценки его способности искать информацию внутри персональных данных пользователя типа почтовых сообщений или подборок музыки, а также выполнять операции внутри приложений типа редактирования фото. В переводе с латыни название приложения означает «истину».

У Apple нет планов открывать доступ к этому приложению рядовым пользователям. По сути, оно нужно для адаптации прогресса, которого компания добилась в области совершенствования Siri, к возможности его тестирования среди сотрудников компании. Она также пытается оценить, есть ли смысл сохранять формат взаимодействия в виде чат-бота. После многочисленных задержек продвинутая версия Siri, способная работать с ИИ на новом качественном уровне, теперь должна дебютировать в марте следующего года. Считается, что к тому моменту для покупателей наличие ИИ-функций уже станет решающим фактором при выборе смартфона, и Apple старается не увеличивать своё отставание от конкурентов в этой сфере. Изначально обновлённая версия Siri должна была выйти весной этого года, но некоторые функции работали нестабильно, в результате было принято решение основательно её переработать.

Тестирующее приложение Veritas напоминает самые популярные чат-боты, позволяя пользователю вести несколько бесед на самые разные темы. Оно запоминает предыдущие сеансы и может отсылать к ним, а также возобновлять прерванное общение. Главное предназначение Veritas — испытать платформу Linwood, которую Apple намерена использовать для создания новой версии Siri. Эта платформа использует большие языковые модели как собственной разработки, так и сторонние. К концу следующего года Apple также готовится обновить визуализацию своего голосового ассистента. Устройства для умного дома Apple также получат новые функции, связанные с ИИ.

В этом году Apple пыталась договориться с OpenAI и Anthropic об использовании их разработок, но позже переключилась на взаимодействие с Google, которое подразумевало бы использование адаптированной версии Gemini для нужд Apple. Отсрочки с обновлением Siri вызвали не только изменения в стратегии компании, но и заметные кадровые перестановки в рядах профильных руководителей и специалистов. В идеале, Veritas должно позволить Apple подготовиться к конкуренции с ChatGPT и Perplexity, но в пределах интерфейса Siri. В новой версии он будет анализировать информацию, отображаемую пользователю на дисплее, а также поддерживать сквозную навигацию между несколькими пользовательскими устройствами.

Google создала и показала в деле ИИ, который заставляет роботов сначала думать, а потом делать

Компания Google DeepMind представила две новые модели искусственного интеллекта (ИИ) для робототехники Gemini Robotics 1.5 и Gemini Robotics-ER 1.5, которые совместно реализуют подход, при котором робот сначала «обдумывает» задачу и только потом выполняет действие. Технология основана на генеративных ИИ-системах и призвана преодолеть ограничения современных роботов, требующих длительной настройки под каждую конкретную задачу.

 Источник изображения: Google

Источник изображения: Google

Генеративные ИИ-системы, способные создавать текст, изображения, аудио и даже видео, становятся всё более распространёнными. Подобно тому, как такие модели генерируют указанные типы данных, они могут также выдавать последовательности действий для роботов. Именно на этом принципе построен проект Gemini Robotics от Google DeepMind, в рамках которого анонсированы две взаимодополняющие модели, позволяющие роботам «думать» перед тем, как действовать. Хотя традиционные большие языковые модели (LLM) имеют ряд ограничений, внедрение симулированного рассуждения значительно расширило их возможности, и теперь аналогичный прорыв может произойти в робототехнике.

Команда Google DeepMind считает, что генеративный ИИ способен кардинально изменить робототехнику, обеспечив роботам универсальную функциональность. В отличие от современных систем, которые требуют месяцев настройки под одну узкоспециализированную задачу и плохо адаптируются к новым условиям, новые ИИ-подходы позволяют роботам работать в незнакомых средах без перепрограммирования. Как отметила Каролина Парада (Carolina Parada), руководитель направления робототехники в DeepMind, роботы на сегодняшний день «чрезвычайно специализированы и сложны в развёртывании».

Для реализации концепции DeepMind разработала Gemini Robotics-ER 1.5 и Gemini Robotics 1.5. Первая — это модель «зрение–язык» (VLM) с функцией воплощённого рассуждения (embodied reasoning), которая анализирует визуальные и текстовые данные, формирует пошаговый план выполнения задачи и может подключать внешние инструменты, например, поиск Google для уточнения контекста. Вторая — модель «зрение–язык–действие» (VLA), которая преобразует полученные инструкции в физические действия робота, одновременно корректируя их на основе визуальной обратной связи и собственного процесса «обдумывания» каждого шага. По словам Канишки Рао (Kanishka Rao) из DeepMind, ключевым прорывом стало наделение робота способностью имитировать интуитивные рассуждения человека, то есть думать перед тем, как действовать.

Разработчики наглядно продемонстрировали, как работают новые модели — наделённый Gemini Robotics 1.5 человекоподобный робот Apollo на видео упаковывает вещи для поездки, а другой робот Aloha 2, точнее пара роборук — сортирует мусор.

Обе модели основаны на фундаментальной архитектуре Gemini, но дополнительно дообучены на данных, отражающих взаимодействие с физическим миром. Это позволяет роботам выполнять сложные многоэтапные задачи, приближая их к уровню автономных агентов. При этом система демонстрирует кроссплатформенную совместимость. В частности, навыки, внедрённые в одного робота, например, на двурукого Aloha 2, могут быть перенесены на другого, включая гуманоида Apollo, без дополнительной настройки под конкретную механику.

Несмотря на вероятный технологический прорыв, практическое применение технологии пока ограничено. Модель Gemini Robotics 1.5, отвечающая за управление роботами, доступна только доверенным тестировщикам. В то же время Gemini Robotics-ER 1.5 уже интегрирована в Google AI Studio, что даёт разработчикам возможность генерировать инструкции для собственных экспериментов с физически воплощёнными роботами. Однако, как считает Райан Уитвам (Ryan Whitwam) из Ars Technica, до появления бытовых роботов, способных выполнять повседневные задачи, ещё предстоит пройти значительный путь.

Meta✴ захотела улучшить свои приложения с помощью ИИ-технологий конкурирующей Google

Meta✴ обсуждает с Google Cloud (входит в холдинг Alphabet) возможность использования ИИ-моделей Gemini для улучшения рекламного бизнеса своей социальной сети Facebook✴, сообщил ресурс Information со ссылкой на источники, знакомые с ходом переговоров. Они уточнили, что переговоры находятся на ранней стадии, поэтому говорить о возможном подписании соглашения пока рано.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

В ходе переговоров сотрудники Meta✴ предложили Google Cloud дообучить модели Gemini и Gemma с открытым исходным кодом на основе рекламных данных Meta✴, чтобы улучшить возможности таргетинга рекламы.

Решение Meta✴ обратиться к ИИ-разработкам Google вместо собственных внутренних моделей подчёркивает проблемы, с которыми компания столкнулась при масштабировании технологий ИИ, несмотря на миллиардные инвестиции в исследования, инфраструктуру и кадры, отметил ресурс Reuters. Meta✴ и Google напрямую конкурируют на рынке онлайн-рекламы. Обе компании указали в своих последних квартальных отчётах, что инвестиции в ИИ способствуют росту их основного рекламного бизнеса.

В прошлом месяце Information сообщал, что Meta✴ и до этого рассматривала возможность сотрудничества с Google или OpenAI с целью повышения эффективности ИИ-технологий в своих разработках, включая повышение качества ответов на запросы в чат-боте Meta✴ AI, а также для реализации ИИ-функций в приложениях Meta✴ для социальных сетей.


window-new
Soft
Hard
Тренды 🔥
ESA запустило на орбиту два спутника Celeste для тестирования новых технологий навигации 3 ч.
Цены на Intel Arrow Lake Refresh выросли выше рекомендованных через 48 часов после начала продаж 3 ч.
Котировки акций производителей DRAM стабилизировались после первичного влияния TurboQuant 7 ч.
Microsoft потратит $146 млрд на ИИ, но это напугало инвесторов и вызвало падение котировок акций на 25 % 10 ч.
Anthropic привлекла рекордное количество подписчиков после скандала с Минобороны США 10 ч.
Худшая неделя за год: техногиганты потеряли миллиарды капитализации из-за войны и проблем Meta 21 ч.
AMD отметила десятилетие платформы AM4 и пообещала продолжить традицию в AM5 28-03 14:48
Meta готовит две модели умных очков Ray-Ban с коррекцией зрения 28-03 14:22
Китайская наука растёт с «шокирующей скоростью», и возможно, остальной мир уже проиграл 28-03 14:13
PON для OOB: Nokia представила платформу Aurelis for Data Centers для удалённого управления оборудованием в ЦОД 28-03 13:58