Сегодня 24 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → искусственный интеллект
Быстрый переход

Google DeepMind представила ИИ-модель Genie 2, которая может превращать тексты в трёхмерные игры

Команда Google DeepMind представила Genie 2 — вторую версию фундаментальной модели ИИ, способной на лету генерировать новые интерактивные цифровые окружения, или игровые миры.

 Источник изображений: Google

Источник изображений: Google

Напомним, оригинальная Genie была выпущена в феврале и могла генерировать виртуальные 2D-миры из синтезированных изображений. Genie 2 способна делать это в 3D и на основе текстовых команд.

Пользователь может описать желаемый мир, выбрать подходящий рендеринг и ступить в новое окружение. На каждом шагу человек/агент совершает действие (движение мыши, нажатие клавиши на клавиатуре), а Genie 2 имитирует его последствия.

 В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

В основе каждого примера — изображение, сгенерированное ИИ-моделью Imagen 3 на основе текстовой подсказки

По словам Google DeepMind, Genie 2 может генерировать последовательные интерактивные миры продолжительностью около минуты, хотя большинство показанных (см. видео ниже) примеров длятся 10−20 секунд.

По сравнению с первой версией Genie 2:

  • может запоминать элементы мира, которые не находятся в поле зрения;
  • может создавать окружение с разными перспективами (от первого или третьего лица, изометрическая камера и так далее);
  • может создавать комплексные трёхмерные сцены;
  • может моделировать разнообразные взаимодействия с объектами вроде лопания воздушных шаров, открытия дверей или подрыва взрывоопасным бочек выстрелом;
  • научилась анимировать персонажей разных типов;
  • научилась моделировать NPC и взаимодействия с ними;
  • научилась моделировать эффекты воды, дыма, гравитацию, освещение, отражения;
  • научилась моделировать интерактивное окружение на основе реальных фотографий.

По мнению Google DeepMind, Genie 2 демонстрирует потенциал фундаментальных моделей мира для создания разнообразных трёхмерных окружений и ускорения тренировок/тестирования ИИ-агентов (вроде того же SIMA).

Google DeepMind уточняет, что исследование находится на ранней стадии и требует значительных улучшений в областях возможностей агентов и генерации среды, но уже видит в Genie 2 решение структурной проблемы безопасной тренировки ИИ-агентов.

Сильный ИИ не станет спасением для человечества — придётся ждать сверхинтеллект, считает глава OpenAI

Около двух лет назад OpenAI заявила, что искусственный интеллект общего назначения (Artificial General Intelligence, AGI), который также называнию сильным ИИ или ИИ уровня человека, «может возвысить человечество» и «предоставить всем невероятные новые возможности». Теперь же генеральный директор OpenAI Сэм Альтман (Sam Altman) пытается снизить градус ожидания от появления AGI.

 Источник изображения: OpenAI Forum

Источник изображения: OpenAI Forum

«Я предполагаю, что мы достигнем AGI раньше, чем думает большинство людей в мире, и это будет иметь гораздо меньшее значение. И многие опасения по поводу безопасности, о которых говорили мы и другие стороны, на самом деле не возникнут в момент создания AGI. AGI можно создать. Мир после этого будет в основном развивается примерно так же, как и сейчас. Некоторые вещи начнут выполняться быстрее. Но переход от того, что мы называем AGI, до того, что мы называем сверхинтеллектом — это очень долгая дорога», — сказал Альтман во время интервью на саммите The New York Times DealBook в среду.

Альтман уже не первый раз преуменьшает значимость, казалось бы, теперь точно неизбежного создания искусственного интеллекта общего назначения, о котором когда-то говорилось в уставе самой компании OpenAI, и который, как она же заявляла, сможет «автоматизировать большую часть интеллектуального труда» человечества. Недавно глава OpenAI намекнул, что это может произойти уже в 2025 году и будет достижимо с помощью актуального специализированного программного и аппаратного обеспечения. Ходят слухи, что OpenAI просто объединит все свои большие языковые модели и назовёт это AGI.

Последующее заявление Альтмана об AGI прозвучало так, как будто OpenAI больше не рассматривает создание искусственного интеллекта общего назначения как нечто грандиозное, что способно решить все проблемы человечества: «Мне кажется, что экономические трудности в мире будут продолжаться немного дольше времени, чем думают люди, потому что в обществе много инерции. Поэтому в первые пару лет [после создания AGI], возможно, будет не так много изменений. А потом, возможно, последует много изменений».

Те надежды и возможные достижения, которые OpenAI ранее приписывала AGI, компания теперь возлагает на так называемый «сверхинтеллект», который как недавно спрогнозировал Альтман, может появиться «через несколько тысяч дней».

ChatGPT уличили в наглом вранье при поиске новостей в интернете

Специалисты Центра цифровой журналистики Tow при Колумбийском университете провели тестирование поисковика в популярном чат-боте на базе искусственного интеллекта ChatGPT компании OpenAI. Оказалось, что алгоритм не слишком хорошо справляется с поиском источников новостей и зачастую выдаёт неточные ответы.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

OpenAI открыла доступ к функции поиска в ChatGPT для пользователей в октябре этого года, заявив, что она способна предоставлять «быстрые и актуальные ответы со ссылками на соответствующие веб-источники». Однако в ходе тестирования этого инструмента оказалось, что он с трудом распознаёт цитаты из статей, даже если их публиковали издатели, которые разрешили OpenAI использовать свой контент для обучения больших языковых моделей (LLM).

Авторы исследования попросили ChatGPT указать источники «двухсот цитат из двадцати источников». Сорок из этих цитат были взяты из материалов издателей, которые запретили поисковому роботу OpenAI доступ к своим сайтам. Тем не менее, даже в этих случаях чат-бот уверенно отвечал, выдавая ложную информацию, а также в некоторых случаях признаваясь, что не уверен в достоверности предоставленной информации.

«В общей сложности ChatGPT вернул частично или полностью неправильные ответы в 153 случаях, тогда как неспособность дать точный ответ он признал лишь 7 раз. Только в этих 7 результатах чат-бот использовал уточняющие слова и фразы, такие как "похоже", "это возможно", "возможно", или утверждения вроде "я не смог найти оригинальную статью"», — говорится в сообщении исследователей.

Ещё в ходе серии тестов были выявлены случаи, когда поисковый инструмент ChatGPT выдавал результаты, в которых цитаты из письма в редакцию Orlando Sentinel ошибочно соотносились с материалами журнала Time. В другом примере, когда чат-бота попросили указать источник цитаты из статьи New York Times о находящихся под угрозой исчезновения китах, он выдал ссылку на веб-сайт, который попросту скопировал и опубликовал оригинальную статью.

ChatGPT сломается, если его спросить про Дэвида Майера

Интернет-пользователей заинтересовал странный баг в работе популярного чат-бота ChatGPT компании OpenAI. Дело в том, что если попросить его дать информацию о том, кто такой David Mayer (Дэвид Майер) или просто написать это имя, то в работе бота происходит сбой и он сообщает, что не может выполнить команду.

 Источник изображения: OpenAI

Источник изображения: OpenAI

«Я не могу ответить», — пишет ChatGPT, если попросить его написать имя Дэвида Майера по-английски. Этот баг вызвал целую волну поисковых запросов, авторы которых пытались узнать информацию об этом человеке, а также выяснить вероятность того, что ChatGPT запрограммирован на самоцензуру. Баг выглядит ещё более странно, если учесть, что сбой происходит при упоминании сочетания «Дэвид Майер» на английском языке, но в это же время бот может дать информацию, если написано о «Дэйве Майере». Также бот без проблем расскажет про Дэвида Майера на русском языке.

По данным источника, баг ChatGPT существует по меньшей мере несколько месяцев. Ещё в июне этого года один из пользователей чат-бота обнаружил, что просьба написать имя журналиста CNBC Дэвида Фабера (David Faber) приводит к появлению аналогичной ошибки и ChatGPT сообщает о том, что не может ответить на запрос.

 Источник изображения: ChatGPT

Источник изображения: ChatGPT

С тех пор энтузиасты с Reddit выявили шесть имён, которые приводят к сбою в работе ChatGPT. Среди них были Брайан Худ (Brian Hood) и Джонатан Терли (Jonathan Turley), обнаружившие ранее, что чат-бот выдумывает связанные с их именами факты, что потенциально могло навредить их репутации. Ещё ChatGPT не может корректно обрабатывать имя Гвидо Скорца (Guido Scorza), который является сотрудником итальянского отраслевого регулятора и автором публикации о том, как пользователи чат-бота могут попросить OpenAI запретить создавать контент с использованием их личных данных. В этот же список попал Джонатан Зиттрейн (Jonathan Zittrain), профессор Гарварда, предупреждавший об опасности искусственного интеллекта для человека.

Не исключено, что сбой в работе ChatGPT при упоминании определённых имён на самом деле является защитой чат-бота и OpenAI от исков о клевете. Подобная ситуация уже была: Брайан Худ из Австралии в середине 2023 года пригрозил подать в суд на OpenAI после того, как обнаружил, что ChatGPT ложно утверждал, что он был заключен в тюрьму за взяточничество, когда на самом деле он был осведомителем, который разоблачил корпоративные правонарушения. В результате, похоже, OpenAI просто вручную добавили в код ChatGPT фильтры на некоторые имена. И это может создать множество проблем в будущем, поскольку функциональность бота будет ограничена.

Что касается Дэвида Майера, то этот человек так и остаётся загадкой. Одним из наиболее известных людей с таким именем является Дэвид Майер де Ротшильд, наследник состояния семьи Ротшильдов, но о его связях со сферой ИИ ничего неизвестно.

В ChatGPT может завестись реклама, но часть руководства OpenAI против этого

Компания OpenAI, прославившаяся благодаря своему чат-боту ChatGPT на базе генеративного ИИ, обдумывает способы внедрения рекламы в свои ИИ-продукты. Компания находится в поиске новых источников дохода в рамках преобразования в коммерческую компанию и реклама может стать одним из них.

 Источник изображения: OpenAI

Источник изображения: OpenAI

После проведения в октябре раунда финансирования, позволившего привлечь $6,6 млрд, OpenAI сейчас является одной из самых дорогих частных компаний Кремниевой долины с оценкой в более чем $​​150 млрд. Благодаря успеху ChatGPT доходы OpenAI выросли примерно до $4 млрд в годовом исчислении, что ставит её в один ряд с самыми быстрорастущими стартапами всех времён. Число еженедельно активных пользователей чат-бота выросло за два года до более чем 250 млн. Но расходы OpenAI, связанные с разработкой передовых моделей ИИ, превышают доходы. В этом году расходы компании, как ожидается, превысят $5 млрд.

Один из крупнейших источников дохода OpenAI заключается в предоставлении доступа к интерфейсу прикладного программирования (API), который позволяет организациям и разработчикам создавать продукты на базе ИИ. Также компания зарабатывает на продажах индивидуальных и корпоративных лицензий на использование ChatGPT. Но, как отметил один из экспертов, «API — это не высокодоходный бизнес».

OpenAI наращивает усилия по получению дохода от своих продуктов, таких как поисковая система на базе ИИ. Её конкурент Perplexity уже запустил пилотный проект по развёртыванию рекламы в своей поисковой системе на базе ИИ.

Сара Фрайар (Sarah Friar), финансовый директор OpenAI, ранее занимавшая руководящие посты в Nextdoor, Square и Salesforce, отметила в интервью Financial Times, что директор по продуктам компании Кевин Вейл (Kevin Weil) имеет опыт создания продуктов с рекламной поддержкой на основных технологических платформах, включая Instagram и X. В мае OpenAI также наняла на должность вице-президента Шивакумара Венкатарамана (Shivakumar Venkataraman), который ранее возглавлял команду поисковой рекламы Google.

Как утверждают источники, на данный момент руководители OpenAI разделились во мнении о том, как должна выглядеть реклама на этой платформе. Фрайар указала на то, что рекламные модели имеют свои недостатки, а также на то, что внедрение рекламы заставляет компанию больше обращать внимание на требования рекламодателей вместо удовлетворения потребностей пользователей. «Я не исключаю рекламу, — сообщила она. — Но на данный момент в том, как мы работаем, есть много положительных моментов».

Следует отметить, что не все в IT-отрасли поддерживают планы OpenAI по реструктуризации в коммерческую компанию. Миллиардер Илон Маск (Elon Musk) и вовсе потребовал через суд запретить OpenAI превращаться в коммерческую организацию.

Разработчик браузера Arc анонсировал Dia — новый обозреватель с ИИ, который может работать без пользователя

Разработчики из The Browser Company, создавшие интернет-обозреватель Arc Browser для компьютеров и мобильных устройств, представили новый браузер под названием Dia. Он сфокусирован на инструментах на базе искусственного интеллекта. За последние годы стартап выпустил приложение Arc для macOS и Windows и Arc Search для Android и iOS, но теперь разработчики взялись за реализацию проекта значительно более широкой направленности.

 Источник изображения: The Browser Company

Источник изображения: The Browser Company

Запуск браузера Dia запланирован на начало следующего года. Однако уже сейчас разработчики запустили посвящённый этому продукту веб-сайт, на котором опубликовано видео о будущем приложении, а также перечислен список открытых вакансий. «Искусственный интеллект не будет существовать в виде приложения. Или кнопки. Мы считаем, что это будет совершенно новая среда, построенная на основе веб-браузера», — говорится в сообщении разработчиков на сайте Dia.

Вместе с этим гендиректор The Browser Company Джош Миллер (Josh Miller) показал ранние прототипы нового веб-обозревателя и доступные в нём функции. В одной из демонстраций был показан инструмент, работающий с функцией вставки и помогающий написать следующее предложение или получить информацию в интернете. Этот инструмент работает, когда пользователь набирает текст на какую-то распространённую тему, например, о сроках запуска и характеристиках новых iPhone.

В другой демонстрации показано, как пользователь может вводить в адресную строку браузера определённые команды для выполнения разных действий, таких как поиск документов по описанию, отправка данных по электронной почте, планирование встреч в календаре через подсказки на естественном языке. Некоторые из анонсированных функций похожи на те, что уже есть в других браузерах. Речь идёт об инструментах, которые помогают писать сообщения или работать с календарём.

В третьей демонстрации было показано, как Dia выполняет действия от имени пользователя, например, добавляет товары в корзину на Amazon, отталкиваясь от полученного по почте списка. Браузер делает это автоматически, находя нужные товары на сайте Amazon и перемещая их в корзину. В другом примере Dia анализирует таблицу Notion с данными участников видеосъёмки и предлагает отправить электронное сообщение каждому из них.

Вместе с этим Миллер пообещал не изменять сильно дизайн и функции браузера Arc, хотя и признал, что этот продукт вряд ли привлечёт внимание широкой аудитории. На этом фоне компания решила создать по-настоящему потребительский продукт, в котором функции на основе ИИ будут работать без сбоев и который, возможно, будет приносить прибыль.

Инвестиции в разработку отечественных ИИ-серверов выросли на 40 %

Инвестиции отечественных производителей вычислительной техники в разработку оборудование для работы с искусственным интеллектом (ИИ) увеличились в этом году на 40 %, пишет «Коммерсантъ» со ссылкой на данные ряда участников рынка.

 Источник изображения: «Гравитон»

Источник изображения: «Гравитон»

Об этом, в частности, сообщили «Коммерсанту» в консорциуме АНО «Вычислительная техника», не раскрывая абсолютные цифры. АНО «Вычислительная техника» объединяет 33 разработчика вычислительной техники, включая «Аквариус», Yadro, ГК «Элемент» и других. По данным консорциума, в 2024 году инвестиции в оборудование для ИИ составляют 14,2 % общего объёма расходов на разработку. При этом выпуск такого оборудования вырос за отчётный период на 10,5 %. Согласно прогнозу АНО «Вычислительная техника», в течение трёх лет оборудование для ИИ может занять в среднем 23,7 % выручки разработчиков электроники.

Разработка сервера с ИИ с постановкой на производство оценивается в среднем в 100 млн руб. Ранее сообщалось, что за девять месяцев 2024 года спрос на ИИ-серверы в госсекторе России вырос вдвое.

В Fplus тоже сообщили о 40-процентном росте инвестиций в разработку серверов для ИИ. Портфель компании включает четыре модели собственной разработки, которые будут внесены в реестр Минпромторга. «В линейке уже есть результат сотрудничества с отечественным производителем нейроускорителей — компанией НТЦ “Модуль”, а в ближайшее время мы планируем провести разработку решений и с другими российскими вендорами видеокарт для ИИ», — рассказали в Fplus.

В компании Kraftway также увеличили инвестиции в оборудование для ИИ в 2024 году, сообщил вице-президент компании Ренат Юсупов. Он отметил, что в 2025 году Kraftway планирует инвестировать в разработку и производство систем хранения данных (СХД) для нейросетей, считая, что с развитием ИИ уже со следующего года возникнет серьёзный интерес к такому оборудованию. По оценке Юсупова, стоимость одного сервера для ИИ начинается от 1,5 млн руб. в зависимости от заявленной мощности.

В компании «Гравитон» сообщили о разработке нескольких платформ для ИИ, которые появятся на рынке в 2025 году. В настоящее время доля разработок под задачи ИИ в общем портфеле компании составляет около 20 %.

В НТЦ «Модуль» отметили многократный рост интереса к их продукции в 2024 году, в том числе из-за запуска производства ИИ-серверов. Также в компании сообщили о планах увеличить в 2025 году выпуск собственных нейроускорителей в компактном и серверном исполнении, встраиваемых вычислительных блоков и портативных компьютеров.

Учёные создали ветряную турбину, которая идеально подходит для своего места эксплуатации

Учёные продемонстрировали преимущество точной привязки профиля лопастей ветряной турбины к географии — к конкретным условиям эксплуатации. Ветровая обстановка везде различная, и она сильно отличается в условиях городской застройки. Но раньше учесть все факторы для оптимизации работы ветряной турбины было сложно и дорого. Сегодня с этим «на раз» справляется ИИ. Именно это помогло воплотить проект в жизнь.

 Источник изображения: University of Birmingham

Лопасти турбины на заднем фоне. Источник изображения: University of Birmingham

Созданием максимально оптимизированных лопастей для городских ветряных турбин занялись учёные из Бирмингемского университета (University of Birmingham). Разработка получила название «Бирмингемские лопасти» (Birmingham Blade). Всего за несколько недель ИИ проверил более 2000 профилей лопастей турбин, сэкономив учёным годы работы и миллионы средств.

Идея использовать искусственный интеллект для проекта также опиралась на желание уйти от человеческого восприятия проблемы — от сложившихся в отрасли стереотипов. Люди, проектируя лопасти ветряных турбин, всегда искали компромисс между различными параметрами. ИИ в этом плане получил полную свободу и смог взглянуть на проблему со всех сторон.

Следует отметить, что ИИ тоже был особенным. Его создали учёные Бирмингемского университета. Это платформа EvoPhase, которая имитирует естественный отбор. Такой подход позволяет одновременно оптимизировать множество различных параметров, избегая традиционных компромиссов между теми или иными факторами производительности. Сами лопасти изготовила местная компания KwikFab — специалист по прецизионным металлическим конструкциям. На изготовление и доставку также ушло мало времени.

«Нам нужна была турбина, которая могла бы улавливать относительно низкие скорости ветра в Бирмингеме, одновременно управляя турбулентностью, вызванной окружающими зданиями, — объяснил Леонард Никусан (Leonard Nicusan), технический директор EvoPhase. — Конструкция также должна была быть компактной и лёгкой, чтобы подходить для установки на крыше».

Испытания показали, что спроектированная ИИ конструкция лопастей оказалась в конкретном месте в семь раз более эффективной, чем если бы использовались обычные лопасти. Теперь опыт Бирмингема перенимает Эдинбург. Для условий эксплуатации на новом месте ИИ разрабатывает другие лопасти, и такие он может создать для любой местности и любой «географии», что, в идеале, способно сделать ветроэнергетику намного более доступной и недорогой.

Илон Маск пообещал «сделать игры снова великими», открыв ИИ-студию на базе xAI

Владелец X, гендиректор Tesla, руководитель SpaceX и глава Neuralink Илон Маск (Elon Musk), недавно ставший богатейшим человеком в истории Земли, рассказал, как собирается поднимать игровую индустрию с колен.

 Источник изображения: X (GailAlfarATX)

Источник изображения: X (GailAlfarATX)

Комментируя высказывание соавтора Dogecoin Билли Маркуса (Billy Markus) о том, как игровые разработчики и СМИ оказались заложниками идеологий, Маск заявил, что «слишком много игровых студий находятся под контролем огромных корпораций».

Выходом из сложившейся ситуации бизнесмен видит использование собственной огромной корпорации для создания новой студии разработки игр на базе искусственного интеллекта.

«xAI (стартап в сфере искусственного интеллекта, стоимость которого недавно взлетела до $45 млрд — прим.) запустит игровую ИИ-студию, чтобы сделать игры снова великими!» — сообщил Маск.

 Источники изображения: GameRant и Blizzard Entertainment

Источники изображения: GameRant и Blizzard Entertainment

Стоит отметить, что xAI создавалась для ускорения научных открытий человечества и продвижения коллективного понимания вселенной. О планах на открытие игровой студии компания не объявляла.

У себя в микроблоге Маск не стесняется хвастаться своими успехами и достижениями в гейминге (недавно он причислил себя к лучшим игрокам Diablo IV), но насколько бизнесмен разбирается в тонкостях разработки игр, вопрос открытый.

Портал PC Gamer добавляет, что вероятность приведения озвученных Маском планов в исполнение крайне мала, однако допускает повторение сценария с покупкой бизнесменом соцсети Twitter (теперь X).

Alibaba представила открытую ИИ-модель, которая лучше OpenAI

Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна решать сложные логические и математические задачи, содержит 32,5 миллиарда параметров и может обрабатывать запросы длиной до 32 000 слов. По тестам, проведённым Alibaba, QwQ-32B-Preview превосходит модели o1-preview и o1-mini от OpenAI в ряде показателей.

 Источник изображения: Copilot

Источник изображения: Copilot

Одним из ключевых преимуществ QwQ-32B-Preview, как сообщает TechCrunch, является её производительность в тестах AIME и MATH. Тест AIME оценивает работу модели с помощью других искусственных интеллектов, а MATH представляет собой набор текстовых математических задач. Благодаря своим особенностям, этот ИИ-бот способен решать сложные задачи и логические головоломки. Однако отмечается, что QwQ-32B-Preview не лишена недостатков: она может неожиданно менять язык общения, зацикливаться на некоторых моментах и хуже справляется с заданиями, когда требуется задействовать здравый смысл.

Интересной особенностью QwQ-32B-Preview является способность «проверять саму себя». Это помогает избегать ошибок-ловушек, свойственных другим системам искусственного интеллекта, однако замедляет процесс нахождения решений. Как и модели o1 от OpenAI, новая разработка Alibaba решает задачи поэтапно, постепенно анализируя и планируя дальнейшие шаги.

Несмотря на то, что QwQ-32B-Preview доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 (свободное программное обеспечение), что позволяет использовать её в коммерческих целях, Alibaba раскрыла лишь часть компонентов модели, тем самым не позволяя изучить внутренние механизмы работы алгоритма. Таким образом, несмотря на заявления об «открытости», модель остаётся промежуточным вариантом между закрытыми и открытыми системами (open source license).

Китайское происхождение модели также накладывает определённые ограничения. Как и другие разработки из Китая, QwQ-32B-Preview следует требованиям местного регулятора, который проверяет ИИ на соответствие «основным социалистическим ценностям». На вопросы политического характера, связанных с Китаем, модель отвечать откажется.

Стоит сказать, что интерес к «рассуждающим» моделям растёт на фоне снижения эффективности традиционного подхода к увеличению возможностей ИИ, основанного на простом масштабировании данных и вычислительных мощностей. Компании, такие как OpenAI, Google и Anthropic, всё чаще сталкиваются с замедлением прогресса своих технологий, что в свою очередь, стимулирует разработчиков искать новые подходы, например, такие как «вычисления на этапе выполнения» (test-time compute), которые дают моделям дополнительное время для обработки задач. При этом крупные лаборатории, включая Google, активно инвестируют в развитие подобных технологий, что подтверждает их ключевую роль в будущем искусственного интеллекта.

«Убийца» ChatGPT от Илона Маска скоро пойдёт в массы — фривольный бот Grok получит приложение

Весь этот год Илон Маск (Elon Musk) прикладывал массу усилий для того, чтобы максимально ускорить развитие своего стартапа в области искусственного интеллекта xAI. Теперь ему предстоит превратить его в настоящий бизнес, а это будет непросто.

 Источник изображения: Elon Musk / X

Источник изображения: Elon Musk / X

Маск основал xAI летом прошлого года в попытке догнать разработчика ИИ-бота ChatGPT, компанию OpenAI, соучредителем которой он был и которую покинул в 2018 году. Для работы в xAI Маск старался переманить талантливых специалистов со всей отрасли. Он также организовал подрядчиков для строительства нового центра обработки данных в максимально сжатые сроки. Теперь Маск пообещал, что запущенный ранее в этом году в Мемфисе ЦОД поможет xAI запустить самый мощный в мире ИИ «по всем показателям» уже к декабрю.

Инвесторы поверили в новый стартап миллиардера или, по крайней мере, доверились его опыту. Компания привлекла не менее $11 млрд инвестиций, благодаря чему рыночная стоимость xAI выросла до $50 млрд. По этому показателю стартап стал вторым в мире частным разработчиком в сфере ИИ, уступая лишь OpenAI.

Однако в качестве приносящего прибыль предприятия xAI на данном этапе едва ли можно сравнить с OpenAI. Стартап сообщил инвесторам, что выручка компании лишь превысит $100 млн в год, тогда как OpenAI рассчитывает получить в этом году около $4 млрд. Основная часть дохода xAI поступает от компаний самого Маска. Главный продукт стартапа, раскованный ИИ-бот Grok, доступен платным подписчикам соцсети X, также принадлежащей миллиардеру. По данным источника, xAI разрабатывает функции поддержки на базе нейросетей для клиентов Starlink компании SpaceX, ещё одного предприятия миллиардера. Стартап также обсуждал сделку с Tesla, в рамках которой xAI будет получать часть доходов автопроизводителя в обмен на предоставление доступа к своим технологиям и ресурсам.

Сейчас xAI только пытается встать на ноги. Ранее в этом месяце компания выпустила платный инструмент, с помощью которого разработчики могут создавать программные продукты с помощью Grok, и предложила скидки в качестве стимула для его использования. По данным осведомлённых источников, уже в следующем месяце стартап может запустить отдельное приложение Grok для потребителей, которое будет представлять собой аналог ChatGPT.

 Источник изображения: xAI

Источник изображения: xAI

Тем не менее, xAI поздно стартует на рынке с высокой конкуренцией. OpenAI, Alphabet, Google, Meta Platforms и Anthropic уже выпустили чат-боты, которые доступны для потребителей и коммерческих клиентов с прошлого года. Продукты упомянутых компаний более известны и популярны, чем Grok, и xAI придётся приложить немало усилий, чтобы попытаться изменить это. «xAI проделала огромную работу по быстрому созданию собственной инфраструктуры, развитию команды и операций. Но они всё ещё пробиваются на рынок», — считает Джесси Майкл Хан (Jesse Michael Han), основатель компании Morph Lab, занимающейся облачной инфраструктурой в сфере ИИ.

Во время выступления перед потенциальными сотрудниками и инвесторами команда Маска упоминала два преимущества в гонке по созданию самого мощного ИИ. Первое преимущество заключается в наличии эксклюзивных данных X и Tesla, которые используются для обучения нейросетей xAI. Второе преимущество — это навязчивое стремление строить большие ЦОД быстрее конкурентов. ЦОД xAI в Мемфисе получил название Colossus и был построен всего за 122 дня. В настоящее время в нём используются 100 тыс. ИИ-ускорителей от Nvidia, что делает эту площадку одним из крупнейших кластеров для разработки и запуска ИИ-технологий в мире. По данным источника, компания планирует потратить часть от привлечённых в рамках недавнего раунда финансирования $5 млрд на то, чтобы удвоить количество используемых в Colossus ускорителей. Это делается для привлечения ещё больших инвестиций в следующем году.

После того, как запущенный в конце 2022 года ChatGPT быстрыми темпами набрал популярность, Маск закрыл OpenAI доступ к данным X. Позднее миллиардер заявил о намерении создать менее политкорректный ИИ, который он тогда называл TruthGPT. В июле 2023 года была организована компания xAI, одним из ведущих разработчиков в которой стал Игорь Бабушкин, специалист в сфере искусственного интеллекта, ранее работавший в Google DeepMind и OpenAI. На начальном этапе сотрудники xAI трудились в офисах X, Tesla и удалённо.

Чтобы получить доступ к вычислительным мощностям, Маск обратился к своему давнему другу Ларри Эллисону (Larry Ellison), который возглавляет Oracle. После этого xAI зарезервировала значительное количество графических ускорителей Oracle и в ноябре 2023 года представила миру ИИ-бота Grok, который на тот момент был не так хорош, как ChatGPT. Маск попытался решить эту проблему наращиванием вычислительных мощностей. Для этого он обратился в Nvidia, чтобы компания перенаправила xAI и X 12 тыс. ускорителей, ранее зарезервированных для Tesla. Он также усилил давление на Oracle, чтобы добиться выделения больших мощностей под нужды своей компании.

 Источник изображения: servethehome.com

Источник изображения: servethehome.com

Весной этого года миллиардер пришёл к выводу, что Oracle недостаточно быстро наращивает мощности, после чего принял решение о необходимости создания собственного ЦОД. Для этого он выбрал списанное производственное помещение в Мемфисе, где быстрыми темпами началось строительство. Сотрудники подрядчиков работали без остановки в три восьмичасовые смены. Отмечается, что xAI не планировала строительство данного объекта заранее. Этот процесс мог занять 7-8 месяцев, но компания оперативно решала возникающие проблемы, стремясь закончить стройку как можно быстрее.

Пока xAI ожидала получения разрешения городских властей на использование большого количества энергии, продолжались работы, на объекте устанавливались генераторы и другое оборудование. Местные жители были встревожены такой активностью, а защитники окружающей среды пытались препятствовать реализации проекта. Тем не менее, уже в начале сентября Маск объявил о запуске Colossus.

Несмотря на достижение определённых успехов, Маск по-прежнему зациклен на OpenAI. В этом году он подал в суд на компанию за то, что та, якобы нарушила договор о сохранении некоммерческого характера и пыталась отговорить инвесторов вкладывать деньги в xAI.

Искусственный интеллект научили разоблачать учёных-шарлатанов

Научный поиск вскоре может претерпеть коренные изменения — искусственный интеллект показал себя в качестве непревзойдённого человеком инструмента для анализа невообразимых объёмов специальной литературы. В поставленном эксперименте ИИ смог точнее людей-экспертов дать оценку фейковым и настоящим научным открытиям. Это облегчит людям научный поиск, позволив машинам просеивать тонны сырой информации в поисках перспективных направлений.

 Источник изображения: ИИ-генерация Кандинский 3.1/3DNews

Источник изображения: ИИ-генерация Кандинский 3.1/3DNews

С самого начала разработчики генеративных ИИ (ChatGPT и прочих) сосредоточились на возможности больших языковых моделей (LLM) отвечать на вопросы, обобщая обширные данные, на которых они обучались. Учёные из Университетского колледжа Лондона (UCL) поставили перед собой другую цель. Они задались вопросом, могут ли LLM синтезировать знания — извлекать закономерности из научной литературы и использовать их для анализа новых научных работ? Как показал опыт, ИИ удалось превзойти людей в точности выдачи оценок рецензируемым работам.

«Научный прогресс часто основывается на методе проб и ошибок, но каждый тщательный эксперимент требует времени и ресурсов. Даже самые опытные исследователи могут упускать из виду важные выводы из литературы. Наша работа исследует, могут ли LLM выявлять закономерности в обширных научных текстах и прогнозировать результаты экспериментов», — поясняют авторы работы. Нетрудно представить, что привлечение ИИ к рецензированию далеко выйдет за пределы простого поиска знаний. Это может оказаться прорывом во всех областях науки, экономя учёным время и деньги.

Эксперимент был поставлен на анализе пакета научных работ по нейробиологии, но может быть распространён на любые области науки. Исследователи подготовили множество пар рефератов, состоящих из одной настоящей научной работы и одной фейковой — содержащей правдоподобные, но неверные результаты и выводы. Пары документов были проанализированы 15 LLM общего назначения и 117 экспертами по неврологии человека, прошедшими специальный отбор. Все они должны были отделить настоящие работы от поддельных.

Все LLM превзошли нейробиологов: точность ИИ в среднем составила 81 %, а точность людей — 63 %. В случае анализа работ лучшими среди экспертов-людей точность повышалась до 66 %, но даже близко не подбиралась к точности ИИ. А когда LLM специально обучили на базе данных по нейробиологии, точность предсказания повысилась до 86 %. Исследователи говорят, что это открытие прокладывает путь к будущему, в котором эксперты-люди смогут сотрудничать с хорошо откалиброванными моделями.

Проделанная работа также показывает, что большинство новых открытий вовсе не новые. ИИ отлично вскрывает эту особенность современной науки. Благодаря новому инструменту учёные, по крайней мере, будут знать, стоит ли заниматься выбранным направлением для исследования или проще поискать его результаты в интернете.

Microsoft отмела обвинения в сборе данных из пользовательских документов Word и Excel для обучения ИИ

Microsoft заявила, что не использует данные пользователей Microsoft 365 для обучения больших языковых моделей (LLM), которые становятся основой ИИ-алгоритмов. Это разъяснение касается распространившихся в последние недели в интернете сообщений, авторы которых утверждают, что компания активировала функцию сбора содержимого документов Word и Excel и пользователи должны самостоятельно отключать её, чтобы эти данные не использовались для обучения нейросетей.

По словам представителя Microsoft, путаница произошла из-за опции в меню «Параметры конфиденциальности» под названием «Дополнительные подключенные возможности». Он отметил, что данная функция позволяет «искать информацию в интернете» и она действительно активирована по умолчанию, но в её описании никак не упоминается обучение ИИ. Похоже, что путаница могла возникнуть из-за опубликованного в сентябре обучающего документа Microsoft, в котором описывался длинный список подключенных возможностей Office, которые анализируют пользовательский контент. В нём не было сказано, что контент пользователей пакета офисных приложений используется для обучения LLM.

«В приложениях Microsoft 365 мы не используем данные клиентов для обучения LLM. Этот параметр включает только функции, требующие доступа к интернету, такие как совместное редактирование документов», — говорится в сообщении, опубликованном в аккаунте Microsoft 365 в соцсети X. Глава отдела коммуникаций Microsoft Фрэнк Шоу (Frank Shaw) в своём аккаунте на платформе Bluesky также опроверг заявления о том, что софтверный гигант использует данные пользователей из Microsoft 365 для обучения нейросетей.

Нашумевший ИИ-генератор видео Sora без разрешения OpenAI приоткрыли для всех желающих

Группа создателей видеоконтента, привлечённых OpenAI к участию разработке ИИ-генератора видео Sora, похоже, открыли доступ к ней для всех желающих, сообщил TechCrunch. Во вторник группа опубликовала на платформе разработки ИИ Hugging Face интерфейс, связанный с API Sora OpenAI, с помощью которого пользователи могут генерировать 10-секундные видео с разрешением до 1080p.

 Источник изображения: Levart_Photographer/unsplash.com

Источник изображения: Levart_Photographer/unsplash.com

Свой поступок художники объяснили протестом против «отмывки искусства». По их словам, OpenAI оказывает давление на ранних тестировщиков Sora, включая участников Red Team и творческих партнёров, чтобы те создавали позитивную историю вокруг Sora и не выплачивает им справедливую компенсацию за их работу.

«Эта программа раннего доступа, похоже, меньше связана с творческим самовыражением и критикой, а больше с PR и рекламой», — указали они в сообщении, прикрепленном к интерфейсу. «Мы не против использования технологии ИИ в качестве инструмента для искусства (если бы мы были против, нас, вероятно, не пригласили бы в эту программу), — написали создатели видеоконтента. — Мы не согласны с тем, как была развёрнута эта программа для художников и как инструмент формируется перед возможным публичным выпуском».

По другой версии, о которой сообщил ресурс BGR, пользователь X @legit_rumors рассказал, что ресурс HuggingFace нашел доступ к OpenAI Sora через каналы Discord и поделился некоторыми примерами использования этого инструмента для создания видео с использованием ИИ в Сети. Как бы то ни было, OpenAI вскоре закрыла возможность использовать Sora всем желающим. Некоторым пользователям соцсети X удалось с помощью интерфейса загрузить образцы видеороликов, созданных Sora.

Напомним, что во время анонса Sora компания OpenAI сообщила, что это «модель ИИ, которая может создавать реалистичные и образные сцены согласно текстовым инструкциям. Sora может создавать видео длительностью до минуты, сохраняя визуальное качество и следуя указаниям пользователя».

В настоящее время доступ к платформе имеют лишь небольшое число визуальных художников, дизайнеров и режиссеров, и сотрудничество с ними позволяет компании «получать обратную связь о том, как усовершенствовать модель, чтобы она была максимально полезной для творческих профессионалов».

Nvidia представила ИИ-модель Fugatto, которая «понимает и генерирует звук, как это делают люди»

Nvidia представила новую экспериментальную генеративную модель ИИ, которую компания описывает как «швейцарский армейский нож для звука». Модель Fugatto (Foundational Generative Audio Transformer Opus 1) использует текстовые подсказки для генерации новых или изменения существующих музыкальных, голосовых и звуковых файлов. В создании модели принимали участие разработчики со всего мира, что усилило «многоакцентные и многоязычные возможности модели».

 Источник изображения: Nvidia

Источник изображения: Nvidia

«Мы хотели создать модель, которая понимает и генерирует звук, как это делают люди», — рассказал участник проекта и менеджер по прикладным исследованиям звука в Nvidia Рафаэль Валле (Rafael Valle). Компания предложила несколько сценариев, в которых модель Fugatto может оказаться востребованной:

  • Музыкальные продюсеры могут быстрого создать прототип песни, которую легко редактировать, пробуя разные стили, голоса и инструменты.
  • Fugatto может использоваться при создании инструментов для изучения языка с выбором наиболее подходящего голоса.
  • Разработчики видеоигр могут использовать её для создания вариаций предварительно записанных ресурсов, чтобы соответствовать изменениям в игре на основе выбора и действий игроков.

Исследователи утверждают, что модель при некоторой дополнительной тонкой настройке также может выполнять задачи, не входившие в её предварительное обучение. Модель может объединять отдельные инструкции, например, генерировать речь с определёнными интонациями и акцентом или звук пения птиц во время грозы. Модель также умеет генерировать изменяющиеся со временем звуки, например, шум приближающегося ливня или удаляющегося поезда.

Fugatto не является первой технологией генеративного ИИ, которая может создавать звуки из текстовых подсказок. Ранее Meta выпустила аналогичную модель ИИ с открытым исходным кодом. Google предлагает ИИ-инструмент собственной разработки для преобразования текста в музыку MusicLM, доступ к которому можно получить через сайт компании AI Test Kitchen.

Nvidia пока не предоставила публичный доступ к Fugatto и воздержалась от комментариев на этот счёт.


window-new
Soft
Hard
Тренды 🔥
Perplexity выпустила более функциональный заменитель «Google Ассистента» для Android 7 мин.
Google упростила управление умным домом — Google Home получил ИИ-помощника Gemini 40 мин.
«Абсолютно завораживающе»: новый трейлер амбициозной ролевой игры Clair Obscur: Expedition 33 взбудоражил геймеров и раскрыл дату выхода 2 ч.
AMD выпустила необязательный драйвер с поддержкой Marvel’s Spider-Man 2 и Final Fantasy VII Rebirth 2 ч.
В мобильном магазине Epic Games появятся сторонние игры и их бесплатные раздачи 4 ч.
Google прокачала защиту Android-смартфонов от воров — вне дома придётся чаще сканировать отпечатки пальцев 5 ч.
«Хлебные крошки» в адресе сайтов исчезнут из результатов мобильного поиска Google 7 ч.
OpenAI выпустила ИИ-агента Operator, который будет сидеть в интернете вместо пользователя 12 ч.
Bethesda подтвердила дату выхода Doom: The Dark Ages — геймплей и системные требования «самой амбициозной игры» id Software 13 ч.
Альтман пообещал доступ к думающей ИИ-модели o3-mini в бесплатной версии ChatGPT 14 ч.
Dasung выпустила компактный 10,3-дюймовый монитор с матрицей на электронных чернилах и частотой обновления 60 Гц 5 ч.
«Война против крипты завершена»: Трамп объявил о создании национального криптовалютного резерва США 5 ч.
Fitbit заплатит штраф $12 млн за то, что её смарт-часов обожгли руки десяткам людей 6 ч.
Крупный магазин раскрыл дату старта продаж видеокарт AMD Radeon RX 9070 7 ч.
Microsoft выпустит компактные версии Surface Pro и Surface Laptop на чипе Snapdragon X 7 ч.
В IV квартале 2024 года SK hynix получила самую большую операционную прибыль в Южной Корее, опередив Samsung 10 ч.
Новая статья: Обзор игрового QD-OLED 4K-монитора Digma Pro Vision L: взгляд свысока 12 ч.
Galaxy S25 получили спутниковую связь Snapdragon Satellite, но Samsung забыла об этом рассказать 13 ч.
SoftBank и OpenAI намерены выделить по $19 млрд на ИИ-проект Stargate, но Маск уверен что на это нет денег 13 ч.
Дебютировал защищённый смартфон MIG S6 на отечественной платформе «РЕД ОС М» 16 ч.