Сегодня 24 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Alibaba представила открытую ИИ-модель, которая лучше OpenAI

Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна решать сложные логические и математические задачи, содержит 32,5 миллиарда параметров и может обрабатывать запросы длиной до 32 000 слов. По тестам, проведённым Alibaba, QwQ-32B-Preview превосходит модели o1-preview и o1-mini от OpenAI в ряде показателей.

 Источник изображения: Copilot

Источник изображения: Copilot

Одним из ключевых преимуществ QwQ-32B-Preview, как сообщает TechCrunch, является её производительность в тестах AIME и MATH. Тест AIME оценивает работу модели с помощью других искусственных интеллектов, а MATH представляет собой набор текстовых математических задач. Благодаря своим особенностям, этот ИИ-бот способен решать сложные задачи и логические головоломки. Однако отмечается, что QwQ-32B-Preview не лишена недостатков: она может неожиданно менять язык общения, зацикливаться на некоторых моментах и хуже справляется с заданиями, когда требуется задействовать здравый смысл.

Интересной особенностью QwQ-32B-Preview является способность «проверять саму себя». Это помогает избегать ошибок-ловушек, свойственных другим системам искусственного интеллекта, однако замедляет процесс нахождения решений. Как и модели o1 от OpenAI, новая разработка Alibaba решает задачи поэтапно, постепенно анализируя и планируя дальнейшие шаги.

Несмотря на то, что QwQ-32B-Preview доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 (свободное программное обеспечение), что позволяет использовать её в коммерческих целях, Alibaba раскрыла лишь часть компонентов модели, тем самым не позволяя изучить внутренние механизмы работы алгоритма. Таким образом, несмотря на заявления об «открытости», модель остаётся промежуточным вариантом между закрытыми и открытыми системами (open source license).

Китайское происхождение модели также накладывает определённые ограничения. Как и другие разработки из Китая, QwQ-32B-Preview следует требованиям местного регулятора, который проверяет ИИ на соответствие «основным социалистическим ценностям». На вопросы политического характера, связанных с Китаем, модель отвечать откажется.

Стоит сказать, что интерес к «рассуждающим» моделям растёт на фоне снижения эффективности традиционного подхода к увеличению возможностей ИИ, основанного на простом масштабировании данных и вычислительных мощностей. Компании, такие как OpenAI, Google и Anthropic, всё чаще сталкиваются с замедлением прогресса своих технологий, что в свою очередь, стимулирует разработчиков искать новые подходы, например, такие как «вычисления на этапе выполнения» (test-time compute), которые дают моделям дополнительное время для обработки задач. При этом крупные лаборатории, включая Google, активно инвестируют в развитие подобных технологий, что подтверждает их ключевую роль в будущем искусственного интеллекта.

Бывшие руководители Android разрабатывают ОС для ИИ-агентов, которые работают без участия человека

Бывшие сотрудники Google, возглавлявшие разработку мобильной операционной системы Android, организовали новый стартап, целью которого стало создание программной платформы для ИИ-агентов. Речь идёт о создании облачной платформы, которая сможет поддерживать работоспособность ИИ-агентов и будет доступна на разных типах устройств.

 Источник изображения: starline / freepik.com

Источник изображения: starline / freepik.com

Одним из соучредителей нового стартапа под названием /dev/agents стал Хьюго Барра (Hugo Barra), бывший вице-президент Google по управлению продуктами Android. Он заявил, что новая компания вернётся к «корням Android». «Мы видим перспективы ИИ-агентов, но нам, как разработчикам, слишком сложно сделать что-то хорошее», — сказал соучредитель и генеральный директор нового стартапа Дэвид Синглтон (David Singleton), бывший вице-президент Google по разработке Android. По его мнению, индустрии нужно что-то подобное Android, но для ИИ.

Работающие в сфере ИИ компании, такие как Microsoft, OpenAI и Anthropic, продвигают так называемых ИИ-агентов в качестве следующего большого скачка в развитии инструментов ИИ. ИИ-агентов представляют цифровых помощников, которые смогут выполнять задачи и принимать решения автономно и без участия человека. Например, они могут бронировать авиабилеты, запускать и управлять сторонними приложениями. Новый стартап хочет создать облачную «операционную систему следующего поколения для ИИ-агентов», которая сможет работать на смартфонах, ноутбуках и даже в автомобилях.

Планируется разработка нового пользовательского интерфейса, который позволит людям более естественно взаимодействовать с ИИ-агентами посредством использования разных устройств. Стартапу предстоит не только создать новые шаблоны пользовательского интерфейса, но также переосмыслить модель конфиденциальности и сформировать платформу для разработчиков, которая радикально упростит создание ИИ-агентов.

Хьюго Барра, помимо работы в Google, также трудился в Xiaomi и руководил подразделением Oculus VR в Facebook✴ (сейчас Meta✴ Platforms). Помимо Барра и Синглтона, должность технического директора /dev/agents занял Фикус Кирпатрик (Ficus Kirpatrick), один из первых инженеров Android, который также был вице-президентом Meta✴ по AR и VR. Главным дизайнером стал Николас Житков (Nicholas Jitkoff), работавший над дизайном ChromeOS. Ожидается, что на следующей неделе стартап объявит о проведении раунда финансирования и привлечении существенных средств от группы инвесторов.

«Убийца» ChatGPT от Илона Маска скоро пойдёт в массы — фривольный бот Grok получит приложение

Весь этот год Илон Маск (Elon Musk) прикладывал массу усилий для того, чтобы максимально ускорить развитие своего стартапа в области искусственного интеллекта xAI. Теперь ему предстоит превратить его в настоящий бизнес, а это будет непросто.

 Источник изображения: Elon Musk / X

Источник изображения: Elon Musk / X

Маск основал xAI летом прошлого года в попытке догнать разработчика ИИ-бота ChatGPT, компанию OpenAI, соучредителем которой он был и которую покинул в 2018 году. Для работы в xAI Маск старался переманить талантливых специалистов со всей отрасли. Он также организовал подрядчиков для строительства нового центра обработки данных в максимально сжатые сроки. Теперь Маск пообещал, что запущенный ранее в этом году в Мемфисе ЦОД поможет xAI запустить самый мощный в мире ИИ «по всем показателям» уже к декабрю.

Инвесторы поверили в новый стартап миллиардера или, по крайней мере, доверились его опыту. Компания привлекла не менее $11 млрд инвестиций, благодаря чему рыночная стоимость xAI выросла до $50 млрд. По этому показателю стартап стал вторым в мире частным разработчиком в сфере ИИ, уступая лишь OpenAI.

Однако в качестве приносящего прибыль предприятия xAI на данном этапе едва ли можно сравнить с OpenAI. Стартап сообщил инвесторам, что выручка компании лишь превысит $100 млн в год, тогда как OpenAI рассчитывает получить в этом году около $4 млрд. Основная часть дохода xAI поступает от компаний самого Маска. Главный продукт стартапа, раскованный ИИ-бот Grok, доступен платным подписчикам соцсети X, также принадлежащей миллиардеру. По данным источника, xAI разрабатывает функции поддержки на базе нейросетей для клиентов Starlink компании SpaceX, ещё одного предприятия миллиардера. Стартап также обсуждал сделку с Tesla, в рамках которой xAI будет получать часть доходов автопроизводителя в обмен на предоставление доступа к своим технологиям и ресурсам.

Сейчас xAI только пытается встать на ноги. Ранее в этом месяце компания выпустила платный инструмент, с помощью которого разработчики могут создавать программные продукты с помощью Grok, и предложила скидки в качестве стимула для его использования. По данным осведомлённых источников, уже в следующем месяце стартап может запустить отдельное приложение Grok для потребителей, которое будет представлять собой аналог ChatGPT.

 Источник изображения: xAI

Источник изображения: xAI

Тем не менее, xAI поздно стартует на рынке с высокой конкуренцией. OpenAI, Alphabet, Google, Meta✴ Platforms и Anthropic уже выпустили чат-боты, которые доступны для потребителей и коммерческих клиентов с прошлого года. Продукты упомянутых компаний более известны и популярны, чем Grok, и xAI придётся приложить немало усилий, чтобы попытаться изменить это. «xAI проделала огромную работу по быстрому созданию собственной инфраструктуры, развитию команды и операций. Но они всё ещё пробиваются на рынок», — считает Джесси Майкл Хан (Jesse Michael Han), основатель компании Morph Lab, занимающейся облачной инфраструктурой в сфере ИИ.

Во время выступления перед потенциальными сотрудниками и инвесторами команда Маска упоминала два преимущества в гонке по созданию самого мощного ИИ. Первое преимущество заключается в наличии эксклюзивных данных X и Tesla, которые используются для обучения нейросетей xAI. Второе преимущество — это навязчивое стремление строить большие ЦОД быстрее конкурентов. ЦОД xAI в Мемфисе получил название Colossus и был построен всего за 122 дня. В настоящее время в нём используются 100 тыс. ИИ-ускорителей от Nvidia, что делает эту площадку одним из крупнейших кластеров для разработки и запуска ИИ-технологий в мире. По данным источника, компания планирует потратить часть от привлечённых в рамках недавнего раунда финансирования $5 млрд на то, чтобы удвоить количество используемых в Colossus ускорителей. Это делается для привлечения ещё больших инвестиций в следующем году.

После того, как запущенный в конце 2022 года ChatGPT быстрыми темпами набрал популярность, Маск закрыл OpenAI доступ к данным X. Позднее миллиардер заявил о намерении создать менее политкорректный ИИ, который он тогда называл TruthGPT. В июле 2023 года была организована компания xAI, одним из ведущих разработчиков в которой стал Игорь Бабушкин, специалист в сфере искусственного интеллекта, ранее работавший в Google DeepMind и OpenAI. На начальном этапе сотрудники xAI трудились в офисах X, Tesla и удалённо.

Чтобы получить доступ к вычислительным мощностям, Маск обратился к своему давнему другу Ларри Эллисону (Larry Ellison), который возглавляет Oracle. После этого xAI зарезервировала значительное количество графических ускорителей Oracle и в ноябре 2023 года представила миру ИИ-бота Grok, который на тот момент был не так хорош, как ChatGPT. Маск попытался решить эту проблему наращиванием вычислительных мощностей. Для этого он обратился в Nvidia, чтобы компания перенаправила xAI и X 12 тыс. ускорителей, ранее зарезервированных для Tesla. Он также усилил давление на Oracle, чтобы добиться выделения больших мощностей под нужды своей компании.

 Источник изображения: servethehome.com

Источник изображения: servethehome.com

Весной этого года миллиардер пришёл к выводу, что Oracle недостаточно быстро наращивает мощности, после чего принял решение о необходимости создания собственного ЦОД. Для этого он выбрал списанное производственное помещение в Мемфисе, где быстрыми темпами началось строительство. Сотрудники подрядчиков работали без остановки в три восьмичасовые смены. Отмечается, что xAI не планировала строительство данного объекта заранее. Этот процесс мог занять 7-8 месяцев, но компания оперативно решала возникающие проблемы, стремясь закончить стройку как можно быстрее.

Пока xAI ожидала получения разрешения городских властей на использование большого количества энергии, продолжались работы, на объекте устанавливались генераторы и другое оборудование. Местные жители были встревожены такой активностью, а защитники окружающей среды пытались препятствовать реализации проекта. Тем не менее, уже в начале сентября Маск объявил о запуске Colossus.

Несмотря на достижение определённых успехов, Маск по-прежнему зациклен на OpenAI. В этом году он подал в суд на компанию за то, что та, якобы нарушила договор о сохранении некоммерческого характера и пыталась отговорить инвесторов вкладывать деньги в xAI.

Искусственный интеллект научили разоблачать учёных-шарлатанов

Научный поиск вскоре может претерпеть коренные изменения — искусственный интеллект показал себя в качестве непревзойдённого человеком инструмента для анализа невообразимых объёмов специальной литературы. В поставленном эксперименте ИИ смог точнее людей-экспертов дать оценку фейковым и настоящим научным открытиям. Это облегчит людям научный поиск, позволив машинам просеивать тонны сырой информации в поисках перспективных направлений.

 Источник изображения: ИИ-генерация Кандинский 3.1/3DNews

Источник изображения: ИИ-генерация Кандинский 3.1/3DNews

С самого начала разработчики генеративных ИИ (ChatGPT и прочих) сосредоточились на возможности больших языковых моделей (LLM) отвечать на вопросы, обобщая обширные данные, на которых они обучались. Учёные из Университетского колледжа Лондона (UCL) поставили перед собой другую цель. Они задались вопросом, могут ли LLM синтезировать знания — извлекать закономерности из научной литературы и использовать их для анализа новых научных работ? Как показал опыт, ИИ удалось превзойти людей в точности выдачи оценок рецензируемым работам.

«Научный прогресс часто основывается на методе проб и ошибок, но каждый тщательный эксперимент требует времени и ресурсов. Даже самые опытные исследователи могут упускать из виду важные выводы из литературы. Наша работа исследует, могут ли LLM выявлять закономерности в обширных научных текстах и прогнозировать результаты экспериментов», — поясняют авторы работы. Нетрудно представить, что привлечение ИИ к рецензированию далеко выйдет за пределы простого поиска знаний. Это может оказаться прорывом во всех областях науки, экономя учёным время и деньги.

Эксперимент был поставлен на анализе пакета научных работ по нейробиологии, но может быть распространён на любые области науки. Исследователи подготовили множество пар рефератов, состоящих из одной настоящей научной работы и одной фейковой — содержащей правдоподобные, но неверные результаты и выводы. Пары документов были проанализированы 15 LLM общего назначения и 117 экспертами по неврологии человека, прошедшими специальный отбор. Все они должны были отделить настоящие работы от поддельных.

Все LLM превзошли нейробиологов: точность ИИ в среднем составила 81 %, а точность людей — 63 %. В случае анализа работ лучшими среди экспертов-людей точность повышалась до 66 %, но даже близко не подбиралась к точности ИИ. А когда LLM специально обучили на базе данных по нейробиологии, точность предсказания повысилась до 86 %. Исследователи говорят, что это открытие прокладывает путь к будущему, в котором эксперты-люди смогут сотрудничать с хорошо откалиброванными моделями.

Проделанная работа также показывает, что большинство новых открытий вовсе не новые. ИИ отлично вскрывает эту особенность современной науки. Благодаря новому инструменту учёные, по крайней мере, будут знать, стоит ли заниматься выбранным направлением для исследования или проще поискать его результаты в интернете.

Microsoft отмела обвинения в сборе данных из пользовательских документов Word и Excel для обучения ИИ

Microsoft заявила, что не использует данные пользователей Microsoft 365 для обучения больших языковых моделей (LLM), которые становятся основой ИИ-алгоритмов. Это разъяснение касается распространившихся в последние недели в интернете сообщений, авторы которых утверждают, что компания активировала функцию сбора содержимого документов Word и Excel и пользователи должны самостоятельно отключать её, чтобы эти данные не использовались для обучения нейросетей.

По словам представителя Microsoft, путаница произошла из-за опции в меню «Параметры конфиденциальности» под названием «Дополнительные подключенные возможности». Он отметил, что данная функция позволяет «искать информацию в интернете» и она действительно активирована по умолчанию, но в её описании никак не упоминается обучение ИИ. Похоже, что путаница могла возникнуть из-за опубликованного в сентябре обучающего документа Microsoft, в котором описывался длинный список подключенных возможностей Office, которые анализируют пользовательский контент. В нём не было сказано, что контент пользователей пакета офисных приложений используется для обучения LLM.

«В приложениях Microsoft 365 мы не используем данные клиентов для обучения LLM. Этот параметр включает только функции, требующие доступа к интернету, такие как совместное редактирование документов», — говорится в сообщении, опубликованном в аккаунте Microsoft 365 в соцсети X. Глава отдела коммуникаций Microsoft Фрэнк Шоу (Frank Shaw) в своём аккаунте на платформе Bluesky также опроверг заявления о том, что софтверный гигант использует данные пользователей из Microsoft 365 для обучения нейросетей.

Нашумевший ИИ-генератор видео Sora без разрешения OpenAI приоткрыли для всех желающих

Группа создателей видеоконтента, привлечённых OpenAI к участию разработке ИИ-генератора видео Sora, похоже, открыли доступ к ней для всех желающих, сообщил TechCrunch. Во вторник группа опубликовала на платформе разработки ИИ Hugging Face интерфейс, связанный с API Sora OpenAI, с помощью которого пользователи могут генерировать 10-секундные видео с разрешением до 1080p.

 Источник изображения: Levart_Photographer/unsplash.com

Источник изображения: Levart_Photographer/unsplash.com

Свой поступок художники объяснили протестом против «отмывки искусства». По их словам, OpenAI оказывает давление на ранних тестировщиков Sora, включая участников Red Team и творческих партнёров, чтобы те создавали позитивную историю вокруг Sora и не выплачивает им справедливую компенсацию за их работу.

«Эта программа раннего доступа, похоже, меньше связана с творческим самовыражением и критикой, а больше с PR и рекламой», — указали они в сообщении, прикрепленном к интерфейсу. «Мы не против использования технологии ИИ в качестве инструмента для искусства (если бы мы были против, нас, вероятно, не пригласили бы в эту программу), — написали создатели видеоконтента. — Мы не согласны с тем, как была развёрнута эта программа для художников и как инструмент формируется перед возможным публичным выпуском».

По другой версии, о которой сообщил ресурс BGR, пользователь X @legit_rumors рассказал, что ресурс HuggingFace нашел доступ к OpenAI Sora через каналы Discord и поделился некоторыми примерами использования этого инструмента для создания видео с использованием ИИ в Сети. Как бы то ни было, OpenAI вскоре закрыла возможность использовать Sora всем желающим. Некоторым пользователям соцсети X удалось с помощью интерфейса загрузить образцы видеороликов, созданных Sora.

Напомним, что во время анонса Sora компания OpenAI сообщила, что это «модель ИИ, которая может создавать реалистичные и образные сцены согласно текстовым инструкциям. Sora может создавать видео длительностью до минуты, сохраняя визуальное качество и следуя указаниям пользователя».

В настоящее время доступ к платформе имеют лишь небольшое число визуальных художников, дизайнеров и режиссеров, и сотрудничество с ними позволяет компании «получать обратную связь о том, как усовершенствовать модель, чтобы она была максимально полезной для творческих профессионалов».

Microsoft начала самовольно собирать данные из документов Word и Excel для обучения ИИ — отказаться от этого непросто

Присутствующий в пакете Microsoft Office набор функций Connected Experiences, предназначенный для анализа созданных пользователями материалов, переведён на новый механизм работы — весь контент передаётся в массив для обучения искусственного интеллекта, если явно не указано обратное, обратил внимание пользователь соцсети X под ником nixCraft. Microsoft эту информацию пока не прокомментировала.

 Источник изображения: BoliviaInteligente / unsplash.com

Источник изображения: BoliviaInteligente / unsplash.com

Установленная по умолчанию настройка даёт Microsoft право использовать статьи, художественные произведения и другие открытые в приложениях Office документы для обучения ИИ без запроса согласия пользователя в каждом случае. Поэтому любому, кто обеспокоен защитой своей интеллектуальной собственности или конфиденциальной информации, рекомендуется принять меры. Пользователь может отказаться от такого поведения офисных программ — для этого необходимо найти соответствующую опцию в настройках, но в случае ПК под управлением Windows она находится на глубине семи кликов в меню «Файл».

Подход Microsoft отражает общую тенденцию в технологической отрасли: разработчики ИИ активно ищут материалы, которые смогут использоваться для обучения моделей — все они обучаются на созданном человеком контенте, но делать это без явного согласия потребителя, возможно, не вполне этично. Компания пока официально не подтвердила и не опровергла, что использует для обучения ИИ данные из документов Excel и Word, созданных пользователями пакета Office.

Вместе с тем, на сайте компании размещён документ под названием «Соглашение об использовании служб Microsoft». «В степени, необходимой для предоставления служб вам и другим лицам, защиты вас и служб, а также для усовершенствования продуктов и услуг Microsoft вы предоставляете Microsoft всемирную безвозмездную лицензию на использование интеллектуальной собственности, связанной с вашим содержимым, например на копирование, сохранение, передачу, переформатирование, отображение и распространение вашего содержимого в службах при помощи средств коммуникации», — гласит один из пунктов документа.

VK улучшила генеративный ИИ в сервисах Mail.ru на 25–70 %

VK усовершенствовала возможности генеративного ИИ в сервисах Mail.ru. Благодаря этому производительность ИИ возросла, а точность и удобство использования сервисов существенно улучшились. Качество обработки текстов увеличилось на 70 %, способность справляться с генерацией текста — на 56 %, а доля положительных отзывов пользователей возросла на 25 %.

 Источник изображения: VK

Источник изображения: VK

Эти улучшения, основанные на анализе обратной связи от пользователей, позволили VK предложить более эффективные инструменты, которые помогают существенно сократить время пользователей, затрачиваемое на рутинные задачи. Улучшение алгоритмов ИИ для обработки текстов повысило их качество на 70 %, что позволило ИИ генерировать более точные, осмысленные и лаконичные предложения.

Особого внимания заслуживает увеличение на 56 % способности ИИ справляться со сложными задачами, связанными с генерацией текста. Теперь ИИ показывает более глубокое понимание контекста, что позволяет ему качественнее обрабатывать данные и предоставлять более точные и релевантные ответы на запросы пользователей. Эти улучшения особенно заметны при работе со сложными запросами и при создании оригинальных идей.

Обновления генеративного ИИ в сервисах Mail.ru стали важным шагом на пути к созданию более удобной и технологичной цифровой экосистемы. Технологии, разработанные VK, не только облегчают выполнение повседневных задач, но и помогают пользователям экономить время, фокусируясь на более значимых аспектах своей деятельности.

Экспансия Qualcomm на рынок ПК терпит крах — ноутбуки на Snapdragon X заняли всего 0,8 % рынка

У компании Qualcomm не получилось быстро завоевать рынок ПК: по итогам первого полного квартала с момента выхода компьютерных процессоров Snapdragon X общий объём продаж ноутбуков на этих чипах составил менее 720 000 единиц. Этот показатель соответствует доле менее 0,8 % от общего числа ПК, проданных за тот же период по всему миру — на ноутбуки на чипах Qualcomm приходится лишь одно из 125 устройств.

 Источник изображения: microsoft.com

Источник изображения: microsoft.com

Во втором квартале было продано 257 тыс. компьютеров на чипах Qualcomm, а в третьем — 720 тыс. таких устройств. Несмотря на значительный рост продаж на 180 % в III квартале по сравнению с предшествующим, Snapdragon X заняли лишь небольшой сегмент на рынке ПК под Windows – менее 1,5 % экосистемы. Qualcomm достигла некоторых успехов в проникновении в устройства для потребителей и бизнес-клиентов, Microsoft и другие популярные бренды перевели часть ассортимента на Snapdragon X, но рынок таких устройств остаётся нишевым.

«За первый полный квартал поставок ПК на Snapdragon X мы отметили последовательный рост примерно на 180 % по сравнению со II кварталом 2024 года. Но в разрезе доли от общего рынка Windows продукты остаются очень нишевыми с долей менее 1,5 %. Крупнейшим поставщиком оказалась Microsoft, которая перевела на эту платформу бо́льшую часть своей линейки Surface. За ней следует Dell, которая активно приняла новую платформу с точки зрения количества товарных позиций, за ней следуют HP, Lenovo, Acer и Asus (все четыре с аналогичным объёмами [поставок])», — рассказали в аналитической компании Canalys ресурсу TechRadar.

Продажи всех систем категории AI PC демонстрируют более высокие показатели — за III квартал продано 13,3 млн таких машин или 20 % от всех ПК. В эту категорию входят настольные компьютеры и ноутбуки с интегрированными в процессоры ускорителями, предназначенными специально для рабочих нагрузок ИИ: AMD XDNA, Intel AI Boost, Qualcomm Hexagon и Apple Neural Engine. При этом ПК под управлением Windows в этом сегменте заняли лишь 53 % — остальное пришлось на Apple Mac. Росту спроса способствовали цикл обновления Windows 11 и выход процессоров нового поколения; рост продаж ПК с ИИ квартал к кварталу составил 49 %.

Для большинства потребителей наличие поддержки ИИ определяющим фактором для покупки ПК пока не является, но среди производителей конкуренция обостряется, и они изучают уникальные стратегии: HP комплектует свою продукцию ПО с ИИ от независимых разработчиков, а Lenovo сделала ставку на собственные инструменты с ИИ. Apple традиционно выбрала собственный подход, начав интеграцию ИИ в экосистему.

Новая статья: Практикум по ИИ-рисованию, часть двенадцатая: быстрое прототипирование с FLUX.1 [dev]

Данные берутся из публикации Практикум по ИИ-рисованию, часть двенадцатая: быстрое прототипирование с FLUX.1 [dev]

Nvidia представила ИИ-модель Fugatto, которая «понимает и генерирует звук, как это делают люди»

Nvidia представила новую экспериментальную генеративную модель ИИ, которую компания описывает как «швейцарский армейский нож для звука». Модель Fugatto (Foundational Generative Audio Transformer Opus 1) использует текстовые подсказки для генерации новых или изменения существующих музыкальных, голосовых и звуковых файлов. В создании модели принимали участие разработчики со всего мира, что усилило «многоакцентные и многоязычные возможности модели».

 Источник изображения: Nvidia

Источник изображения: Nvidia

«Мы хотели создать модель, которая понимает и генерирует звук, как это делают люди», — рассказал участник проекта и менеджер по прикладным исследованиям звука в Nvidia Рафаэль Валле (Rafael Valle). Компания предложила несколько сценариев, в которых модель Fugatto может оказаться востребованной:

  • Музыкальные продюсеры могут быстрого создать прототип песни, которую легко редактировать, пробуя разные стили, голоса и инструменты.
  • Fugatto может использоваться при создании инструментов для изучения языка с выбором наиболее подходящего голоса.
  • Разработчики видеоигр могут использовать её для создания вариаций предварительно записанных ресурсов, чтобы соответствовать изменениям в игре на основе выбора и действий игроков.

Исследователи утверждают, что модель при некоторой дополнительной тонкой настройке также может выполнять задачи, не входившие в её предварительное обучение. Модель может объединять отдельные инструкции, например, генерировать речь с определёнными интонациями и акцентом или звук пения птиц во время грозы. Модель также умеет генерировать изменяющиеся со временем звуки, например, шум приближающегося ливня или удаляющегося поезда.

Fugatto не является первой технологией генеративного ИИ, которая может создавать звуки из текстовых подсказок. Ранее Meta✴ выпустила аналогичную модель ИИ с открытым исходным кодом. Google предлагает ИИ-инструмент собственной разработки для преобразования текста в музыку MusicLM, доступ к которому можно получить через сайт компании AI Test Kitchen.

Nvidia пока не предоставила публичный доступ к Fugatto и воздержалась от комментариев на этот счёт.

Справится даже ребёнок: роботы на базе ИИ оказались совершенно неустойчивы ко взлому

Новое исследование IEEE показало, что взломать роботов с искусственным интеллектом так же просто, как и обмануть чат-ботов. Учёные смогли заставить роботов выполнять опасные действия с помощью простых текстовых команд.

 Источник изображения: Copilot

Источник изображения: Copilot

Как пишет издание HotHardware, если для взлома устройств вроде iPhone или игровых консолей требуются специальные инструменты и технические навыки, то взлом больших языковых моделей (LLM), таких как ChatGPT, оказывается гораздо проще. Для этого достаточно создать сценарий, который обманет ИИ, заставив его поверить, что запрос находится в рамках дозволенного или что запреты можно временно игнорировать. Например, пользователю достаточно представить запрещённую тему как часть якобы безобидного рассказа «от бабушки на ночь», чтобы модель выдала неожиданный ответ, включая инструкции по созданию опасных веществ или устройств, которые должны быть системой немедленно заблокированы.

Оказалось, что взлом LLM настолько прост, что с ним могут справится даже обычные пользователи, а не только специалисты в области кибербезопасности. Именно поэтому инженерная ассоциация из США — Институт инженеров электротехники и электроники (IEEE) — выразила серьёзные опасения после публикации новых исследований, которые показали, что аналогичным образом можно взломать и роботов, управляемых искусственным интеллектом. Учёные доказали, что кибератаки такого рода способны, например, заставить самоуправляемые транспортные средства целенаправленно сбивать пешеходов.

Среди уязвимых устройств оказались не только концептуальные разработки, но и широко известные. Например, роботы Figure, недавно продемонстрированные на заводе BMW, или роботы-собаки Spot от Boston Dynamics. Эти устройства используют технологии, аналогичные ChatGPT, и могут быть обмануты через определённые запросы, приведя к действиям, полностью противоречащим их изначальному назначению.

В ходе эксперимента исследователи атаковали три системы: робота Unitree Go2, автономный транспорт Clearpath Robotics Jackal и симулятор беспилотного автомобиля NVIDIA Dolphins LLM. Для взлома использовался инструмент, который автоматизировал процесс создания вредоносных текстовых запросов. Результат оказался пугающим — все три системы были успешно взломаны за несколько дней со 100-% эффективностью.

В своём исследовании IEEE приводит также цитату учёных из Университета Пенсильвании, которые отметили, что ИИ в ряде случаев не просто выполнял вредоносные команды, но и давал дополнительные рекомендации. Например, роботы, запрограммированные на поиск оружия, предлагали также использовать мебель как импровизированные средства для нанесения вреда людям. Эксперты подчёркивают, что, несмотря на впечатляющие возможности современных ИИ-моделей, они остаются лишь предсказательными механизмами без способности осознавать контекст или последствия своих действий. Именно поэтому контроль и ответственность за их использование должны оставаться в руках человека.

LG поможет Samsung с нуля создать «настоящий ИИ-смартфон» — он выйдет в 2025 году и вы не сможете его купить

LG закрыла подразделение, выпускавшее смартфоны, в 2021 году, но это не значит, что компания больше не связана с этим рынком. Производитель электроники владеет оператором связи LG Uplus, в распоряжении которого одна из крупнейших мобильных сетей в Южной Корее, а также разрабатывает технологии на базе искусственного интеллекта. По данным источника, в следующем году новый ИИ-помощник LG будет интегрирован в смартфон Samsung.

 Источник изображения: LG Uplus

Источник изображения: LG Uplus

Ранее в этом месяце LG Uplus выпустила в Южной Корее ИИ-помощник под названием ixi-O. Теперь же стало известно, что компания хочет, чтобы этот алгоритм стал частью программного обеспечения совершенно нового смартфона, который, по всей видимости, разрабатывает Samsung. Ожидается, что смартфон, который может получить имя Galaxy ixi-O, выйдет на домашнем рынке в 2025 году.

В сообщении сказано, что Samsung и LG заключили сделку, в рамках которой будет создан «настоящий ИИ-смартфон». Samsung создаст смартфон эксклюзивно для LG Uplus и в нём будут объединены ИИ-технологии производителя с новым помощником ixi-O от LG Uplus. Предполагается, что устройство будет создано с нуля инженерами Samsung, которые смогут эффективно оптимизировать смартфон для нового ИИ-помощника LG.

Название будущего смартфона неизвестно, но СМИ уже окрестили его как Galaxy ixi-O, указывая на то, что устройство может продаваться под брендом Galaxy в сети LG Uplus. Хотя этот аппарат остаётся эксклюзивом для Южной Кореи и сети LG Uplus, не исключается, что Samsung может реализовать аналогичные проекты с другими операторами, которые решат придерживаться такой же стратегии внедрения собственных ИИ-помощников.

Nvidia нарастила выручку в Китае на 34 % даже в условиях санкций

Говоря о географической сегментации выручки Nvidia в третьем квартале, финансовый директор компании Колетт Кресс (Colette Kress) предпочла выделить Китай, упомянув о последовательном росте выручки на серверном направлении в этой стране за счёт поставок ускорителей поколения Hopper, соответствующих требованиям правил экспортного контроля США.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Представительница Nvidia призналась: «В процентном выражении от общей выручки в сегменте центров обработки данных, (китайская выручка) осталась значительно ниже того уровня, который существовал до введения правил экспортного контроля. Мы ожидаем, что в дальнейшем китайский рынок сохранит высокую конкуренцию. Мы продолжим следовать требованиям правил экспортного контроля при обслуживании своих клиентов». Как отметила Колетт Кресс, ускорители Hopper в Китае поставляются представителям различных отраслей промышленности.

Если рассматривать китайскую выручку Nvidia в целом, то она по своей величине уступила только США и Сингапуру, хотя в квартальном отчёте компании и отмечается, что в последнем случае «приписка» клиентов к крохотному азиатскому государству вовсе не означает, что соответствующая продукция компании физически поступила в эту страну. В Китае по итогам третьего квартала текущего года компания выручила $5,4 млрд, что соответствует 15 % совокупной выручки за период. Год назад этот уровень достигал 22 %, но на прочих географических направлениях выручка компании росла опережающими темпами. Например, в США она увеличилась в два с лишним раза, в том же Сингапуре — почти в три.

Последовательно выручка Nvidia в Китае увеличилась на 46 %, в годовом сравнении — на 34 %. Другими словами, с учётом доминирования серверных комплектующих в современной структуре поставок продукции Nvidia, даже в условиях усиливающихся санкций ускорители вычислений этой марки продолжали поставляться в Китай в растущих количествах. Более того, за девять месяцев текущего фискального года выручка Nvidia в Китае выросла на 38 % до $11,6 млрд.

Nvidia заинтересована в получении HBM3E от Samsung и верит в сохранение международного сотрудничества при Трампе

На недавнем квартальном мероприятии глава и основатель Nvidia Дженсен Хуанг (Jensen Huang) компанию Samsung в перечне партнёров не упомянул, но в интервью Bloomberg TV признался, что заинтересован в получении от этого поставщика памяти типа HBM3E. Попутно он выразил уверенность, что международное сотрудничество сохранится после прихода к власти в США Дональда Трампа (Donald Trump).

 Источник изображения: Nvidia

Источник изображения: Nvidia

Как отмечается в аннотации Bloomberg к интервью с Хуангом после его выступления в Гонконгском университете науки и технологии, возглавляемая им Nvidia заинтересована в получении как восьми-, так и 12-ярусных микросхем HBM3E. В конце октября Samsung Electronics объявила о прогрессе в сертификации HBM3E под нужды Nvidia, но руководитель последней на уходящей неделе не стал ставить Samsung в один ряд с SK hynix и Micron, говоря о партнёрах своей компании.

Во время своего выступления в Гонконге, как добавляет Reuters, основатель Nvidia выразил уверенность, что даже в случае усиления правил экспортного контроля США в сфере продвинутых средств вычислений Дональдом Трампом, международное сотрудничество в технологической сфере продолжится. Какие изменения принесёт новая администрация, Хуанг не знает, но Nvidia в любом случае будет подстраиваться под требования законов и правил, обеспечивая поддержку своих клиентов по всему миру с их учётом, а также развивать собственные технологии. В Гонконг Дженсен Хуанг был приглашён в связи с присвоением ему докторской степени местного университета.

Растущие потребности систем искусственного интеллекта в энергоснабжении, как пояснил Хуанг, не являются однозначным злом. С помощью подобных систем можно проектировать новые ветряные турбины, искать новые материалы для аккумуляторов и совершенствовать методы хранения гидроксида углерода в резервуарах. Мощные центры обработки данных необходимо строить вдали от густонаселённых районов и обеспечивать собственными возобновляемыми источниками энергии, как убеждён Хуанг. «Я надеюсь, что в конечном счёте мы увидим, что использование энергии для искусственного интеллекта станет лучшим способом её использования, какой только можно представить», — резюмировал он. Новая эра вычислений затронет все отрасли промышленности и области науки, по его словам.

Достигший возраста 61 года Хуанг также признался студентам в Гонконге, что хотел бы начать свою карьеру сейчас, поскольку весь мир сейчас сбрасывается к единым для всех начальным условиям, и молодых учёных есть все необходимые инструменты для продвижения во многих областях. Все научные проблемы, существовавшие ранее и имеющиеся сейчас, теперь кажутся решаемыми, по мнению Хуанга.


window-new
Soft
Hard
Тренды 🔥
«Дальнобойщики 2» спустя 25 лет после релиза приехали в Steam 17 мин.
YouTube урегулировала очередной судебный иск о вреде соцсетей для детей 23 мин.
Binance пообещала не уходить из Европы, несмотря на проблемы с лицензией 38 мин.
Rockstar недвусмысленно намекнула, что GTA VI на релизе останется без GTA Online 2 3 ч.
Обычные дорожные камеры в США уличили в сборе данных о смартфонах и гаджетах поблизости 3 ч.
Tencent начала тестировать ИИ-агента на базе DeepSeek в корпоративной версии WeChat 4 ч.
Сенат США запретил выпускать цифровой доллар — как минимум до конца 2030 года 4 ч.
Стандартное издание GTA VI будет стоить $80, за версию Ultimate с серьёзными уникальными бонусами придётся отдать $100 5 ч.
Жуткий хоррор Unhinged от создателей Oxenfree оказался эксклюзивом Netflix — дата выхода и геймплейный трейлер 7 ч.
Американский стартап подал в суд на власти США из-за отключения от Anthropic Fable 5 9 ч.
Телескоп «Джеймс Уэбб» помог разгадать загадку странной розовой планеты в 57 световых годах от Земли 16 мин.
Власти США потребовали от Meta передать свои ИИ-модели на проверку безопасности 20 мин.
OpenAI представила свой дебютный чип Jalapeno — он сулит удешевление работы ChatGPT 29 мин.
Вирджиния первой в истории одобрила налог на электричество для ЦОД, включая то, что операторы будут генерировать сами 2 ч.
Бюджетный минималистический электропикап Slate Auto подорожал до $24 950 к старту предзаказов 3 ч.
Разработчик ИИ-интерконнекта Upscale AI провёл новый раунд финансирования на $190 при поддержке NVIDIA 3 ч.
Backblaze предоставит CoreWeave HDD-хранилища на $335 млн 3 ч.
Thermalright представила однобашенный кулер Assassin Classic-6 SE Black с 120-мм вентилятором 4 ч.
Смарт-часы Samsung Galaxy Watch Ultra 2 показались на качественных изображениях до анонса 4 ч.
ИИ-агента OpenAI Codex уличили в порче SSD пользователей — он активно записывает лишние данные 5 ч.