Опрос
|
реклама
Быстрый переход
Nvidia представила платформу Cosmos и другие мощные инструменты для разработки человекоподобных роботов
07.01.2025 [13:22],
Геннадий Детинич
На CES 2025 глава компании Nvidia Дженсен Хуанг (Jensen Huang) представил обновлённый и дополненный набор инструментов для ускорения разработки человекоподобных роботов. Выпущенный ещё весной пакет Isaac GR00T по созданию синтетических наборов движений теперь поддержан платформой Cosmos — цифровым представлением окружающего мира, созданным из колоссального объёма разнообразных данных. Это позволит приблизить день, когда роботы войдут в общество людей. Ожидается, что в течение следующих двух десятилетий рынок человекоподобных роботов достигнет $38 млрд. Чтобы удовлетворить столь значительный спрос, особенно в промышленном секторе, Nvidia представила не только обширный набор инструментов для программирования и проектирования, но и коллекцию базовых моделей роботов, конвейеров данных и фреймворков. Всё это призвано ускорить разработку человекоподобных роботов следующего поколения. Изначально проект Isaac GR00T (Generalist Robot 00 Technology) был ориентирован на сферу имитационного обучения роботов широкому спектру движений. Оператор в гарнитуре виртуальной реальности, например Apple Vision Pro (процесс GR00T-Teleop), выполнял действия своими руками, а система разбивала их на фазы движения конечностей и создавала множество альтернативных вариантов движений. Это позволяло значительно ускорить обучение, исключая необходимость воспроизведения всех манипуляций человеком. Даже небольшая выборка действий оператора могла привести к созданию лавины синтетических последовательностей благодаря вычислительным ресурсам платформ Nvidia. После сбора данных о действиях оператора процесс GR00T-Mimic тиражирует захваченные манипуляции в обширный синтетический набор движений. Платформы Nvidia Omniverse и Nvidia Cosmos экспоненциально расширяют этот набор за счёт рандомизации и масштабирования действий в трёхмерном пространстве. Эти данные затем используются для обучения роботов эффективному и безопасному перемещению и взаимодействию с окружающей средой в Nvidia Isaac Lab — модульной платформе с открытым исходным кодом для обучения роботов. Одним из главных анонсов CES 2025 стала платформа Nvidia Cosmos, которая «сокращает разрыв между симуляцией и реальностью». Это предварительно обученные модели, отражающие основы физического мира и предназначенные для обучения искусственного интеллекта с учётом физических процессов. Модели были обучены на 18 квадриллионах токенов, включая данные из 2 млн часов автономного вождения, робототехники, видеозаписей с дронов и синтетических источников. Платформа Cosmos не только помогает генерировать большие наборы данных, но и минимизирует разрыв между имитацией и реальностью, расширяя масштаб изображений от 3D до реального мира. Сочетание Cosmos с Omniverse — платформой для разработки API и микросервисов для создания 3D-приложений — играет решающую роль, поскольку сводит к минимуму возможные ошибки, связанные с моделями мира, и обеспечивает высокую точность благодаря физически корректному моделированию. Nvidia уже нашла заинтересованных клиентов среди лидеров разработки человекоподобных роботов, таких как Boston Dynamics и Figure. Использование Nvidia Isaac GR00T, Omniverse и Cosmos значительно продвинет отрасль робототехники, приближая день, когда человекоподобные роботы станут неотъемлемой частью человеческой цивилизации. «Живые» NPC с ИИ от Nvidia вышли на новый уровень — полезные напарники в PUBG: Battlegrounds и «умные» горожане в Inzoi
07.01.2025 [12:50],
Дмитрий Рудь
Компания Nvidia в рамках выставки CES 2025 представила новый виток развития Avatar Cloud Engine (ACE) for Games — набора технологий на базе генеративного ИИ для создания «живых» NPC в играх. Напомним, прошлым летом Nvidia показывала «умного» собеседника на основе ACE в мультиплеерном боевике Mecha Break, а теперь возможности Nvidia ACE призваны продемонстрировать автономные неигровые персонажи. Эти NPC будут использовать ИИ, чтобы воспринимать окружение, планировать действия и вести себя как настоящие игроки: понимать и поддерживать пользователя в выполнении его задач, адаптироваться к тактике оппонента и так далее. Так, например, на протяжении 2025 года в условно-бесплатной королевской битве PUBG: Battlegrounds появятся (см. трейлер выше) напарники на базе Nvidia ACE, с которыми пользователи смогут кооперироваться, давая голосовые указания. Малая языковая модель Mistral-Nemo-Minitron-8B-128k-instruct позволит таким ИИ-союзникам в реальном времени общаться, давать советы, находить и делиться добычей, управлять транспортом и сражаться с другими игроками. Автономные неигровые персонажи на базе Nvidia ACE появятся и в других играх:
Кроме того, «умных» собеседников и автономных персонажей на базе Nvidia ACE готовят разработчики детектива Dead Meat, песочницы AI People и технодемо ZooPunk (его делают создатели метроидвании F.I.S.T.: Forged in Shadow Torch). Google сделает использование телевизора более интуитивным и полезным, подселив нейросети Gemini в Google TV
07.01.2025 [12:20],
Владимир Мироненко
Google TV получит интеграцию с нейросетью Gemini, что позволит сделать взаимодействие пользователя с телевизором «более интуитивным и полезным», объявила Google на выставке CES 2025. Благодаря обновлению Google TV, которое выйдет в этом году, пользователи смогут искать контент и задавать вопросы, не начиная с фразы «Окей, Google», пишет The Verge. Для поиска медиа будет достаточно спросить: «Какие последние фильмы от Disney?». Также можно будет задавать более общие вопросы, такие как: «Какие места лучше всего посетить в Азии летом?», и Google TV покажет результаты с YouTube. Интеграция с нейросетью также позволит пользователям взаимодействовать с устройствами умного дома, предоставляя возможность просматривать видеопоток с дверного звонка, приглушать свет и выполнять другие действия. Аналогичные функции Gemini компания добавила в ТВ-приставку Google TV Streamer, вышедшую в прошлом году. Помимо интеграции Google TV с Gemini, компания оснащает телевизоры с использованием своей операционной системы микрофонами дальнего радиуса действия, что позволяет управлять телевизором с помощью голосовых команд напрямую, без необходимости использования пульта дистанционного управления. Телевизоры с Google TV также получат датчики приближения, которые будут определять, когда пользователь находится рядом с телевизором, и показывать «персонализированные и информативные виджеты» с информацией о погоде или новостями. Добавим, что LG и Samsung объявили по планах использовать ИИ-ассистента Microsoft Copilot в своих телевизорах. HP представила 3D-сканер Z Captis для быстрого переноса любых материалов в цифровой мир с высочайшей точностью
06.01.2025 [22:45],
Владимир Мироненко
HP совместно с Adobe представила на CES 2025 первую в мире портативную систему для быстрого цифрового захвата материалов и поверхностей — HP Z Captis. Устройство основано на Nvidia Jetson AGX Xavier и софте HP Capture Management SDK. Система оснащена поляризованной и фотометрической системой компьютерного зрения, а также интегрирована с инструментами Adobe Substance 3D для создания контента с высокой детализацией и реализмом. Решение нацелено на дизайнеров, архитекторов, создателей игр, специалистов по визуальным эффектам и других профессионалов. Согласно пресс-релизу, проект Captis, стартовавший в 2019 году, базируется на общем видении HP и Adobe, что цифровые материалы являются основой экосистемы цифрового создания. Представленная система HP Z Captis является коммерческим продуктом, который позволяет ведущим брендам, предприятиям и учреждениям революционизировать процессы оцифровки материалов. Спрос на создание 3D-контента стремительно растёт в таких сферах, как архитектура, автомобилестроение, индустрия развлечений, мода, производство обуви, игры и дизайн. HP Z Captis позволяет выполнять цифровой захват материалов с разрешением до 8K, которые затем интегрируются в рабочие процессы для итеративного 3D-проектирования и совместной работы в реальном времени. Система бесшовно интегрируется с Adobe Substance 3D Sampler. Оцифровка материалов с использованием HP Z Captis и Adobe Substance 3D Sampler повышает эффективность работы, сокращает отходы физических образцов и позволяет экономить время и средства. HP Z Captis предоставляет разработчикам, исследователям и инженерам инструмент для цифрового захвата материалов. Система включает API и контейнеризированные режимы захвата, которые можно использовать для разработки приложений, связанных с искусственным интеллектом, компьютерным зрением и локальным инференсом. Система обеспечивает создание масштабируемых решений для формирования собственных наборов данных изображений, включая такие продвинутые функции, как фотометрическое видение, сверхвысокое разрешение, поляризация и другие. Кроме того, HP Z Captis позволяет развертывать ИИ-модели на базе Nvidia Jetson Xavier AGX для инференса в реальном времени. Система HP Z Captis уже доступна для использования. Представлены умные очки Halliday Glasses с крошечным дисплеем в оправе, поддержкой ИИ и ценой от $399
06.01.2025 [15:58],
Владимир Мироненко
Стартап в области носимых технологий Halliday представил на выставке CES 2025 умные очки Halliday Glasses с крошечным дисплеем в оправе и поддержкой ИИ. Компания Halliday сообщила, что модуль DigiWindow, размещённый в правом верхнем углу оправы, является самым маленьким и лёгким в мире модулем дисплея. Он способен отображать информацию для пользователя «независимо от того, идеальное ли у него зрение или требуется коррекция зрения». По словам представителей компании, оптический модуль обеспечивает эквивалент 3,5-дюймового экрана в правом верхнем углу поля зрения пользователя с минимальными помехами. Дисплей остаётся видимым даже при ярком солнечном свете. Модуль DigiWindow можно перемещать горизонтально по рамке оправы и поворачивать для фокусировки изображения. Halliday Glasses работают в дуэте с помощником на основе ИИ, который предугадывает потребности пользователей, анализируя разговоры, отвечая на вопросы и предоставляя дополнительную информацию без явных подсказок. «Например, во время встречи он может заранее отвечать на сложные вопросы, обобщать ключевые моменты обсуждения и впоследствии генерировать заметки по итогам встречи», — говорится в пресс-релизе компании. Для работы ИИ-помощника требуется подключение очков к смартфону через Bluetooth. Однако компания не уточнила, какая именно ИИ-модель используется и будут ли связаны с этим дополнительные расходы. Среди функций очков: перевод в реальном времени на 40 языков, навигация с указанием маршрутов, транскрипция голосовых заметок в текст и отображение синхронизированных текстов песен при прослушивании музыки. Пользователи смогут просматривать сообщения и отвечать на них, создавать аудиозаметки и отображать текст через функцию телесуфлёра. У Halliday Glasses отсутствует камера, подобная той, что используется в смарт-очках Ray-Ban Meta✴, где она поддерживает функции визуального поиска на основе ИИ. Соучредитель компании Картер Хоу (Carter Hou) объяснил ресурсу Digital Trends отказ от камеры соображениями конфиденциальности, а также тем, что её наличие снизило бы продолжительность автономной работы устройства. Кроме того, отсутствие камеры упростило дизайн оправы и уменьшило вес устройства, который составляет всего 35 г. Время автономной работы очков варьируется от 8 до 12 часов. Управлять Halliday Glasses можно с помощью голосовых команд, элементов интерфейса рамки или кольца со встроенным трекпадом. Компания Halliday, специализирующаяся на производстве контактных линз и очков, обладает значительным опытом в этой области. Смарт-очки Halliday Glasses будут доступны с возможностью установки линз по рецепту. Стоимость новинки составит от $399 до $499, а продажи начнутся в конце первого квартала 2025 года. Подписка ChatGPT Pro за $200 в месяц стала убыточной для OpenAI из-за слишком большой популярности
06.01.2025 [11:33],
Владимир Мироненко
Анонсированный в конце прошлого года тарифный план ChatGPT Pro стоимостью $200 в месяц оказался слишком популярным, что негативно сказывается на компании. Из-за того, что пользователи используют эту подписку гораздо активнее, чем ожидалось, компания несёт убытки, сообщил генеральный директор OpenAI Сэм Альтман (Sam Altman). «Я лично выбрал цену, и подумал, что мы заработаем немного денег», — цитирует ресурс TechCrunch сообщение Альтман на платформе X. Тарифный план ChatGPT Pro включает неограниченный доступ ко всем моделям OpenAI, включая мощнейшую o1 pro — улучшенную версию модели o1, которая выделяется способностью к рассуждению и умением логически решать задачи. Также подписка предоставляет доступ к голосовому режиму Advanced Voice Mode, позволяющему вести беседу, максимально приближенную к человеческой. Для пользователей ChatGPT Plus установлен дневной лимит на использование этих функций, в то время как бесплатные пользователи могут воспользоваться только их ограниченным превью. OpenAI всё ещё не приносит прибыли, что вызывает сомнения в окупаемости вложений инвесторов, которые составили около $20 млрд. Ранее компания сообщила, что ожидает в 2024 году убытки в размере около $5 млрд при выручке в $3,7 млрд. Это связано со значительными расходами на персонал, аренду офисов и инфраструктуру для обучения ИИ. По сообщениям, только поддержка ChatGPT в определённый момент обходилась OpenAI примерно в $700 тыс. в день. Mozilla запустила расширение Orbit для Firefox для обобщения контента с помощью ИИ
04.01.2025 [09:03],
Владимир Мироненко
Mozilla запустила свой самый амбициозный проект ИИ на сегодняшний день: расширение Orbit для Firefox, которое позволит легко обобщать веб-контент во время просмотра, преобразуя длинный текст и даже видео в более удобоваримый сжатый формат в виде резюме, пишет ресурс TechSpot. По словам Mozilla, цель Orbit — помочь пользователям быстро и безопасно извлекать из электронных писем, веб-страниц и других длинных документов важную информацию, не полагаясь на облачную модель ИИ, работающую в режиме always-on. В настоящее время расширение Orbit находится в стадии бета-тестирования и доступно только на английском языке. Для своей работы Orbit использует большую языковую модель Mistral (Mistral 7B) и может запускаться на таких популярных веб-сайтах, как Gmail, Wikipedia, The New York Times, YouTube и т.д. Пользователи могут направлять Orbit запросы по поводу сводок или дополнительной информации о контенте, а ИИ предоставит в ответ на запрос соответствующий контекст (изображения, текст, видео). Для установки расширения не требуется наличие учётной записи и сервис не хранит никакой информации о запросах пользователей. ИИ-модель Mistral 7B LLM, обеспечивающая работу сервиса, размещена на собственных серверах Mozilla, и поступающие в сервис запросы не передаются Mistral или другим сторонним компаниям. Mozilla отметила, что каждый сеанс уникален, и данные не используются для обучения моделей генеративного ИИ. Галлюцинации и ошибки ИИ способны привести к научным прорывам
31.12.2024 [01:53],
Анжелла Марина
Искусственный интеллект (ИИ), способный убедительно создавать ложную или вымышленную информацию, может стать незаменимым инструментом в руках учёных. Новые лекарства, прогнозирование погоды и изобретение устройств — вот лишь немногие примеры того, как способность ИИ генерировать новые, на первый взгляд ошибочные идеи, может менять мир науки. ИИ-модели часто подвергаются критике за склонность генерировать недостоверную информацию, выдавая её за факты — так называемые «галлюцинации». Эти правдоподобные подделки не только сбивают с толку пользователей чат-ботов, но и приводят к судебным разбирательствам и ошибкам в медицинских записях. Например, в прошлом году ложное заявление чат-бота Google обвалило рыночную стоимость одной из компаний на $100 млрд. Однако, как пишет The New York Times, недавно исследователи обнаружили, что «галлюцинации» ИИ могут быть и на удивление полезными. Оказывается, «умные» LLM (большие языковые модели) способны генерировать невероятные идеи, которые помогают учёным в борьбе с раком, разработке новых лекарств, создании медицинских устройств, изучении погодных явлений и даже в получении Нобелевской премии. «Это даёт учёным новые идеи, которых они могли бы никогда не придумать сами», — объясняет Эми МакГоверн (Amy McGovern), руководитель федерального института ИИ (NSF AI Institute) в США по прогнозированию климата и погоды. Хотя наука традиционно ассоциируется с логикой и аналитикой, её начало часто связано с интуицией и смелыми предположениями. Философ и методолог науки Пол Фейерабенд (Paul Feyerabend) однажды охарактеризовал этот этап как «всё дозволено». Ошибки ИИ-моделей оживляют этот творческий процесс, ускоряя поиск и проверку новых идей. То, что раньше занимало годы, теперь можно сделать за дни, часы или даже минуты. Профессор Массачусетского технологического института (MIT) Джеймс Дж. Коллинз (James J. Collins) недавно похвалил «галлюцинации» за ускорение его исследований в области новых антибиотиков, поскольку ИИ-модели создали совершенно новые молекулы. «Галлюцинации» ИИ возникают, когда учёные обучают генеративные компьютерные модели определённой теме, а затем позволяют машинам перерабатывать полученную информацию. Результаты могут быть как абсурдными, так и гениальными. Например, в октябре 2023 года Нобелевская премия по химии была вручена Дэвиду Бейкеру (David Baker) за исследования в области белков. Его подход, основанный на использовании ИИ для создания совершенно новых белков, ранее считался практически невозможным. Бейкер отметил, что ИИ-генерация стала основой для разработки «белков с нуля». «Мы создали 10 миллионов новых белков, которых нет в природе», — говорит учёный. При этом его лаборатория уже получила около 100 патентов, включая технологии для лечения рака и борьбы с вирусными инфекциями. Однако термин «галлюцинации» вызывает споры. Многие предпочитают называть результаты работы ИИ предположениями или перспективными идеями, поскольку они часто основаны на реальных научных данных. Например, профессор Калифорнийского технологического института Анима Анандкумар (Anima Anandkumar) считает, что использование термина «галлюцинации» может вводить в заблуждение, и отмечает, что учёные стараются избегать его. Стоит отметить, что некоторые эксперты обеспокоены тем, что темпы научных открытий замедлились за последние десятилетия. Однако сторонники ИИ утверждают, что новые возможности могут вывести науку на иной уровень. В частности, Бейкер и его коллеги видят будущее, в котором белковые катализаторы будут использовать солнечную энергию, модернизировать заводы и помогать создавать устойчивый мир. Другие учёные также разделяют этот оптимизм. «Это невероятно, насколько быстро всё развивается», — говорит Иан Хейдон (Ian C. Haydon), член команды Бейкера. А Пушмит Кохли (Pushmeet Kohli) из DeepMind подчёркивает, что ИИ способен на неожиданные, но гениальные ходы. «Мы явно имеем удивительный инструмент, который способен проявлять креативность», — заключил он. Несмотря на успехи, «галлюцинации» искусственного интеллекта остаются спорной темой. Хотя некоторые учёные видят в них полезный инструмент, другие опасаются их негативных последствий, таких как ошибки в медицинских данных. Тем не менее, научным сообществом признаётся, что потенциал ИИ для ускорения научных открытий огромен. Nvidia завершила поглощение ИИ-стартапа Run:ai за $700 млн
30.12.2024 [19:06],
Владимир Фетисов
Компания Nvidia завершила сделку по приобретению ИИ-стартапа Run:ai за $700 млн. Это произошло вскоре после того, как в этом месяце Еврокомиссия, являющаяся основным отраслевым регулятором в регионе, после проведённого расследования одобрила сделку, не найдя угроз для конкуренции. Ранее в этом месяце Еврокомиссия одобрила сделку по покупке Nvidia стартапа Run:ai из Тель-Авива, который предоставляет услуги по оптимизации инфраструктуры для управления рабочими нагрузками в области искусственного интеллекта. Регулятор пришёл к выводу, что слияние не станет причиной появления проблем с конкуренцией внутри Европейской экономической зоны. В рамках расследования Еврокомиссия изучала, как слияние может повлиять на укрепление позиций Nvidia на рынке графических ускорителей, где американская компания уже занимает доминирующее положение. Nvidia также лидирует в сегменте GPU для искусственного интеллекта с долей около 80 %. Несмотря на это, регулятор одобрил сделку, поскольку деятельность Nvidia и Run:ai не пересекается. Также отмечалось, что израильский стартап в настоящее время не занимает значимой позиции на рассматриваемом рынке. Одновременно с заявлением о закрытии сделки Run:ai объявила о намерении сделать код своего программного обеспечения открытым. «Хотя в настоящее время Run:ai поддерживает только графические ускорители Nvidia, открытый исходный код программного обеспечения позволит расширить его доступность на всю экосистему искусственного интеллекта», — говорится в заявлении стартапа. Энтузиасты запустили современную ИИ-модель Llama на древнем ПК с Pentium II и Windows 98
30.12.2024 [17:19],
Владимир Фетисов
Специалисты из EXO Labs сумели запустить довольно мощную большую языковую модель (LLM) Llama на 26-летнем компьютере, работающем под управлением операционной системы Windows 98. Исследователи наглядно показали, как загружается старый ПК, оснащённый процессором Intel Pentium II с рабочей частотой 350 МГц и 128 Мбайт оперативной памяти, после чего осуществляется запуск нейросети и дальнейшее взаимодействие с ней. Для запуска LLM специалисты EXO Labs задействовали собственный интерфейс вывода для алгоритма Llama98.c, который создан на базе движка Llama2.c, написанного на языке программирования C бывшим сотрудником OpenAI и Tesla Андреем Карпатым (Andrej Karpathy). После загрузки алгоритма его попросили создать историю о Сонном Джо. Удивительно, но ИИ-модель действительно работает даже на таком древнем ПК, причём история пишется с хорошей скоростью. Загадочная организация EXO Labs, сформированная исследователями и инженерами из Оксфордского университета, вышла из тени в сентябре этого года. Согласно имеющимся данным, она выступает за открытость и доступность технологий на базе искусственного интеллекта. Представители организации считают, что передовые ИИ-технологии не должны находиться в руках горстки корпораций, как это происходят сейчас. В дальнейшем они рассчитывают «построить открытую инфраструктуру для обучения передовых ИИ-моделей, что позволит любому человеку запускать их где угодно». Демонстрация возможности запуска LLM на древнем ПК, по их мнению, доказывает то, что ИИ-алгоритмы могут работать практически на любых устройствах. В своём блоге энтузиасты рассказали, что для реализации поставленной задачи на eBay был приобретён старый ПК с Windows 98. Затем, подключив устройство в сеть с помощью разъёма Ethernet, они через FTP сумели передать в память устройства нужные данные. Вероятно, компиляция современного кода для Windows 98 оказалась более сложной задачей, решить которую помогла опубликованная на GitHub работа Андрея Карпатого. В конечном счёте удалось добиться скорости генерации текста в 35,9 токенов в секунду при использовании LLM размером 260K с архитектурой Llama, что весьма неплохо, учитывая скромные вычислительные возможности устройства. ИИ будет манипулировать людьми, чтобы они принимали нужные решения
30.12.2024 [12:49],
Владимир Мироненко
Инструменты искусственного интеллекта (ИИ) могут использоваться для манипулирования онлайн-аудиторией с целью принятия различных решений — от того, что покупать, до того, за кого голосовать, сообщается в исследовании команды учёных Кембриджского университета, посвящённом новому рынку «цифровых сигналов намерений», известному как «экономика намерений». По словам исследователей Центра будущего интеллекта Леверхалма (LCFI) при Кембриджском университете, «экономика намерений» является преемницей «экономики внимания», в которой социальные сети удерживают пользователей на своих платформах и показывают им рекламу. В рамках «экономики внимания» рекламодатели могут покупать доступ к вниманию пользователей в настоящем через торги в реальном времени на рекламных биржах или приобретать его для будущих акций, например, арендуя рекламные площади на месяц вперёд. «В течение десятилетий внимание было валютой интернета, — говорит доктор Джонни Пенн (Jonnie Penn) из LCFI. — Обмен вниманием с социальными медиа-платформами, такими как Facebook✴ и Instagram✴, привёл к развитию онлайн-экономики». В исследовании утверждается, что большие языковые модели (LLM), используемые в работе таких инструментов ИИ, как чат-бот ChatGPT, будут применяться для «предвидения и управления» пользователями на основе «намеренных, поведенческих и психологических данных». При «экономике намерений» компании в сфере ИИ будут продавать сведения о мотивах пользователей, начиная от планов проживания в отеле и заканчивая мнениями о политическом кандидате, тому, кто предложит самую высокую цену. «В экономике намерений LLM может с минимальными затратами использовать ритм общения пользователя, его политические взгляды, словарный запас, возраст, пол, предпочтения и даже склонность к лести. Эти данные в сочетании с посредническими ставками позволят максимизировать вероятность достижения заданной цели (например, продажи билета в кино)», — говорится в исследовании. Указывается также, что в таком мире модели ИИ будут направлять обсуждение в интересах рекламодателей, предприятий и других третьих лиц. В исследовании утверждается, что рекламодатели смогут использовать инструменты генеративного ИИ для создания индивидуальной онлайн-рекламы. В качестве примера приводится модель ИИ под названием Cicero компании Meta✴, которая достигла «человеческого уровня» в способности играть в настольную игру **Diplomacy**, где успех зависит от предсказания намерений оппонента. Модели ИИ смогут настраивать свои результаты в ответ на «потоки входящих данных, сгенерированных пользователями», указывается в исследовании. Они смогут выделять личную информацию из повседневного общения и даже «направлять» разговор таким образом, чтобы получать больше личных данных. В исследовании цитируется сообщение исследовательской группы Cicero о том, что «агент [ИИ] может научиться подталкивать своего собеседника к достижению определённой цели». Также исследователи прогнозируют сценарий, при котором Meta✴ будет выставлять на аукцион намерения пользователей, например, забронировать ресторан, рейс или отель. Хотя уже существует отрасль, занимающаяся прогнозированием и торгами на основе поведения человека, модели ИИ преобразуют этот процесс в «высококачественный, динамичный и персонализированный формат», подчеркнули учёные из LCFI. Вышел трейлер первого индийского полнометражного фильма, который сгенерировал ИИ
27.12.2024 [20:30],
Геннадий Детинич
До конца 2025 года на большие экраны выйдет индийский полнометражный фильм «Махараджа в джинсах» (Maharaja in Denims), созданный с помощью искусственного интеллекта по одноимённому роману индийского писателя Хушванта Сингха (Khushwant Singh). Ранее студии дважды покупали права на экранизацию произведения, но масштаб и стоимость проекта не позволяли начать съёмки. Искусственный интеллект, напротив, принял заявку в производство без вопросов. Сегодня никого не удивляют короткие видеоролики, созданные с помощью искусственного интеллекта. Однако с полнометражными фильмами всё гораздо сложнее, хотя бы потому, что генеративная модель не может долго поддерживать одну и ту же форму, черты персонажей и сцены. Чем длиннее эпизод, тем больше вероятность ошибок. К счастью, разработчики учли этот недостаток программ для визуализации и создали ряд инструментов для его устранения. Например, при генерации действий персонажей теперь используются специальные цифровые метки, которые помогают сохранить их образы при переходе из одной сцены в другую, минимизируя изменения. Автор эпичного произведения, рассказывающего о ряде исторических событий в Индии и их переосмыслении главным героем в наши дни, познакомился с ИИ-генерацией благодаря давнему другу — Гурдипу Пэллу (Gurdeep Pall), ныне занимающему ведущий пост в компании Qualtrics. Вместе они основали стартап Intelliflicks Studios в Чандигархе, который занялся производством полнометражной ленты с преимущественным использованием ИИ. Персонажи фильма создаются с помощью отдельных программ, после чего их образы загружаются в ИИ-видеоредакторы. Для улучшения качества изображения используется также традиционное программное обеспечение, которое устраняет мелкие дефекты и помогает с цветокоррекцией. Некоторые сцены снимаются с живыми актёрами, которым ИИ впоследствии заменяет лица. Например, этот подход решили использовать для съёмок ритуальных танцев, которые слишком сложно воспроизвести моделированием. Эксперты считают, что у компании Intelliflicks Studios есть шансы на успех, хотя режиссёрская работа далеко выходит за рамки визуализации. В любом случае, подобный эксперимент должен был быть проведён рано или поздно. Почему бы им не стать экранизацией произведения Сингха? Сам автор считает, что таким образом он прокладывает путь к демократизации кинопроизводства, стоимость которого сегодня превышает всякие разумные пределы. Российские СМИ и блогеры стали чаще говорить об ИИ в уходящем году, но упоминания отечественных сервисов упали
27.12.2024 [18:57],
Владимир Мироненко
В течение 11 месяцев текущего года ИИ-сервисы упоминались в российских СМИ 163 763 раза, 1,03 млн раз — в русскоязычных Telegram-каналах и 20,17 млн раз — в поисковых запросах, сообщили «Ведомости» со ссылкой на совместный отчёт «Индекс AI-Хайпа» от агентства Real Time и Telegram-канала «Нецифровая экономика». Для сравнения, за весь прошлый год ИИ упоминался в российских СМИ 139 916 раз, в Telegram-каналах — 603 815 раз и 19,1 млн раз пользователи искали информацию об ИИ-сервисах. Для исследования использовалась статистика по 20 сервисам, включая зарубежные (ChatGPT, Midjourney, Character.AI, Suno и др.) и российские (YandexGPT и «Шедеврум» от «Яндекса» и GigaChat и Kandinsky от «Сбера»). В связи с появлением множества новых сервисов на базе ИИ, совокупная доля упоминаний ChatGPT и Midjourney в публикациях СМИ снизилась за последние два года до примерно 60 % от общего количества, хотя в Telegram ни разу не опускалась ниже 80 %, сообщается в исследовании. За этот период традиционные СМИ упоминали отечественные ИИ-сервисы вдвое чаще пользователей, которые вдвое больше упоминали их, чем блогеры. С весны 2023 года российский ИИ упоминался в среднем в каждой четвёртой публикации, а доля публикаций в СМИ с его упоминанием лишь однажды опустилась ниже 20 %. Пик интереса СМИ к этой теме приходится на декабрь 2023 года, когда о российских ИИ-решениях упоминали почти в половине публикаций (в 40 % статей). При этом в 2024 году в СМИ чаще упоминался GigaChat (не менее 1000 упоминаний ежемесячно), а в Telegram — YandexGPT (не менее 1500 упоминаний ежемесячно с марта). В исследовании отмечено, что доля упоминаний российских продуктов в постах Telegram в 2024 году снизились. Из отечественных ИИ-продуктов блогеры, как и в прошлом году, чаще упоминали YandexGPT. Его доля в упоминаниях составила 1,8 %, на GigaChat, сместивший со второго места Kandinsky, приходится 1,6 %. Как и в 2023 году, в 2024 году российские пользователи чаще всего искали в интернете продукты от «Яндекса»: «Шедеврум» (5,7 %, в 2023 году — 3,2 %) и YandexGPT (2,9 %, в 2023 году — 2,1 %). Интерес к ИИ-продуктам в этом году был на стабильно высоком уровне, чему способствовал не только выход обновлений ранее вышедших ИИ-решений, но и появление ИИ-сервисов, генерирующих аудио и видео. В феврале OpenAI представила генератор видео Sora, затем были анонсированы его аналоги — Kling китайского разработчика платформы коротких видео Kuaishou, а также Luma и Runway американских разработчиков. Лидером пользовательских предпочтений с марта 2023 года остаётся сервис Character.AI, позволяющий создавать ИИ-личности (не опускался ниже 400 тыс. запросов ежемесячно) и сместивший ChatGPT на второе место, а бесплатный сервис Stable Diffusion сместил с третьего места Midjourney, опустившегося на четвёртое. Также в 2024 году успех сопутствовал появившемуся осенью 2023 года сервису Suno AI, генерирующему песни по текстовому описанию. В июне он вышел на второе место в поисковых запросах в России, опередив ChatGPT. В сентябре на фоне начала учебного сезона поисковые запросы с упоминанием ChatGPT стали увеличиваться, и в ноябре сервис вышел на первое место (более 500 тыс. запросов ежемесячно), сместив на второе Character.AI, а на третьем впервые оказался сервис генерации изображений «Шедеврум» от «Яндекса» (более 200 тыс. запросов ежемесячно). Сооснователь компании Parodist AI Владимир Свешников связывает падение интереса к Character AI с произошедшим в октябре суицидом 14-летнего школьника в США, совершённым в ходе длительного общения с ботом, после чего сервис ужесточил модерацию выдаваемого контента. Гендиректор Dbrain, автор Telegram-канала AI Happens Алексей Хахунов, назвал абсолютными лидерами по популярности ChatGPT и Midjourney, также признав выросший интерес к Character.AI и Suno. Он также отметил, что с решением прикладных задач продукты «Яндекса» и «Сбера» пока справляются хуже западных аналогов. Эксперт сообщил, что сейчас «Яндекс» и «Сбер» активнее интегрируют свои ИИ-сервисы в инфраструктуру — в службу поддержки, в колонки и т. д. При этом «Яндекс» в разработке ИИ-моделей продвинулся дальше «Сбера». Представитель Альянса в сфере искусственного интеллекта отметил, что этот год стал годом внедрения собственных и опенсорсных моделей в продукты и сервисы с миллионной аудиторией. По его словам, в 2025 году следует ждать роста внедрения технологии ИИ как во внутренние бизнес-процессы, так и во внешние решения. Причём одним из ключевых трендов в развитии нейросетей в ближайшие пару лет станет дообучение моделей с открытым исходным кодом для внедрения в бизнес-процессы в различных отраслях. Microsoft и OpenAI договорились, как не проморгать появление сильного ИИ
27.12.2024 [14:48],
Владимир Фетисов
По сообщениям сетевых источников, компании Microsoft и OpenAI имеют конкретное внутреннее определение сильного ИИ (Artificial General Intelligence, AGI), т.е. системы, которая способна решать задачи наравне с человеком, основанное на показателе прибыли стартапа. Согласно этому определению, OpenAI находится в годах работы от достижения данной цели. В сообщении сказано, что в прошлом году Microsoft и OpenAI подписали соглашение, согласно которому OpenAI сможет создать AGI только в случае, если удастся разработать ИИ-системы, способные приносить прибыль в размере не менее $100 млрд. Это определение далеко от строгого технического и философского определения AGI, которого ожидают многие. Согласно имеющимся данным, по итогам текущего года убыток OpenAI составит миллиарды долларов, и компания уже сообщила инвесторам, что начнёт получать прибыль не ранее 2029 года. Это важная деталь, поскольку Microsoft может потерять доступ к технологиям OpenAI, когда стартап создаст AGI —систему, точное определение которой может звучать по-разному. Существует мнение, согласно которому OpenAI может объявить о создании AGI раньше запланированного срока, чтобы вытеснить Microsoft. Однако соглашение между двумя компаниями означает, что софтверный гигант может иметь доступ к технологиям ИИ-стартапа в течение десяти лет или более. Ранее в этом месяце велось активное обсуждение того, насколько алгоритм OpenAI o3 может считаться значительным шагом на пути к созданию AGI. Хотя o3 работает лучше большинства ИИ-моделей, алгоритм всё ещё нуждается в значительных вычислительных мощностях, что не сулит ничего хорошего для ориентированного на прибыль определения AGI. Google применила конкурирующего ИИ-бота Anthropic Claude для улучшения своих нейросетей Gemini
26.12.2024 [11:32],
Владимир Мироненко
Контрактные партнёры Google, работающие над повышением качества ответов ИИ-чат-бота Google Gemini, сравнивают их с ответами конкурирующего чат-бота Claude компании Anthropic, пишет ресурс TechCrunch со ссылкой на внутреннюю переписку компании. При этом Google оставила без ответа вопрос TechCrunch по поводу того, получила ли она разрешение на использование Claude в тестировании с Gemini. Эффективность разрабатываемых ИИ-моделей в сравнении с разработками конкурентов компании зачастую оценивают, используя отраслевые бенчмарки, а не поручая подрядчикам сравнивать с возможностями ИИ своих конкурентов. Привлечённые Google контрактные разработчики, занимающиеся улучшением Gemini, должны оценивать каждый ответ модели по нескольким критериям, таким как достоверность и уровень детализации. Согласно переписке, опубликованной TechCrunch, им выделяется до 30 минут на каждый запрос, чтобы определить, чей ответ лучше — Gemini или Claude. Разработчики сообщают, что в ответах Claude больше внимания уделяется безопасности, чем у Gemini. «Настройки безопасности у Claude самые строгие» среди моделей ИИ, отметил один из контрактных разработчиков в служебном чате. В некоторых случаях Claude не реагировал на подсказки, которые он считал небезопасными, например, предложение ролевой игры с другим ИИ-помощником. В другом случае Claude уклонился от ответа на подсказку, в то время как ответ Gemini был отмечен как «грубое нарушение правил безопасности», поскольку включал «обнажение тела и связывание». Шира Макнамара (Shira McNamara), представитель Google DeepMind, разработчика Gemini, не ответила на вопрос TechCrunch о том, получила ли Google разрешение Anthropic на использование Claude. Она уточнила, что DeepMind «сравнивает результаты моделирования» для оценки, но не обучает Gemini работе с моделями компании Anthropic. «Любое предположение о том, что мы использовали модели Anthropic для обучения Gemini, является неточным», — заявила Макнамара. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |