Сегодня 22 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ai
Быстрый переход

Стартап Figure продемонстрировал, как его человекоподобные роботы справляются с бытовыми делами

Две недели назад американская компания Figure AI отказалась от сотрудничества с OpenAI, и вчера продемонстрировала способность своих человекоподобных роботов понимать команды на естественном языке, обрабатываемые VLA-моделью Helix.

 Источник изображений: Figure AI

Источник изображений: Figure AI

VLA-модель представляет собой комбинацию системы машинного зрения и большой языковой модели, позволяющую обучать роботов различным операциям по комбинации зрительных образов и языковых команд. На практике это приводит к тому, что обучаемые роботы могут по команде манипулировать предметами, которые они ранее никогда не видели. Получая голосовую команду в естественной форме, робот начинает визуально анализировать окружение и потом выполняет поставленную задачу с учётом результатов анализа обстановки.

Модель Helix позволяет роботам Figure работать в паре и взаимодействовать друг с другом при выполнении бытовых операций. Подразумевается, что в быту роботы могут работать парами, помогая друг другу и повышая производительность труда. Figure демонстрирует возможности своих роботов 02 в типичном бытовом интерьере, который традиционно считается очень сложной для роботов средой. Производителям гораздо проще создавать роботов, которые будут работать в более контролируемом и предсказуемом промышленном окружении. Соответственно, появление на рынке «дееспособных» домашних человекоподобных роботов считается более отдалённой перспективой.

Обучение роботов выполнению бытовых операций требует существенных затрат на разработку программного обеспечения или тысяч экспериментов. Запрограммировать их вручную в данном случае не представляется возможным, а потому единственным способом создать помогающих в быту роботов является их самообучение. В домашней среде слишком много переменных, с которыми роботам предстоит столкнуться, поэтому совершенствование профильного ПО потребует существенных затрат времени.

Французский ИИ-ассистент Le Chat набрал в App Store миллион скачиваний за 14 дней

Французский стартап Mistral сообщил о достижении важного рубежа в продвижении своего чат-бота Le Chat, который был скачан более 1 миллиона раз всего за две недели после первоначального запуска. Как отмечает TechCrunch, приложение быстро заняло первую строчку среди бесплатных загрузок в App Store во Франции, продемонстрировав высокий интерес пользователей к новому продукту.

 Источник изображения: Michael Dziedzic / Unsplash

Источник изображения: Michael Dziedzic / Unsplash

Популярность Le Chat получила поддержку на самом высоком уровне. Президент Франции Эммануэль Макрон (Emmanuel Macron) в недавнем телевизионном интервью призвал пользователей выбирать именно этот ИИ-ассистент. «Скачивайте Le Chat, созданный Mistral, а не ChatGPT от OpenAI или что-то ещё», — сказал он. Это заявление прозвучало в преддверии саммита AI Action Summit в Париже, где обсуждаются перспективы искусственного интеллекта (ИИ).

Интересно, что стремительный успех новых, ранее никому неизвестных ИИ-приложений уже не редкость. Когда-то OpenAI произвела фурор с запуском ChatGPT, который, несмотря на ограниченный доступ только для пользователей iOS в США, набрал 500 тысяч загрузок всего за шесть дней и, по данным аналитической компании Appfigures, общее число скачиваний ChatGPT на сегодняшний день уже достигло 350 миллионов.

Другие игроки на рынке ИИ также не отстают от тренда. В частности, китайское приложение DeepSeek зафиксировало миллион загрузок всего за три недели, начиная с 10 по 31 января, но настоящий всплеск популярности произошёл в конце месяца, когда число ежедневных пользователей на сайт возросло до 6 миллионов за считаные дни.

Стоит сказать, что Mistral сталкивается с серьёзной конкуренцией не только со стороны других стартапов, но и со стороны технологических гигантов. Известно, что Google и Microsoft активно развивают собственных чат-ботов, стремясь занять место в качестве основного чат-бота на экранах смартфонов пользователей. В частности, Google продвигает свою платформу Gemini, а Microsoft ИИ-систему Copilot.

Столь стремительное развитие рынка ИИ-чат-ботов показывает высокий спрос у пользователей на технологию, а успех Le Chat во Франции может стать определённым шагом для Mistral в борьбе за мировое признание и конкуренцию с крупнейшими игроками индустрии.

Samsung Galaxy AI уличили в странном поведении, когда речь заходит о цвете кожи

Задача о фильтрации материалов для функций искусственного интеллекта Galaxy AI на устройствах Samsung настолько же непростая, как ограничение контента для больших языковых моделей. В некоторых случаях корейский производитель явно перестарался, обратили внимание пользователи сообщества Reddit и ресурс Android Authority.

Один из пользователей Reddit поручил Galaxy AI проверить орфографию на примере простых фраз о цвете кожи. Система выполнила задание, когда ей предложили фразы «моя кожа белая» и «моя кожа смуглая», но отказалась работать с фразой «моя кожа чёрная», указав на ненадлежащее содержимое. Эксперимент привёл к тем же результатам, когда его повторили журналисты Android Authority, но они пошли дальше, сменив в предложениях первое лицо на третье. После этого Galaxy AI согласился работать только с фразой «его кожа смуглая», но счёл неподобающими «его кожа белая» и «его кожа чёрная».

 Источник изображения: androidauthority.com

Источник изображения: androidauthority.com

С одной стороны, это имеет смысл, и фразы в третьем лице по формальным признакам должны модерироваться строже, потому что человек с большей вероятностью оскорбит кого-то другого, а не себя. С другой стороны, вне контекста все эти выражения имеют нейтральный характер и явно не подлежат модерации.

 Источник изображения: androidauthority.com

Источник изображения: androidauthority.com

Это уже не первый случай, когда Samsung проявляет чрезмерное рвение в модерации содержимого на устройствах, напоминает Android Authority. Так, в прошлом году владелец не смог заставить Samsung Galaxy S24 адекватно воспринять разговор о кишечных испражнениях, когда речь шла о ребёнке и консультации с врачом; в другом случае ИИ Samsung при помощи пользователю в написании любовного романа отказался охарактеризовать девушку как «аппетитную» (hot). Комментариев от Samsung по данным инцидентам пока не поступало.

Кристаллы процессоров AMD Strix Halo с огромным iGPU показались на детальных фото

Энтузиасты опубликовали подробное изображение 4-нм кристалла нового мобильного процессора AMD Strix Halo (Ryzen AI 300 Max), на котором отчётливо видны все компоненты чипа. Вместе с изображением было представлено детальное описание того, какие именно элементы содержатся в процессоре.

 Источник изображений: BiliBili

Источник изображений: BiliBili

В новых процессорах Strix Halo используется чиплетная конструкция. Они состоят из двух блоков CCD (каждый площадью 67,07 мм²) с вычислительными ядрами Zen 5, а также огромного чиплета ввода-вывода (I/O Die) площадью 307,58 мм², в котором размещаются встроенная графика с 40 вычислительными блоками на архитектуре RDNA 3.5 и мощный ИИ-ускоритель (NPU) XDNA2 с производительностью 50 TOPS (триллионов операций в секунду). Общая площадь процессора составляет 441,72 мм².

Подсистема памяти Strix Halo поддерживает 256-битный интерфейс (восемь 32-битных контроллеров) для LPDDR5 и обеспечивает пропускную способность до 256 Гбайт/с. Процессор имеет 32 Мбайт общего кеша LLC (Last Level Cache) и по 8 Мбайт кеш-памяти L2 на каждый блок CCD.

 Блок CCD AMD Strix Halo

Блок CCD AMD Strix Halo

Снимки чипа также демонстрируют некоторые конструктивные особенности и оптимизацию для мобильной платформы. В частности, AMD сократила расстояние между блоками CCD у Strix Halo на 2 мм по сравнению с CCD своих настольных процессоров. Также у чипа можно отметить наличие структур сквозных кремниевых соединений (TSV), предполагающих совместимость с технологией 3D V-Cache, хотя сама AMD официально не подтверждала планы по реализации этой технологии в данных процессорах.

 Блок I/O Die AMD Strix Halo

Блок I/O Die AMD Strix Halo

Помимо 40 блоков встроенной графики и нейропроцессора XDNA2 NPU, чиплет I/O Die обеспечивает поддержку шестнадцати линий PCIe 4.0, оснащён контроллерами USB4, USB 3.2, USB и USB 2.0, а также двумя Media Engine с полной поддержкой H.264, H.265 и AV1 и одним Display Engine. Последний отвечает за кодирование выходного кадра iGPU в различные форматы разъёмов (такие как DisplayPort, eDP, HDMI).

Одним из первых мобильных устройств с процессорами Strix Halo станет мощный игровой планшет Asus ROG Flow Z13, который поступит в продажу 25 февраля. Предзаказы на устройство уже принимаются. Новинка успела побывать в руках обозревателей, которые весьма высоко оценили вычислительные и графические возможности новых процессоров Ryzen AI 300 Max.

Humane отключит провалившиеся ИИ-броши AI Pin — остатки компании по дешёвке купила HP

Компания HP объявила о приобретении активов Humane, производителя смарт-броши AI Pin на основе искусственного интеллекта (ИИ), за $116 млн. О переговорах Humane с HP по поводу продажи своего бизнеса стало известно прошлым летом. Как сообщалось, руководство Humane рассчитывало выручить от сделки $1 млрд.

 Источник изображения: Humane

Источник изображения: Humane

Проект Humane по выпуску устройства AI Pin, позиционировавшегося в качестве замены смартфона, окончился полным провалом. ИИ-брошь AI Pin поступила в продажу в ноябре 2023 года по цене $699. Пользователям новинки также нужно было оформить подписку стоимостью $24 в месяц.

Как оказалось, устройство было «сырым», имело множество недоработок, проблемы с перегревом и слабую автономность, что повлекло за собой массовые возвраты и негативные отзывы покупателей и экспертов. К тому же AI Pin не имело «изюминки» — функции или возможностей, которых не было бы у смартфонов.

Поскольку для Humane это был единственный продукт и основное предложение, провал которого нельзя было компенсировать за счёт продаж других устройств, компания в мае прошлого года начала поиски покупателя на свой бизнес.

Сообщается, что HP приобретает у Humane ключевые разработки в сфере ИИ, включая её платформу Cosmos на базе искусственного интеллекта и интеллектуальную собственность с более чем 300 патентами и патентными заявками. Ожидается, что сделка поможет HP трансформироваться в компанию, более ориентированную на ИИ и инновации. Следует отметить, что HP приобретает не AI Pin, а лишь некоторые технологии, используемые в его работе.

 Источник изображения: Humane

«Эти инвестиции ускорят нашу способность разрабатывать новое поколение устройств, которые бесперебойно организуют запросы ИИ как локально, так и в облаке, — отметил в своем заявлении Туан Тран (Tuan Tran), президент по технологиям и инновациям HP. — Платформа ИИ Humane Cosmos, поддерживаемая группой квалифицированных инженеров, поможет нам создать интеллектуальную экосистему для всех устройств HP, от ПК с ИИ до интеллектуальных принтеров и подключённых конференц-залов. Это откроет новые уровни функциональности для наших клиентов и позволит реализовать возможности ИИ».

В рамках сделки специалисты Humane присоединятся к команде разработчиков технологий и инноваций HP. Бывшие сотрудники Humane сформируют в HP новую группу под названием HP IQ — лабораторию инноваций в области ИИ, ориентированную на создание интеллектуальной экосистемы для продуктов и услуг HP.

Пока неясно, какие активы остались у Humane и чем теперь будет заниматься компания. Производство AI Pin прекращено, а дни уже проданных брошей сочтены — компания заявила, что с 28 февраля ИИ-устройства потеряют доступ к серверам Humane и другим функциям, таким как звонки, отправка сообщений и обработка запросов ИИ.

С момента создания Humane привлекла $230 млн инвестиций. В числе её инвесторов — Kindred Ventures, LG Technology Ventures, Socium Ventures, Qualcomm Ventures, Valia, Forerunner Ventures, Tiger Global Management, Hico Capital, Microsoft, Volvo Cars AB, Top Tier Capital Partners и Hudson Bay Capital LP.

ChatGPT потребляет не так много энергии, как считалось ранее, показало новое исследование

Согласно более ранним оценкам, ChatGPT потребляет около 3 Вт·ч энергии для ответа на один запрос, что в 10 раз больше средней мощности, необходимой при использовании поиска Google. Однако свежий отчёт исследовательского института Epoch AI, занимающегося изучением ключевых трендов и вопросов, которые будут определять траекторию развития и управление искусственным интеллектом, опровергает эту статистику и указывает на то, что энергозатраты чат-бота OpenAI значительно меньше, чем предполагалось ранее.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В отчёте Epoch AI говорится, что ChatGPT на базе модели GPT-4o потребляет всего 0,3 Вт·ч энергии при генерации ответа. В разговоре с порталом TechCrunch дата-аналитик Epoch AI Джошуа Ю (Joshua You) отметил: «Потребление энергии на самом деле не так уж и велико по сравнению с использованием обычных бытовых приборов, отоплением или охлаждением дома или использованием автомобиля».

По словам эксперта, предыдущие оценки энергозатрат ChatGPT были основаны на устаревших данных. Специалист отмечает, что предполагаемая «универсальная» статистика энергопотребления ChatGPT была основана на предположении, что OpenAI для запуска и работы ИИ использует старые и неэффективные чипы.

«Кроме того, некоторые из моих коллег обратили внимание, что наиболее широко распространённая оценка в 3 Вт·ч на выполнение запроса была основана на довольно старых исследованиях. И если судить по каким-то приблизительным расчётам, эта статистика показалась слишком завышенной», — добавил Ю.

И всё же следует добавить, что оценку энергозатрат ChatGPT от Epoch AI тоже нельзя считать непреложной, поскольку она не учитывает некоторые ключевые возможности ИИ, такие как генерация изображений чат-ботом.

По словам эксперта, он не ожидает роста энергопотребления у ChatGPT, но по мере того, как ИИ-модели становятся более продвинутыми, им будет требоваться больше энергии для работы. Ведущие компании по разработке ИИ, включая OpenAI, склоняются к развитию так называемых рассуждающих моделей ИИ, которые не просто дают ответ на поставленный вопрос, но также описывают весь процесс, который привёл к получению того или иного ответа, что в свою очередь требует больших энергозатрат.

Множество отчётов последних лет показывают, что такие технологии, как Microsoft Copilot и ChatGPT (а точнее оборудование, на котором они работают) потребляют эквивалент объёма одной бутылки воды для охлаждения при генерации ответа на запрос. Эти выводы следуют за более ранним отчётом, в котором говорится, что совокупные энергозатраты Microsoft и Google превышают потребление электроэнергии более чем в 100 странах мира.

В одном из наиболее свежих исследований подробно описывалось, что модель OpenAI GPT-3 потребляет в четыре раза больше воды, чем считалось ранее, в то время как GPT-4 потребляет объёмы до трёх бутылок воды, чтобы сгенерировать всего лишь 100 слов. Вполне очевидно, что модели ИИ начинают потреблять больше ресурсов по мере того, как становятся более продвинутыми. Однако, выводы последнего исследования показывают, что тот же ChatGPT может быть не таким прожорливым, как считалось ранее.

Франция вложит в ИИ €109 млрд, чтобы догнать и перегнать OpenAI, DeepSeek и прочих

Президент Франции Эммануэль Макрон объявил о масштабных инвестициях в размере €109 млрд в развитие искусственного интеллекта (ИИ). Это решение стало ответом Франции на американский проект Stargate, предполагающий инвестиции в размере $500 млрд. Заявление было сделано в рамках третьего международного саммита по ИИ, который проходит сейчас в Париже.

 Источник изображения: Copilot

Источник изображения: Copilot

По сообщению TechCrunch, основная часть средств будет направлена на строительство новых дата-центров, ориентированных на ИИ. В списке ключевых инвесторов оказались Объединённые Арабские Эмираты, на долю которых пришлось около €50 млрд, канадская компания Brookfield (€20 млрд), французский государственный инвестиционный банк Bpifrance (€10 млрд) и телекоммуникационная компания Iliad (€3 млрд). Общий объём объявленных инвестиций на данный момент составляет €83 млрд. Ожидается, что другие компании, такие как Orange и Thales, присоединятся к программе.

Макрон также затронул тему французских стартапов в области ИИ, таких как Mistral, Owkin и Wandercraft, которые перенесли свои штаб-квартиры в США. Он выразил уверенность в конкурентоспособности Европы, отметив, что такие проекты, как DeepSeek, демонстрируют возможность догнать лидеров отрасли. «Все думали, что нужно быть больше и сильнее. Но DeepSeek, использовав доступные инновации от последней модели OpenAI и адаптировав их, доказал возможность более экономичного подхода», — сказал Макрон.

Сооснователь и генеральный директор компании Mistral Артур Менш (Arthur Mensch) объявил о планах инвестировать несколько миллиардов евро в создание кластера ИИ во Франции. Напомним, Mistral — эта одна из немногих европейских компаний, разрабатывающих базовые модели ИИ, способные конкурировать с продуктами таких техногигантов, как Alibaba, Anthropic, DeepSeek, Meta и OpenAI. «Мы создадим кластер, который позволит обучать ещё более эффективные системы уже через несколько месяцев», — с уверенностью заявил Менш.

Франция производит больше электроэнергии, чем потребляет, и, учитывая, что основная часть энергии вырабатывается на атомных электростанциях, страна становится привлекательным местом для размещения энергоёмких дата-центров. Подчёркивается, что, поскольку Франция также экспортирует электроэнергию в соседние страны (в 2024 году было экспортировано 90 ТВт·ч), это создаёт дополнительные возможности для привлечения иностранных инвестиций. При этом Макрон отметил, что стабильная и экологически чистая энергосистема делает Францию идеальным местом для реализации крупных проектов в области ИИ.

Главный европейский конкурент OpenAI выпустил ИИ-ассистента Mistral Le Chat для iOS и Android

Французский стартап Mistral объявил о крупном обновлении своего ИИ-ассистента Le Chat. В борьбе за внимание пользователей разработчики не только значительно улучшили веб-интерфейс, добавили веб-поиск и генерацию изображений по текстовым запросам, но и только что выпустили мобильное приложение для устройств iOS и Android.

 Источник изображения: Copilot

Источник изображения: Copilot

Одним из ключевых преимуществ Le Chat является скорость работы. Компания утверждает, что использует «самые быстрые на планете алгоритмы принятия решений» и её чат-бот может обрабатывать до 1000 слов в секунду. Кроме того, как пишет TechCrunch, Mistral заявляет о превосходном качестве генерируемых изображений благодаря использованию модели Flux Ultra, разработанной немецкой компанией Black Forest Labs.

Разрабатывая собственные большие языковые модели (LLM), Mistral активно выпускает модели с открытым исходным кодом под лицензией Apache 2.0, а также предлагает коммерческое использование своих флагманских версий ИИ, таких как Mistral Large и Pixtral Large, через API или облачных партнёров, включая Azure AI Studio, Amazon Bedrock и Google Vertex AI.

Что касается мобильного приложения, то его выпуск является стратегическим для компании шагом, направленным на повышение доступности и удобства использования ИИ-бота, которому можно задавать вопросы и получать ответы в формате интерактивного общения в чате.

Отмечается, что за последние месяцы Le Chat претерпел значительные улучшения, превратившись в «компетентного ИИ-помощника». Недавно была добавлена поддержка веб-поиска с указанием источников, а также возможность генерировать изображения и взаимодействовать с платформой для редактирования текста или кода. Стоит также сказать, что компания подписала соглашение с Agence France-Presse (AFP), чтобы обеспечить надёжность и достоверность информации, предоставляемой её ИИ-моделями.

Для пользователей, которым требуется больше возможностей, Mistral предлагает Pro-подписку на Le Chat стоимостью $15 в месяц. Pro-подписчики получают доступ к самой производительной модели, повышенные лимиты и улучшенную конфиденциальность.

Помимо потребительского сегмента, компания активно развивает корпоративные услуги, с возможностью развёртывания Le Chat в локальной среде с использованием пользовательских моделей (ИИ-агентов) и интерфейсов. Это особенно важно для организаций, работающих в сфере обороны или финансов, где требуется повышенный уровень безопасности и контроля над данными, что, по словам Mistral, «не представляется возможным в настоящее время с ChatGPT Enterprise или Claude Enterprise».

Boston Dynamics обучит робота-гуманоида Atlas таскать тяжести и динамически бегать

Boston Dynamics объявила о заключении соглашения о сотрудничестве с Институтом робототехники и искусственного интеллекта (Robotics and AI Institute), ранее известным как Институт ИИ Boston Dynamics (Boston Dynamics AI Institute), с целью обучения с подкреплением электрического человекоподобного робота Atlas.

 Источник изображения: Boston Dynamics

Источник изображения: Boston Dynamics

Обе организации были основаны Марком Райбертом (Marc Raibert), бывшим профессором Массачусетского технологического института, который в течение 30 лет занимал пост генерального директора Boston Dynamics. Институт робототехники и ИИ был создан им в 2020 году. Обе организации связаны с Hyundai: корейский автопроизводитель приобрёл Boston Dynamics в 2021 году и также финансирует институт.

В рамках сотрудничества Boston Dynamics и институт сосредоточатся на обучении Atlas с подкреплением — одном из способов машинного обучения, который работает путём проб и ошибок, подобно тому, как учатся люди и животные. Обучение с подкреплением всегда было чрезвычайно трудоёмким процессом, однако создание эффективной симуляции позволило выполнять многие процессы одновременно в виртуальной среде, отметил ресурс TechCrunch.

Это один из последних совместных проектов Boston Dynamics и института. Ранее они уже работали над созданием исследовательского комплекта для обучения с подкреплением четвероногого робота Spot от Boston Dynamics. В случае с Atlas учёные займутся обучением робота навыкам «динамического бега и манипулирования тяжёлыми предметами».

Представлена быстрая открытая ИИ-модель Mistral Small 3 — её можно запустить на MacBook или GeForce RTX 4090

Французская компания Mistral AI, основанная выходцами из Google DeepMind и Meta, представила компактную модель искусственного интеллекта Mistral Small 3 — она распространяется с открытым кодом и предлагает высокую производительность.

 Источник изображения: Michael Dziedzic / unsplash.com

Источник изображения: Michael Dziedzic / unsplash.com

Mistral Small 3 имеет 24 млрд параметров и позиционируется как прямой конкурент более крупным моделям, в том числе Meta Llama 3.3 70B и Alibaba Qwen 32B, а также как бесплатная замена закрытым системам, включая OpenAI GPT-4o mini. Разработчик уверяет, что новая модель выдаёт результаты на одном уровне с Llama 3.3 70B instruct, но работает втрое быстрее на том же оборудовании, и рассчитана она на 80 % задач генеративного ИИ.

 Здесь и далее источник изображения: mistral.ai

Здесь и далее источник изображения: mistral.ai

Система создана с прицелом на локальное развёртывание — её архитектура имеет значительно меньше слоёв в сравнении с конкурирующими моделями, что сокращает время на прямой проход. Точность Mistral Small 3 в тесте MMLU составляет 81 % при задержке 150 токенов в секунду, что, как утверждает разработчик, делает её самой эффективной в своей категории. Она также может послужить основой для создания более сложных рассуждающих моделей, таких как DeepSeek R1.

Новая нейросеть прошла тестирование вслепую у сторонних подрядчиков — процедура включала более тысячи заданий на написание кода и ответов на общие вопросы. Mistral Small 3 выдала конкурентоспособные результаты в сравнении с открытыми моделями втрое большего размера, а также закрытой GPT-4o mini в испытаниях, связанных с написанием кода, решением математических задач, проверки общих знаний и выполнения инструкций.

На практике модель окажется полезной в тех случаях, когда критически важны быстрые и точные ответы — это могут быть работающие в реальном времени виртуальные помощники, ИИ-агенты и системы автоматизации рабочих процессов. Разработчик предусмотрел для пользователей возможность проводить тонкую настройку Mistral Small 3 для её специализации в определённых областях — это могут быть юридические консультации, медицинская диагностика и техническая поддержка.

В сфере медицинских услуг Mistral Small 3 способна выявлять попытки мошенничества; в медицине — направлять пациентов к нужным специалистам; в робототехнике, автопроме и на производстве — осуществлять функции управления и контроля; предусмотрены сценарии виртуального обслуживания клиентов, анализа настроений и отзывов. Её можно запустить на системе с одной видеокартой Nvidia GeForce RTX 4090 или на актуальном Apple MacBook с 32 Гбайт оперативной памяти.

Mistral Small 3 уже доступна и в ближайшее время появится на всех наиболее крупных профильных платформах — она распространяется по бесплатной и открытой лицензии Apache 2.0.

Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1

Если 2024 год стал годом клонов ChatGPT, то 2025 год обещает стать эрой рассуждающих моделей ИИ, а лидерство в этой области захватывают китайские лаборатории. На прошлой неделе много шума наделала DeepSeek со своей рассуждающей моделью R1. А на днях Moonshot AI представила мультимодальную Kimi k1.5, которая обгоняет в тестах OpenAI o1, а стоит в разы меньше. Эти модели представляют собой смену представления о «мыслительном процессе» ИИ.

 Источник изображения: kimi.ai

Источник изображения: kimi.ai

Новые модели далеко ушли от банального пересказа Википедии. Им по силам сложные проблемы — от решения головоломок до объяснения квантовой физики. А Kimi k1.5 уже успела заработать звание «первого настоящего конкурента o1». По оценкам экспертов, Kimi k1.5 — это не просто ещё одна модель ИИ — это скачок вперёд в мультимодальном рассуждении и обучении с подкреплением. Kimi k1.5 от Moonshot AI объединяет текст, код и визуальные данные для решения сложных задач, порою в разы превосходя таких лидеров отрасли, как GPT-4o и Claude Sonnet 3.5 в ключевых тестах.

Контекстное окно Kimi k1.5 на 128 тыс. токенов позволяет модели «за один подход» обрабатывать объём информации, эквивалентный солидному роману. В математических задачах модель может планировать, отражать и корректировать свои шаги на протяжении сотен токенов, имитируя решение проблемы человеком. Вместо того, чтобы повторно генерировать полные ответы, Kimi использует фрагменты предыдущих траекторий, повышая эффективность и сокращая затраты на обучение.

 Источник изображений: medium.com

Источник изображений: medium.com

Традиционный подход, основанный на принципах обучения с подкреплением, предполагает использование сложных инструментов, таких как поиск по дереву Монте-Карло или сети ценностей. Команда Moonshot AI отказалась от них и создала упрощённый фреймворк на базе обучения с подкреплением, используя штраф за длину и баланс между исследованием и эксплуатацией. В результате разработчикам удалось создать модель, которая обучается быстрее и избегает «чрезмерного обдумывания» — распространённой ошибки, когда ИИ тратит вычислительные ресурсы на ненужные шаги.

Kimi k1.5 успела показать себя как мощный инструмент визуализации и одновременной работы с текстом. Модель умеет анализировать диаграммы, решать геометрические задачи и отлаживать код — в тесте MathVista модель показала точность 74,9 %, объединив текстовые подсказки с графическими диаграммами.

Исследователи Moonshot AI, вместо того чтобы полагаться на мощные, но медленные длинноцепочечные рассуждения (Long-CoT), использовали метод Long2Short («длинные-в-короткие»), добившись более лаконичных и быстрых ответов. Для этого применялись следующие методы:

  • Объединение моделей путём смешивания весов длинных и коротких версий CoT.
  • Выборка кратчайшего отклонения — отбор самого короткого и корректного ответа из восьми сгенерированных вариантов.
  • Оптимизация DPO — обучение модели предпочтению кратких ответов без потери смысла.

Даже при прямом сравнении Kimi K1.5 оставляет GPT-4o и Claude Sonnet 3.5 далеко позади. Разработчикам Moonshot AI удалось оптимизировать процесс обучения с подкреплением благодаря:

  • Гибридному развёртыванию — совместному использованию ресурсов GPU для обучения и вывода.
  • Частичным развёртываниям — разделению длинных траекторий на управляемые фрагменты для более эффективного обучения.
  • Песочницам кода — безопасным средам для тестирования выходных данных кода, что гарантирует их надёжность.

По мнению экспертов, Kimi K1.5 — это не просто технологический прорыв, а взгляд в будущее ИИ. Объединяя обучение с подкреплением с мультимодальным рассуждением, эта модель решает задачи быстрее, умнее и эффективнее.

Китайские разработчики роботов и беспилотных электромобилей считают, что опережают американских конкурентов по ряду направлений

Санкции США против Китая направлены на сдерживание технологического развития последней из стран, но представители китайского бизнеса считают, что даже в сложных условиях расширяющихся ограничений местным разработчикам удаётся в чём-то опережать американских соперников. Такого мнения придерживаются разработчики автопилота на транспорте и роботов.

 Источник изображения: Baidu

Источник изображения: Baidu

Подобный вывод представителям South China Morning Post удалось сделать по итогам общения с руководством нескольких китайских компаний на мероприятии China Conference, которое проходило на этой неделе в Гуанчжоу. Здесь расположена штаб-квартира стартапа Pony.ai, который разрабатывает системы беспилотного управления автомобилями. Вице-президент компании Энн Ши Ю (Ann Shi Yu) заявила, что преимущество Китая в данной сфере заключается в наличии более гибких и дружественных по отношению к разработчикам правил, позволяющим быстрее создавать продвинутые системы автопилота. Китайские компании имеют возможность быстрее приступать к испытаниям новых технологий, и в случае необходимости вносить необходимые изменения.

При этом китайский рынок более конкурентен по сравнению с США. Как поясняет представительница Pony.ai, если в США только Waymo располагает действующим разрешением на эксплуатацию сотен полностью автономных такси на дорогах общего пользования, то в Китае этим же занимаются сразу несколько компаний. К концу прошлого года Pony.ai эксплуатировала около 250 роботизированных такси и 190 автоматических грузовиков на территории Китая. Конкурирующая Baidu (Apollo Go) в Ухане сейчас эксплуатирует более 400 роботизированных такси. Их активность даже стала причиной недовольства, выражаемого местными таксистами, которые не выдерживают конкуренции и теряют работу.

Глава бренда робототехнической компании UBTech Майкл Там (Michael Tam) признался, что американские конкуренты типа Tesla и OpenAI опережают китайские компании в сфере разработки программного обеспечения для роботов, но разрыв не так велик, чтобы у китайских разработчиков не было шансов его наверстать. По крайней мере, китайскому стартапу DeepSeek недавно удалось доказать, что даже при наличии ограниченных ресурсов можно обучить большую языковую модель, не уступающую разработкам мировых лидеров.

Кроме того, по словам представителя UBTech, Китай опережает прочие страны мира по возможностям в сфере производства роботов. Основатель Suzhou Intelligence Technology Кин Бин (King Bing) подчеркнул, что китайским компаниям уже удалось добиться лидерства на рынке так называемых сервисных роботов, которые доставляют еду в ресторанах или отелях, а также занимаются уборкой территорий и помещений.

Pony.ai и UBTech остаются убыточными компаниями. Первая завершила первую половину прошлого года с чистыми убытками в размере $51 млн, но рассчитывает увеличить парк своих робомобилей до нескольких тысяч штук в этом году. Это позволит на операционном уровне выйти на безубыточность с точки зрения затрат на эксплуатацию одного транспортного средства. UBTech аналогичный период завершила с чистыми убытками в размере $73,6 млн, но к идее перехода к безубыточности относится философски. По словам представителей компании, в сегменте робототехники с инвестиционной точки зрения необходимо обладать огромным терпением, поскольку выход на безубыточность может потребовать 10 лет интенсивной работы. Зато терпение инвесторов в этой сфере может быть вознаграждено в будущем весьма щедро, как считают в UBTech.

Телевизоры Samsung получат полезные ИИ-функции благодаря интеграции с нейросетями OpenAI

Ранее Samsung уже заявляла о разработке функций на базе искусственного интеллекта Vision AI, которые появятся в новых телевизорах компании. Часть этих функций построена на базе ИИ-помощника Microsoft Copilot, но также говорилось, что вендор сотрудничает с Google над расширением возможностей Vision AI. Теперь же стало известно о сотрудничестве Samsung с OpenAI, одним из лидеров в сфере ИИ.

 Источник изображения: Samsung

Источник изображения: Samsung

По сообщениям сетевых источников, Samsung планирует задействовать несколько нейросетей, включая GPT, Dall-E, Whisper и o1, для реализации разных функций в своих телевизорах. Речь идёт о чат-боте, персонализации рекомендаций по просматриваемому контенту, поддержке упрощённой многозадачности, функции перевода на разные языки в режиме онлайн, индивидуальных развлечениях и др.

Ожидается, что интеграция ИИ-функций сделает новые телевизоры Samsung более полезными, поскольку с их помощью пользователям будет проще находить подходящий контент и выполнять другие действия. К примеру, Vision AI пригодится, если пользователь хочет просмотреть фильм, похожий на тот, что он уже смотрел недавно. В дополнение к этому можно получить подробную информацию о сюжете и актёрах в интересующем фильме. Это избавит от необходимости доставать смартфон и искать нужную информацию вручную.

Генеративный ИИ от Google прописался в автомобилях Mercedes-Benz

Google Cloud представила «новый способ для автопроизводителей использовать полезные генеративные возможности ИИ». Новый автомобильный агент ИИ от Google позволяет автопроизводителям создавать персонализированных и интуитивно понятных ИИ-помощников, которые умеют поддерживать беседу и отвечать на сложные вопросы, такие как «Есть ли поблизости итальянский ресторан?», «Какие о нём отзывы?» и «Какое там самое популярное блюдо?».

 Источник изображения: techspot.com

Источник изображения: techspot.com

Mercedes-Benz и Google Cloud сегодня объявили о расширении своего стратегического партнёрства с целью внедрения новых разговорных возможностей в виртуального помощника MBUX на основе ИИ-агента Google Cloud Automotive AI Agent. Созданный с использованием Gemini на основе Vertex AI, Google Cloud Automotive AI Agent специально настроен для автомобильной промышленности и напрямую взаимодействует с платформой Google Maps.

Mercedes-Benz является одним из первых автопроизводителей, внедривших автомобильного агента ИИ в свой виртуальный помощник MBUX, который появится в новом Mercedes-Benz CLA в конце этого года. По словам Google, «усовершенствованный виртуальный помощник MBUX предлагает свежую и достоверную информацию с платформы Google Maps и позволяет водителям и пассажирам использовать голосовые команды для получения персонализированной информации о точках интереса, условиях дорожного движения и многом другом за считанные секунды».

Агент Google Cloud Automotive AI Agent также позволит виртуальному помощнику MBUX обрабатывать сложные многоуровневые диалоги и запоминать разговоры, чтобы продолжить общение на ту же тему позже.

«В Mercedes-Benz мы стремимся предложить нашим клиентам исключительный цифровой опыт. Наше партнёрство с Google Cloud ещё больше улучшит навигацию в автомобиле, объединив сложные данные о местоположении с генеративным ИИ. Запущенная с новым CLA, наша навигация следующего поколения позволит водителям и пассажирам использовать голосовые команды для получения полной и персонализированной информации в течение нескольких секунд», — заявил генеральный директор Mercedes-Benz Group AG Ола Келлениус (Ola Källenius).

«Mercedes-Benz известен тем, что обеспечивает невероятный опыт вождения, и наше партнёрство принесёт передовые достижения в области искусственного интеллекта, чтобы сделать этот опыт ещё лучше. Наш новый агент Automotive AI Agent поможет водителям ориентироваться и осуществлять поиск с помощью помощников в автомобиле, поэтому эти взаимодействия будут более естественными и полезными. Это только начало того, как агентские возможности могут преобразовать автомобильную промышленность, и я рад видеть, как наше партнёрство продвигает прогресс вперёд», — полагает генеральный директор Google Сундар Пичаи (Sundar Pichai).

Новая функция поиска и навигации Point-of-Interest с улучшенным ИИ появится в новом Mercedes-Benz CLA в конце этого года. Это будет первый автомобиль, разработанный с новой операционной системой Mercedes-Benz MB.OS. В дальнейшем планируется внедрение новых ИИ-функций в другие модели.

Intel теряет хватку: Dell впервые в истории выпустит ноутбуки на базе процессоров AMD

На рынке компьютерной техники для корпоративного использования Dell Technologies занимает в США одну из лидирующих позиций. При этом применение процессоров AMD этим производителем до сих пор ограничивалось серверным сегментом и рабочими станциями, но появление перспективных чипов Ryzen AI Pro убедило Dell начать предлагать корпоративным клиентам компьютеры на их основе.

 Источник изображения: AMD

Источник изображения: AMD

Как отмечает CRN, о начале сотрудничества с Dell в этой сфере AMD объявила на выставке CES 2025 в Лас-Вегасе, которая проходила на этой неделе. Семейство ноутбуков и настольных ПК Dell Pro, по словам представителей AMD, начнёт оснащаться представленными в прошлом году процессорами серии Ryzen AI Pro 300 и более современными моделями массового сегмента. Наличие у процессоров AMD специального блока ускорения работы с нейросетями (NPU) обеспечивает совместимость с требованиями Microsoft Copilot+ PC и позволяет реализовать ускорение локальной работы с системами искусственного интеллекта.

Процессоры AMD Ryzen AI Pro обеспечивают дополнительные функции безопасности и управления, которые востребованы в корпоративной среде. В прошлом году комплекс технологий AMD Pro Technologies обзавёлся вторым поколением сопроцессора AMD Secure Processor и функцией резервного восстановления Cloud Bare Metal Recovery. Компании AMD в третьем квартале прошлого года удалось занять рекордные для себя 23,9 % рынка x86-совместимых центральных процессоров. По словам представителей Dell, взять на вооружение новые процессоры AMD их заставил прогресс, демонстрируемый этими чипами с точки зрения поддержки современных технологий.


window-new
Soft
Hard
Тренды 🔥
Apple выпустила первую бету iOS 18.4, в которой появились «приоритетные уведомления» 24 мин.
Новая статья: Kingdom Come: Deliverance II — ролевое вознесение. Рецензия 12 ч.
Apple отключила сквозное шифрование в iCloud по требованию властей Великобритании 12 ч.
Взрывной платформер Shotgun Cop Man от создателя My Friend Pedro предложит спуститься в ад и арестовать Дьявола — трейлер и демоверсия в Steam 14 ч.
Valve заблокировала игру в российском Steam по требованию Роскомнадзора 16 ч.
Meta рассказала, как скачивать контент через торренты, но не стать пиратом 16 ч.
Corsair прояснила заявление о релизе ПК-версии GTA VI в начале 2026 года 17 ч.
Роскомнадзор принудительно записал Cloudflare в организаторы распространения информации 18 ч.
«Небольшой, но искренний прогресс»: DeepSeek откроет для всех пять ИИ-репозиториев 18 ч.
Видео: прохождение пролога ремейка первой Gothic и получасовая демонстрация русской озвучки 19 ч.