Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Медицинский ИИ от Google превзошёл GPT-4 и даже живых докторов

Google Research и исследовательская лаборатория Google в области искусственного интеллекта DeepMind сообщили подробности о семействе передовых больших языковых моделей Med-Gemini, разработанных для применения в сфере здравоохранения.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

ИИ-модели всё ещё находятся на стадии исследования, но авторы разработок утверждают, что Med-Gemini, основанные на модели Google Gemini, превосходят конкурирующие модели, такие как GPT-4 от OpenAI, обладают огромным потенциалом в клинической диагностике и превосходят отраслевые стандарты в 14 популярных профильных бенчмарках. В частности, в тесте MedQA (USMLE) модель Med-Gemini достигла точности 91,1 %, используя стратегию поиска, основанную на неопределённости, превзойдя медицинскую LLM Med-PaLM 2 компании Google на 4,5 %. Набор моделей также превзошёл людей в обобщении медицинских текстов и составлении рекомендаций, причём врачи в половине случаев оценивали ответы Med-Gemini-M 1.0 как хорошие или даже лучше, чем ответы экспертов.

Med-Gemini — это семейство больших мультимодальных моделей (LMM), каждая из которых имеет своё предназначение. В отличие от больших языковых моделей, которые «демонстрируют неоптимальные клинические рассуждения в условиях неопределённости», страдают галлюцинациями и предвзятостью, Med-Gemini дают «фактически более точные, надёжные и детальные результаты для сложных задач клинического обоснования», чем их конкуренты, включая GPT-4, утверждает Google.

По семи мультимодальным бенчмаркам, включая проверку по изображениям New England Journal of Medicine (NEJM), модель Med-Gemini показала гораздо лучшие результаты, чем GPT-4.

Чтобы проверить способность Med-Gemini понимать и рассуждать на основе длинной контекстной медицинской информации, исследователи с успехом выполнили с её помощью так называемую задачу поиска «иголки в стоге сена», используя большую общедоступную базу данных Medical Information Mart for Intensive Care (MIMIC-III), содержащую обезличенные данные о состоянии здоровья пациентов, поступивших в отделение интенсивной терапии.

Поддержка Med-Gemini эффективного поиска в базе данных электронных медицинских карт Electronic Health Record (EHR) позволит «значительно снизить когнитивную нагрузку и расширить возможности врачей за счёт эффективного извлечения и анализа важной информации из огромных объёмов данных пациентов», утверждает Google.

По словам исследователей, Med-Gemini также показывают хорошие результаты в медицинских тестах, медицинских знаниях, клинических рассуждениях, геномике, медицинской визуализации, медицинских записях и видео.

Вместе с тем Google заявила, что её модели нуждаются в большей доработке и специализации, прежде чем их можно будет использовать в здравоохранении.

YouTube протестирует на платных подписчиках перемотку видео сразу на самое интересное место

YouTube тестирует новую функцию, которая позволяет пользователю быстро переключаться на самый интересный момент просматриваемого ролика. Для этого используются данные о просмотрах видео и искусственный интеллект (ИИ). Эксперимент продлится до 1 июня, и его результаты могут оказать значительное влияние на общую стратегию сервиса.

 Источник изображения: muhammadsaqii786 / Pixabay

Источник изображения: muhammadsaqii786 / Pixabay

YouTube начал тестировать упомянутую функцию в марте текущего года с участием небольшой группы пользователей, но теперь сделал её доступной для подписчиков YouTube Premium. Принцип работы довольно прост: когда пользователь дважды нажимает, чтобы перемотать видео вперёд, появляется кнопка, которая перемещает его к тому месту, до которого обычно перематывают большинство зрителей.

Для определения наиболее просматриваемых эпизодов функция использует ИИ и данные о просмотрах видео. Для получения доступа к функции необходимо быть подписчиком YouTube Premium и также включить экспериментальные функции сервиса. В настоящее время нововведение доступно только в США для приложения YouTube на Android и только для видео на английском языке, по которым есть достаточно данных, чтобы определить любимые моменты зрителей.

Согласно информации на сайте YouTube, тестирование функции продлится до 1 июня. После этого, предположительно, будет собрана обратная связь от пользователей, и на основе неё будет принято решение о более широком внедрении функции. Если вы хотите проверить, доступна ли эта функция вам, перейдите в раздел «Настройки» и выберите «Попробовать экспериментальные новые функции».

В целом, новая функция YouTube представляет собой интересный эксперимент в области улучшения пользовательского опыта. Она может значительно упростить процесс просмотра видео, особенно для тех, кто хочет быстро перейти к самым важным или вирусным моментам. Однако, как и любая новая функция, она требует дальнейшего тестирования и оптимизации, и будет интересно узнать, как она будет принята пользователями и как повлияет на общую стратегию YouTube.

В Лос-Анджелесе прошёл фестиваль ИИ-кино — оно уже почти неотличимо от традиционного

На этой неделе компания Runway AI, разрабатывающая инструменты для создания и редактирования видео с использованием искусственного интеллекта, провела в Лос-Анджелесе уже второй ИИ-кинофестиваль. В прошлом году участники представили на мероприятии 300 работ. В этом году их стало уже 3000, пишет Bloomberg.

 Источник изображения: openai.com

Источник изображения: openai.com

В театре «Орфей» (Orpheum Theatre) собрались кинематографисты, художники, технические специалисты, инвесторы и по крайней мере одна известная актриса — Наташа Лионн (Natasha Lyonne). Они с познакомились с десятью вышедшими в финал работами, которые были отобраны судьями фестиваля. Ленты были довольно странными. В одной из них мультяшная птица киви отправилась в приключение через океан. Другая работа олицетворяла борьбу современного человека с тревожностью — запертый в доме главный герой сражался с мясным монстром.

В этом году атмосфера мероприятия была той же, что и в прошлом, зато работы заметно отличались. Они меньше походили на экспериментальное кино и уже больше напоминали традиционное. В прошлом году Runway собиралась представить ПО, позволяющее генерировать видео по текстовому описанию. Тогда кинематографисты лишь начинали задумываться, как ИИ может вписаться в творческий процесс — это могли быть сгенерированные ИИ или созданные Runway инструменты для монтажа. В одной из прошлогодних работ странные расплывчатые лица в кадре, казалось, соответствовали художественному замыслу.

Теперь ИИ-ленты преобразились, как и зарождающаяся отрасль, которая их производит. Runway — лишь одна из нескольких компаний, предлагающих генерацию видео по текстовому описанию. Прорыв обещает совершить OpenAI, представившая модель Sora. Официальной даты запуска у неё пока нет, но разработчик предоставил к ней доступ небольшой группе профессионалов, и это дало интересные результаты. ИИ быстро превращается из необычной новинки в полезный инструмент для кинематографистов. Глядя представленные на фестивале работы, не всегда можно было точно сказать, где и как в производственном процессе использовался ИИ.

В юбилейной публикации блога AMD слова «искусственный интеллект» упоминались 23 раза

AMD отметила на этой неделе свое 55-летие, и по такому случаю опубликовала пост в блоге, который посвящён достижениям и инновациям компании. Однако в нём непропорционально большое внимание уделяется искусственному интеллекту — это словосочетание упоминается целых 23 раза! Очевидно, что такой акцент сделан неспроста, учитывая, что технологии искусственного интеллекта существуют всего несколько лет.

 Источник изображения: AMD

Источник изображения: AMD

За более чем полувековое существование компании произошло многое — судебные иски против Intel, приобретение технологий ATI, приобретение лидера в производстве ПЛИС (PGA) компании Xilinx, использование чипов AMD в новейших игровых консолях и т.д. При этом продажи полупроводников выросли с $412 млрд в 2019 году до $574 млрд в 2022, а на технологиях AMD работают 140 суперкомпьютеров и 30% мировых серверов, сообщает издание Techspot.

Однако в посте официального блога технический директор Марк Пейпермастер (Mark Papermaster) называет ИИ самым значимым технологическим прорывом за всю карьеру и подчёркивает вклад AMD в развитие этого направления. В частности, он пишет, что компания первой выпустила на рынок процессоры с искусственным интеллектом, интегрировав специальный нейронный блок (NPU) в процессор x86. Кроме того, Пейпермастер отмечает, что технологии ИИ активно применяются во внутренних бизнес-процессах AMD для повышения эффективности и смело заявляет о том, что искусственный интеллект окажет ещё большее влияние на общество, чем появление интернета.

Не исключено, что акцент на ИИ в юбилейном посте мог быть связан со стремлением продемонстрировать тот факт, что компания не собирается ограничиваться прошлыми заслугами и традиционными направлениями бизнеса и полна решимости стать заметным игроком на новом перспективном рынке технологий искусственного интеллекта. И пусть пока доля AMD в этом сегменте не слишком велика — всё в мире меняется. В любом случае, 23 упоминания ИИ в посте явно многовато для технологии, которая появилась буквально пару лет назад и, очевидно, что за этим что-то стоит.

SK hynix обмолвилась о разработке SSD объёмом 300 Тбайт

Компания SK hynix в рамках недавней пресс-конференции рассказал о перспективных разработках, среди которых оказался твердотельный накопитель объёмом 300 Тбайт. Новая разработка станет частью более широкого ассортимента продуктов и технологий компаний, предназначенных для дата-центров и ИИ-систем.

 Источник изображения: SK hynix

Источник изображения: SK hynix

По мнению SK hynix, совокупный мировой объём информации, генерируемой людьми и системами искусственного интеллекта к 2030 году достигнет значения 660 зеттабайт. Этот огромный объём данных необходимо где-то хранить, и в таком деле как раз пригодятся жёсткие диски объёмом 100 Тбайт и твердотельные накопители объёмом 300 Тбайт.

О разрабатываемом SK hynix накопителе объёмом 300 Тбайт практически ничего неизвестно, за исключением того факта, что в ближайшие годы спрос на высокопроизводительные SSD большой ёмкости резко возрастёт. В связи с этим для различных задач потребуются как накопители большой ёмкости, так и высокопроизводительные флеш-массивы.

Как предполагает портал Tom’s Hardware, SK hynix может вести разработку конкурента архитектуре системы хранения данных Samsung PBSSD, которая к настоящему моменту представляет собой флеш-массив объёмом 240 Гбайт, но обладает возможностями масштабирования до систем петабайтного класса. Подобные платформы обладают возможностью изоляции потоков данных при множественном доступе к накопителю, позволяя сохранить для разных нагрузок заданные для них уровни задержки и производительности.

Согласно другому предположению, SK hynix может вести разработку конкурента 3,5-дюймовомым твердотельным носителям ExaDrive от компании Nimbus, которые могут хранить до 100 Тбайт информации. Правда, последние представляются весьма нишевыми продуктами и обладают низкой производительностью. Также разработка южнокорейской компании может представлять собой специализированный SSD в формате карты расширения PCIe. Однако опять же, носитель объёмом 300 Тбайт даже при использовании интерфейса PCIe 6.0 x16, скорее всего, будет обладать весьма низкой производительностью в расчёте на терабайт доступного пространства.

Помимо SSD объёмом 300 Тбайт SK hynix также работает над множеством других продуктов, которые будут полезны для задач по обучению ИИ в масштабах ЦОД (высокопроизводительная память HBM4 и HBM4E, решения Pooled CXL, а также Processing-in-Memory (PIM)), для периферийного оборудования с поддержкой ИИ (память LPDDR6, GDDR7, PIM), а также устройств для локальной работы ИИ (память LPDDR6, GDDR7 и DDR5 высокой ёмкости).

TSMC начала выпускать гигантские чипы для суперкомпьютера Tesla Dojo

Недавнее упоминание TSMC о методах производства чипов с высокой степенью интеграции для суперкомпьютера Tesla Dojo, который Tesla будет использовать для развития своих систем искусственного интеллекта, имело вполне прагматичный повод. Как стало известно на этой неделе, TSMC уже приступила к производству чипов Tesla, использующих метод упаковки CoW-SoW.

 Источник изображения: TSMC

По данным тайваньских СМИ, компания TSMC уже приступила к производству чипов Dojo D1 для нужд компании Tesla. По своей вычислительной производительности они будут превосходить существующие системы более чем в 40 раз. Новая технология упаковки позволяет создавать логические процессоры в масштабе целой кремниевой пластины типоразмера 300 мм. В массовом производстве TSMC собирается освоить данный метод упаковки и интеграции к 2027 году.

На одной пластине процессоры Dojo объединяются в массив размером 5 на 5 штук. До 60 микросхем памяти типа HBM могут располагаться на такой кремниевой пластине. Tesla собирается вложить в развитие суперкомпьютера Dojo в Нью-Йорке не менее $500 млн. На этом пути её мешают различные препятствия. Например, в декабре прошлого года штат компании покинули два крупных специалиста по разработке данного суперкомпьютера.

Предполагается, что запуск Dojo будет иметь критическое значение для вывода на рынок роботизированного такси Tesla, формальный анонс которого намечен на 8 августа текущего года. Если суперкомпьютер Dojo расположится в Нью-Йорке, то его вычислительный компаньон, построенный на ускорителях Nvidia, будет работать рядом со штаб-квартирой компании в штате Техас. Центр обработки данных в Остине будет потреблять до 100 МВт мощности.

Microsoft закрыла полиции США доступ к ИИ, который использовали для распознавания лиц

Microsoft подтвердила запрет полицейским структурам в США использовать инструменты генеративного искусственного интеллекта для распознавания лиц, основанные на технологиях её партнёра OpenAI — корпоративные клиенты могут пользоваться ими в облачной инфраструктуре Azure.

 Источник изображения: Tumisu / pixabay.com

Источник изображения: Tumisu / pixabay.com

В условиях обслуживания платформы Azure OpenAI Service появилась формулировка, которая с большей очевидностью запрещает осуществлять её интеграцию с полицейскими структурами в США с целью распознавания лиц, включая интеграцию с существующими и перспективными моделями ИИ для анализа изображений. Отдельный пункт документа прямо запрещает использование «технологии распознавания лиц в реальном времени» на мобильных камерах, включая нательные камеры и видеорегистраторы для попыток идентификации личности в «неконтролируемых» условиях.

Microsoft обновила политику через неделю после того, как компания Axon, производитель технологического оборудования для вооружённых сил и правоохранительных органов, анонсировала новую систему расшифровки записи звука с нательных камер — эта система основана на модели OpenAI GPT-4. Правозащитники указали, что она может давать сбои из-за склонности ИИ к галлюцинациям и расовым предубеждениям. При этом отсутствуют точные сведения, использовала ли Axon доступ к GPT-4 через Azure OpenAI Service, а если да, то стало ли обновление политики реакцией на этот продукт.

Запрет на доступ к Azure OpenAI Service распространяется только на полицию США, а не правоохранительные органы других стран. Он также не распространяется на системы распознавания лиц с помощью стационарных камер в контролируемых средах, например, на территории отделения. OpenAI, которая ранее отказывалась от сотрудничества с вооружёнными силами, запустила ряд проектов для Пентагона, в том числе по направлению кибербезопасности, сообщило в январе агентство Bloomberg. Microsoft также предложила Министерству обороны США генератор изображений OpenAI DALL-E для разработки ПО для проведения военных операций, узнало издание The Intercept. Платформа Azure OpenAI Service с дополнительными возможностями стала доступной в пакете Microsoft Azure для государственных учреждений в феврале.

Глава Apple уверен, что ИИ будет работать на iPhone лучше, чем у других

Не так давно руководство Apple провело виртуальную встречу с инвесторами, в рамках которой были озвучены финансовые результаты компании по итогам второго квартала 2024 финансового года. В собрании принял участие и глава Apple Тик Кук (Tim Cook), который поднял тему технологий на основе искусственного интеллекта и выразил уверенность в том, что у Apple есть преимущества, которые позволят её выделиться с функциями на базе генеративного ИИ на фоне конкурентов.

Говоря о ежегодной конференции WWDC 2024, которая состоится в следующем месяце, Кук сказал, что рад поделиться тем, над чем работает компания. Хотя он напрямую не сказал, что в iOS 18 появятся ИИ-функции, было отмечено, что Apple продолжает делать «значительные инвестиции» в развитие генеративных алгоритмов, и что компания уже скоро поделится со своими клиентами «некоторыми очень интересными вещами». Глава Apple добавил, что компания по-прежнему очень оптимистично настроена в отношении собственных возможностей в сфере генеративных нейросетей.

Тим Кук и раньше упоминал, что Apple работает над созданием генеративных алгоритмов, но вместе с тем компания ведёт переговоры со сторонним разработчиками, включая Google, о применении их ИИ в своих будущих продуктах. На этом фоне глава Apple заявил, что у компании есть преимущества, которые позволят ей выделиться с функциями генеративным ИИ на на фоне конкурентов — задача непростая, ведь у многих новейших смартфонов ИИ-функции очень похожи. В качестве примеров таких преимуществ Кук отметил наличие нейронного сопроцессора в фирменных чипах Apple, плотную интеграцию программной и аппаратной составляющих, а также внимание компании к обеспечению конфиденциальности пользователей.

«Мы верим в преобразующую силу и возможности искусственного интеллекта, и мы верим, что у нас есть преимущества, которые будут отличать нас в эту новую эпоху, включая уникальное сочетание бесшовной интеграции аппаратного и программного обеспечения с сервисами Apple, революционный Apple Silicon с нашим ведущим в отрасли нейронным сопроцессором, а также нашу непоколебимую ориентированность на обеспечение конфиденциальности, которая лежит в основе всего, что мы создаём», — заявил Тим Кук.

По слухам, Apple работает над интеграцией нескольких функций на базе искусственного интеллекта в свои операционные системы. Ожидается, что некоторые из них будут представлены в рамках мероприятия WWDC в следующем месяце. Речь идёт о чат-боте, умных плейлистах в Apple Music и интеллектуальном помощнике в браузере Safari. Компания развивает собственные большие языковые модели для обеспечения работы ИИ-функций в автономном режиме, а также ведёт переговоры с OpenAI и Google для лицензирования их технологий и последующего использования в iOS 18.

Акции AMD упали на 9 % — компания занизила прогноз для сегмента ИИ, посчитали аналитики

Похоже, что ключевым событием квартального отчёта AMD для инвесторов вчера стало повышение компанией прогноза по выручке в сегменте ИИ на этот год с $3,5 до $4 млрд. Многие из игроков фондового рынка рассчитывали на более серьёзную корректировку прогноза, и реальность их несколько разочаровала. Многие аналитики, кстати, считают новый прогноз AMD довольно консервативным. Так или иначе, акции компании вчера подешевели на 9 %.

 Источник изображения: AMD

Источник изображения: AMD

Вчера по итогам полной торговой сессии акции AMD упали в цене на 8,91 %, а после закрытия торгов они опустились ещё на 0,4 процентных пункта, тем самым обеспечив снижение курса более чем на 9 %. Аналитики на квартальной отчётной конференции пытались вытянуть из руководства AMD комментарии о факторах, которые способствовали как увеличению прогноза по выручке в сегменте ИИ на $500 млн, так и ограничению прироста именно такой суммой. Представители компании комментарии на эту тему давали неохотно, пытаясь внушить инвесторам мысль, что объёмы поставок ускорителей вычислений не будут ограничены производственными квотами, и в случае необходимости их удастся нарастить.

Генеральный директор Лиза Су (Lisa Su) поспешила добавить, что перспективный план по выпуску новых поколений ускорителей у AMD разработан на пару лет вперёд, и у Instinct MI300 предусмотрены преемники на несколько поколений. Тесное сотрудничество с крупными клиентами позволяет AMD дорабатывать ускорители с учётом их пожеланий, а чиплетная компоновка облегчает внесение оперативных изменений в дизайн продуктов. Всё это в совокупности позволяет продукции AMD в этом секторе рынка сохранять высокую конкурентоспособность, как поясняет глава компании. «Я считаю, что MI300X очень конкурентоспособен по быстродействию в сфере формирования логических выводов, и это продолжит оставаться нашей сильной стороной по мере того, как мы будем представлять новые продукты в текущем году и следующем», — резюмировала Лиза Су.

Эксперты J.P. Morgan поспешили заявить, что скромное увеличение прогноза AMD в сфере выручки от поставок ускорителей для систем ИИ может быть обусловлено производственными ограничениями. По мнению аналитиков, AMD может запросто в этом году выручить на этом направлении более $5 млрд и продолжить теснить Intel в сегменте серверных центральных процессоров, отобрав у неё ещё до десяти процентов рынка к середине года. По мнению представителей Mizuho Securities, компания AMD на рынке ускорителей вычислений для систем ИИ находится в самом начале пути, а потому и её дальнейшее развитие окажется более динамичным по сравнению с Nvidia. Аналитики KeyBanc Capital Markets считают, что уровень выручки в $4 млрд выбран AMD в качестве «безопасного минимума», и в действительности поставки ускорителей серии Instinct MI300 принесут компании по итогам этого года гораздо больше средств.

SK hynix распродала всю память HBM до конца 2025 года и скоро начнёт поставлять образцы 12-ярусной HBM3E

В конце февраля южнокорейская компания SK hynix уже заявляла, что фактически обеспечена заказами на выпуск памяти типа HBM до конца текущего года. Сезон квартальных отчётов заставил компанию поднять ставки, заявив о наличии заказов вплоть до конца 2025 года, попутно пообещав начать поставки новейшей HBM3E в третьем квартале текущего года.

 Источник изображения: SK hynix

Источник изображения: SK hynix

К массовому производству микросхем HBM3E компания приступит в следующем квартале, как отмечается в свежем заявлении SK hynix. Производитель по-прежнему считает, что объёмы выпуска HBM будут увеличиваться в среднем на 60 % в ближайшие годы. По традиции, собственные инвестиции SK hynix в расширение производства памяти распланированы вплоть до 2046 года, и к этому сроку компания собирается вложить $91 млрд в развитие крупнейшего комплекса по производству памяти в Йонъине. На первом этапе на строительство нового предприятия, которое войдёт в состав нового комплекса, планируется потратить около $14,5 млрд. Ещё $3,87 млрд будет вложено в строительство предприятия по тестированию и упаковке памяти в штате Индиана. Как пояснили на этой неделе представители SK hynix, финансировать эти проекты компания рассчитывает преимущественно за счёт собственных средств, поскольку рассчитывает на пропорциональный рост прибыли.

Ситуация с расширением производства HBM руководству SK hynix нравится тем, что заказы клиентов растут предсказуемо, и это позволяет более чётко планировать строительство новых предприятий. По крайней мере, у компании появляется больше уверенности, что новые линии по выпуску HBM окажутся загружены работой, тогда как традиционный рынок DRAM в целом более непредсказуем с точки зрения колебания спроса и предложения.

Поставки образцов новейшей 12-ярусной памяти типа HBM3E своим клиентам, главным из которых остаётся Nvidia, компания SK hynix начнёт в мае текущего года, а в третьем квартале приступит к её массовому производству. К 2028 году, как считают в SK hynix, доля микросхем памяти для систем искусственного интеллекта, включая HBM и DDR, в стоимостном выражении достигнет 61 % всех поставок продукции этой марки. В прошлом году этот показатель не превышал 5 %, так что нет ничего удивительного в том, что заказами на поставку HBM компания теперь обеспечена вплоть до конца следующего года.

Мобильный ИИ-гаджет Rabbit R1 за $199 подвергся критике экспертов после дебюта на CES 2024

Новейший ИИ-гаджет Rabbit R1, вызвавший волну интереса на международной выставке CES 2024, после начала продаж подвергся жёсткой критике со стороны экспертов. Стоимость устройства составляет $199, но ряд технических недочётов и ограниченная функциональность вызвали серьёзные вопросы к его практической ценности.

 Источник изображений: rabbit.tech

Источник изображений: rabbit.tech

На CES Rabbit R1 быстро стал центром внимания благодаря своей инновационной системе — большой модели действий (Large Action Model или LAM), которая позволяет устройству автоматически выполнять задачи, аналогично персональному ассистенту. Эта технология предполагает не просто выполнение команд, а обучение в процессе использования, что открывает новые перспективы для взаимодействия пользователя с устройством. Благодаря этому 10 000 устройств были проданы по предварительным заказам.

Однако, вопреки изначальному энтузиазму, в первых обзорах новинки эксперты стали указывать на серьёзные проблемы с совместимостью приложений и недолговечностью батареи. Интересно, но на момент запуска Rabbit R1 поддерживает всего четыре приложения, что значительно ограничивает его функциональность. Продолжительность работы устройства от одного заряда батареи составляет всего несколько часов, что ставит под вопрос его удобство в ежедневном использовании.

Технологический обозреватель Маркес Браунли (Marques Brownlee), известный своей критической оценкой продукта Humane AI Pin, отметил, что хотя Rabbit R1 и лучше, планка для его сравнения установлена довольно низко. Он подчеркнул, что устройство кажется незаконченным и не готовым к массовому выпуску, и считает его едва ли пригодным для обзора. Его замечание отражает общую тенденцию в технологической и игровой индустрии, а теперь и в продуктах с ИИ, которые кажутся сделанными наспех.

Как отмечают издания Tom's Guide и Digital Trends, устройство создаёт впечатление «сырого» продукта. В частности, Tom's Guide присвоил Rabbit R1 оценку в 1,5 звезды из 5 и посоветовал избегать этого гаджета, а Digital Trends назвал новинку «беспорядочной», подчёркивая серьёзные недостатки в её функциональности. Многие рецензенты сомневаются в целесообразности Rabbit R1, тем более что кажется, что всё, что он делает, можно сделать с помощью приложения для смартфона.

Журналист Мишаал Рахман (Mishaal Rahman) из издания Android Authority продемонстрировал, что некоторые функции Rabbit R1 можно реализовать, установив файл APK лаунчера Rabbit на смартфон Google Pixel 6A. Однако он отметил, что без привилегированных разрешений системного уровня не все функции работают должным образом, что свидетельствует о потенциальных ограничениях такой интеграции.

Появление Rabbit R1 на рынке стало ярким событием, однако первый опыт эксплуатации оставил пользователей с множеством вопросов и сомнений. Производителю предстоит не только доработать свой продукт до уровня ожиданий пользователей, но и продемонстрировать, что инновации могут быть не только яркими, но и функциональными, чтобы восстановить утраченное доверие.

Nvidia добавила в ChatRTX голосовой ввод, поддержку нейросети Google Gemma и поиск фотографии на ПК с помощью OpenAI CLIP

Компания Nvidia обновила своё приложение ChatRTX для запуска локальных ИИ-чат-ботов, добавив поддержку новых ИИ-моделей. Изначально приложение предлагало поддержку ИИ-моделей Mistral и Llama 2. Обновлённая версия получила поддержку моделей Gemma от Google, ChatGLM3, а также CLIP от OpenAI, упрощающей поиск фотографий и изображений.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Nvidia представила первую версию ChatRTX в феврале этого года в качестве демонстрационного приложения под названием Chat with RTX. Для его работы требуется видеокарта из серии GeForce RTX 3000 или RTX 4000 с как минимум 8 Гбайт памяти. Приложение создаёт локальный сервер для чат-бота, доступ к которому осуществляется через браузер. Он может обрабатывать файлы на компьютере, видео из YouTube, а также отвечать на вопросы, выдавая релевантные ответы на основе видеороликов и документов пользователя.

ИИ-модель Gemma от Google была создана для работы на базе мощных ноутбуков и настольных ПК. Она представляет собой открытую версию ИИ-модели Gemini, и подойдёт для решения относительно небольших задач, например, для подготовки конспектов больших текстов. ChatGLM3, в свою очередь, является открытой двуязычной (поддерживает английский и китайский) большой языковой моделью. OpenAI Contrastive Language-Image (CLIP) позволяет пользователю искать фотографии и изображения на компьютере.

Также в новой версии ChatRTX добавлена поддержка голосовых запросов через систему распознавания речи Whisper. Скачать ChatRTX можно с официального сайта Nvidia.

Разработан ИИ, распознающий эмоции человека по голосу — он поможет в работе кризисных линий

Модель искусственного интеллекта оказалась эффективным инструментом для выявления таких эмоций как страх и беспокойство в голосах людей, которые звонят на телефонные линии психологическом помощи. Автор проекта надеется, что она окажется полезной для телефонных операторов на линиях по предотвращению самоубийств.

 Источник изображения: The_BiG_LeBowsKi / pixabay.com

Источник изображения: The_BiG_LeBowsKi / pixabay.com

Оценка эмоционального состояния звонящих на кризисные телефонные линии на предмет текущего уровня суицидального риска имеет решающее значение для выявления и предотвращения самоубийств. Речь человека способна при помощи невербальных средств передавать полезную информацию о психическом и эмоциональном состоянии человека, содержа подсказки о том, испытывает он грусть, злобу или страх. Исследования суицидальной речи начались более 30 лет назад — уже удалось выявить в ней объективные звуковые признаки, которые можно использовать для определения различных психических состояний и расстройств, включая депрессию.

Но для человека, слушающего собеседника по телефону, оценка риска самоубийства может оказаться сложной задачей, потому что на кризисные линии звонят люди, пребывающие в крайне эмоционально нестабильном состоянии, и характеристики их речи могут быстро меняться. Решение этой задачи предложил Алаа Нфисси (Alaa Nfissi), аспирант университета Конкордия (Канада, г. Монреаль). Он обучил распознаванию речевых эмоций модель ИИ. Обычно такую оценку проводили психологи, из-за чего она требовала значительных временных затрат и опыта, но модель глубокого обучения оказалась способной эффективно распознавать эмоции.

Для обучения модели автор проекта использовал базу реальных записей звонков на кризисные линии для предотвращения самоубийств, а также записи актёров, которым было поручено изображать определённые эмоции. Записи были разбиты на сегменты и снабжены аннотациями, отражающими соответствующее состояние психики: злость, грусть, нейтральное состояние, страх или беспокойство. В результате модель научилась достаточно точно распознавать четыре эмоции: страх/беспокойство (правильный ответ в 82 % случаев), грусть (77 %), злость (72 %) и нейтральное состояние (78 %). Особенно хорошо модель справлялась с оценкой фрагментов записей настоящих звонков: грусть (78 %) и злость (100 %).

Алаа Нфисси считает, что разработанная им модель ИИ сможет использоваться в качестве вспомогательного инструмента для работы на кризисных линиях, помогая операторам в реальном времени оценивать состояние собеседников и выбирать подходящие стратегии разговора. Возможно, это будет способствовать предотвращению самоубийств.

Большинство возможностей ИИ-гаджета Rabbit R1 уместилось в одном приложении для Android

На минувшей неделе в продажу поступило основанное на искусственном интеллекте устройство Rabbit R1. Выход необычного гаджета заставил общественность задаться вопросом, почему эти функции не повторить в мобильном приложении. Как выяснилось, этот гаджет работает под управлением Android, и большинство его возможностей действительно реализовано в одном приложении.

 Источник изображения: youtube.com/@AndroidAuthority

Источник изображения: youtube.com/@AndroidAuthority

Журналисту Android Authority Мишаалу Рахману (Mishaal Rahman) удалось установить файл APK лаунчера Rabbit на смартфон Google Pixel 6A. Проведя некоторую настройку, он запустил приложение так, как если бы оно работало на оригинальном устройстве Rabbit R1. Используя клавишу увеличения громкости вместо единственной аппаратной кнопки на Rabbit R1, он настроил учётную запись и начал задавать телефону вопросы, как если бы это был оригинальный ИИ-гаджет за $199.

Всех возможностей устройства приложение, вероятно, предложить не сможет, признаёт журналист: «Приложение лаунчера Rabbit R1 рассчитано на предварительную установку в прошивке и на некоторые привилегированные разрешения системного уровня — мы смогли предоставить лишь некоторые из них — поэтому некоторые функции, скорее всего, дадут сбой, если мы попытаемся». Но тот факт, что ПО работает на недорогом телефоне двухлетней давности, даёт основания утверждать, что у него много общего с обычным приложением для Android.

Основатель и гендиректор компании Rabbit Джесси Лю (Jesse Lyu) с такой формулировкой не согласен. «Rabbit R1 — это не приложение для Android. <..> Rabbit OS и LAM [Large Action Model — «большая оперативная модель»] работают в облаке с особой модификацией AOSP и прошивки низкого уровня, поэтому локальный пиратский APK без подходящей ОС и облачных ресурсов не сможет получить доступ к нашей службе. Rabbit OS оптимизирована для R1, и сторонних клиентов мы не поддерживаем», — заявил он в соцсети X.

Гаджет Rabbit R1 не уникален в использовании платформы от Google: как выяснилось, на открытом варианте Android работает ещё один ИИ-гаджет — Humane AI pin. Что же касается Rabbit R1, он лишь недавно поступил в продажу и уже начал вызывать некоторые нарекания. Производитель уже выпустил первое обновление ПО, чтобы устранить некоторые проблемы и увеличить срок автономной работы аккумулятора. На практике, считают авторы первых обзоров, Rabbit R1 недостаточно полезен, чтобы оправдать своё существование при наличии телефонов — особенно если его возможности можно воплотить в приложении.

ИИ поднимает доходы не только компаниям, но и целым странам — ВВП Тайваня показал максимальный рост с 2021 года

На Тайване сосредоточены не только передовые предприятия компании TSMC, но и производственные мощности по сборке серверных систем, которые активно используются в сегменте искусственного интеллекта. По итогам первого квартала экспорт подобной продукции обеспечил рост ВВП острова на 6,51 % до $167 млрд, и это стало лучшей динамикой со второго квартала 2021 года.

 Источник изображения: TSMC

Источник изображения: TSMC

Опрощенные Bloomberg аналитики рассчитывали, что рост ВВП Тайваня в первом квартале не превысит 6 %, но реальность оказалась лучше прогноза, если судить по предварительным данным статистики. Высокотехнологичная продукция и спрос на компоненты для систем искусственного интеллекта стали главными локомотивами этого роста. Экспорт товаров и услуг с Тайваня в первом квартале вырос на 12,9 %, причём китайское направление оставалось для острова главным с экономической точки зрения — экспорт тайваньской продукции в КНР вырос на 5,3 %. В четвёртом квартале прошлого года ВВП Тайваня вырос на 4,93 %, а более крупный рост последний раз наблюдался только во втором квартале 2021 года, когда он достиг 8,1 %.

Органы государственной статистики Тайваня теперь рассчитывают, что ВВП острова по итогам всего года вырастет на 3,57 %, а не на 3,43 %, как ожидалось в феврале. Тайваньский экспорт по итогам марта в отдельности вырос на 18,9 %, показав лучшую динамику за два предыдущих года. Объёмы поставок компонентов для ПК и систем искусственного интеллекта выросли более чем на 400 % в денежном выражении. Выросло и внутреннее потребление в экономике Тайваня, отчасти из-за оживления туристического бизнеса. В течение этого года темпы роста ВВП острова могут снизиться, поскольку прошлый год сформировал высокую базу для сравнения. Тем более, что производители полупроводниковых компонентов в лице TSMC и Intel дали сдержанные прогнозы по развитию рынка в этом году.

В целом, энтузиазм инвесторов в отношении сегмента систем искусственного интеллекта уже способствовал росту тайваньских фондовых индексов на 14 % с начала текущего года. Стало быть, на буме данных технологий могут зарабатывать не только отдельные компании, а целые страны и регионы при наличии соответствующего экономического потенциала.


window-new
Soft
Hard
Тренды 🔥
Google отлучила «Ассистента» от умного дома — представлен продвинутый ИИ-помощник Gemini for Home 3 ч.
«Лучшее, что я видел за последние годы»: безумный платформер Denshattack! отправит игроков выполнять трюки на неподвластном гравитации поезде 3 ч.
Ярость войны, напалм и масштаб: анонсирован многопользовательский шутер Hell Let Loose: Vietnam 4 ч.
Сюжетная ролевая игра Rue Valley, вдохновлённая Disco Elysium и «Днём сурка», получила дату выхода и новый геймплейный трейлер 6 ч.
«Не терпится купить 12 DLC, чтобы получить полную игру»: Paradox раскрыла дату выхода Europa Universalis V, но фанаты делать предзаказ не спешат 7 ч.
Китайцы запустили ИИ-стримера-продавца, который превосходит человека и готов работать круглосуточно 7 ч.
Как Overwatch, но с танками: создатели World of Tanks анонсировали геройский шутер World of Tanks: Heat 8 ч.
Тысячи приватных диалогов с Grok утекли в поиск Google 9 ч.
Больше никаких «Меня слышно?» — в Microsoft Teams появится индикатор работы микрофона 9 ч.
В новом трейлере Resident Evil Requiem показали встречу главной героини с матерью, которая пошла не по плану 10 ч.
Новая статья: Curator — и пусть DDoS подождёт 3 ч.
Lenovo откроет в Саудовской Аравии штаб-квартиру и развернёт производство IT-оборудования 3 ч.
Qualcomm представила процессоры Snapdragon W5 Gen 2 и W5+ Gen 2 для смарт-часов со спутниковой связью 4 ч.
Google представила смарт-часы Pixel Watch 4 с поддержкой спутниковой связи 5 ч.
Google сделала свой MagSafe: магнитное крепление Pixelsnap для зарядки и не только 5 ч.
Портрет всего человечества с расстояния 290 млн км: межпланетная станция «Психея» запечатлела Землю и Луну 5 ч.
«Роскосмос» запустил на орбиту 75 мышей и 1500 мух на спутнике «Бион-М» — через месяц они вернутся в Россию 5 ч.
Google представила беспроводные наушники Pixel Buds 2a со сменной батареей в чехле и активным шумоподавлением за $129 5 ч.
MSI представила самую оверклокерскую плату MEG X870E Godlike X Edition, а также модели X870E MAX попроще 5 ч.
MSI показала видеокарту GeForce RTX 5000 в стиле World of Warcraft: Midnight 5 ч.