Сегодня 16 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Похожие на людей роботы 1X Eve показали полную автономность в бытовых задачах

Норвежский производитель роботов 1X продемонстрировал возможности модели Eve, способной выполнять множество операций в полностью автономном режиме. Компания подчеркнула, что роботы на демонстрационном видео не управлялись человеком в удалённом режиме, при подготовке материала не использовались монтажные склейки, ускорение видео, не было запрограммированных последовательностей — машины контролировались нейросетями без участия человека.

 Источник изображения: 1x.tech

Источник изображения: 1x.tech

В рамках первого раунда финансирования с бюджетом $25 млн компанию 1X поддержала OpenAI; за ним последовал второй раунд финансирования с бюджетом уже $100 млн. Человекоподобные роботы 1X выглядят достаточно скромно в сравнении с аналогами от Tesla, Figure, Sanctuary и Agility: у модели Eve нет ни ног, ни ловких ладоней. Этот робот передвигается на трехколёсной платформе, а на концах рук относительно простые манипуляторы. Чтобы внешний вид роботов был эстетичным, их нарядили в человеческую одежду, а на голове установили светодиодный экран с анимированным улыбающимся лицом.

В разработке 1X значится также более похожий на человека робот Neo, который передвигается на двух ногах и может похвастаться красивыми руками, но для демонстрации базовых возможностей хватило и Eve. Все эти задачи сводятся преимущественно к навигации по помещению и перекладыванию предметов с места на место. Но в действительности 1X Eve оказались удивительно способными по сравнению с другими роботами. Они раскладывают вещи по коробкам и лоткам, собирают игрушки с пола, становятся на зарядку, руками подключая к себе кабель питания и отключая его, когда он больше не нужен, и открывают перед собой двери, если необходимо войти в соседнее помещение.

Инженеры 1X обучили 30 единиц Eve различным базовым задачам при помощи демонстрации видео и удалённого управления — эти операции транслировались базовой модели искусственного интеллекта и дорабатывались с учётом конкретной среды. Система свела задачи к конкретным действиям, которые выполнялись роботами. Как утверждает разработчик, последний этап для коммерческих версий робота сможет осуществляться на месте у клиентов — потребуются «лишь несколько минут для сбора данных и обучения на графическом процессоре ПК». Возможно, оператору потребуется сначала самому продемонстрировать системе необходимую последовательность действий — система глубокого обучения многократно прогонит задачу через систему моделирования с учётом различных случайных факторов и подготовит машины к непосредственной работе.

NVIDIA ненадолго обогнала Amazon по рыночной капитализации — всё благодаря ИИ

NVIDIA на некоторое время обогнала компанию Amazon по рыночной капитализации в понедельник, пишет Reuters. Продолжающаяся эйфория вокруг технологий искусственного интеллекта позволила разработчику графических процессоров занять четвёртое место среди самых дорогих компаний США.

 Источник изображения: Gordon Mah Ung / PCWorld

Источник изображения: Gordon Mah Ung / PCWorld

По данным Лондонской фондовой биржи, при рекордно высокой стоимости акции в $734,96, наблюдавшейся в понедельник, рыночная стоимость NVIDIA составила $1,82 трлн долларов. Это позволило ей обогнать розничного гиганта Amazon с капитализацией $1,81 трлн и оказаться всего в нескольких миллиардах долларов позади холдинга Alphabet, владельца Google, стоимость которого составляет $1,87 трлн. Правда, к моменту публикации рыночные стоимости NVIDIA и Amazon несколько сократились, соответственно, до $1,78 трлн и $1,79 трлн, так что в итоге NVIDIA пока что уступает Amazon.

В последний раз NVIDIA оценивалась дороже Amazon в 2002 году, когда стоимость каждой из компаний составляла менее 6 млрд долларов. После более удачного, чем ожидалось, финансового отчёта компании Amazon за последний квартал минувшего года, инвесторы с предвкушением ожидают финансовых результатов NVIDIA, которая отчитается о результатах работы одной из последних среди гигантов, 21 февраля. Заметим, что с начала текущего года NVIDIA подорожала на 47 %, что сделало её самой быстрорастущей компанией из индекса S&P 500.

Выдающиеся прошлые квартальные результаты и сильные прогнозы NVIDIA в прошлом году показали, что разработчик чипов является лидером в сегменте поставок аппаратного обеспечения для компаний, занимающих разработкой и использованием технологий генеративного искусственного интеллекта. Последние применяются в специальных чат-ботах и программах для генерации изображений.

Ставка на высокий спрос на ИИ-технологии привела к росту NVIDIA на 223 % за последние 12 месяцев, сделав её самой прибыльной среди так называемой «Великолепной семёрки», пишет издание Reuters. На втором месте самой быстрорастущей компанией в этом списке с показателем 163 % находится Meta Platforms.

Через пять лет стоимость всех центров обработки данных в мире удвоится до $2 трлн

На прошлой неделе стало известно об инициативе главы OpenAI Сэма Альтмана (Sam Altman) о привлечении $7 трлн средств инвесторов на строительство десятков новых предприятий для TSMC, способных кратно увеличить объёмы выпуска ускорителей для систем искусственного интеллекта. Глава и основатель NVIDIA убеждён, что можно ограничиться и более скромными расходами, и развитию отрасли это не помешает.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Напомним, что главной идеей Сэма Альтмана является создание адекватного количества производственных линий по выпуску ускорителей вычислений, поскольку сейчас возможности имеющихся предприятий явно не покрывают потребностей отрасли. Как сообщает Bloomberg, генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) не считает, что рост расходов на строительство центров обработки данных в ближайшие годы замедлится, но при этом убеждён, что можно ограничиться и меньшими суммами по сравнению с теми, которые запрашивает Сэм Альтман.

«Мы сейчас находимся в начале новой эры. Сейчас количество функционирующих в мире центров обработки данных примерно соответствует $1 трлн. В течение четырёх или пяти ближайших лет мы получим количество центров обработки данных, работающих с программным обеспечением по всему миру, соответствующее $2 трлн»,заявил Дженсен Хуанг. Он также добавил, что не нужно думать, будто нужно будет покупать больше компьютеров. По его словам, нужно исходить из того, что компьютеры будут становиться всё более производительными, и общее необходимое их количество вырастет не так значительно.

Гибридный ускоритель NVIDIA GH200 можно купить в составе рабочей станции за $41 500

Формально объединяющий на одной плате ускоритель NVIDIA GH200 предназначается для серверного применения, но в интернет-магазине GPTshop можно приобрести рабочую станцию на его основе, которая использует операционную систему Ubuntu. Экзотическая рабочая станция оценивается минимум в $41 500, поскольку подобные ускорители сами по себе являются дорогостоящими компонентами.

 Источник изображений: GPTshop

Источник изображений: GPTshop

Напомним, что ускоритель GH200 сочетает центральный процессор Grace с архитектурой Arm с 72 ядрами, он поддерживает до 480 Гбайт памяти типа LPDDR5X. По соседству на плате расположился графический процессор H200, который имеет площадь кристалла 814 мм2 и содержит 16 896 ядер CUDA, используемых для ускорения вычислений. Указанный интернет-магазин позволяет выбирать между модификацией ускорителя как с памятью HBM3, так и более новой версией с памятью типа HBM3E, которая ещё и предлагается в большем объёме.

Судя по фотографиям рабочей станции, сделанным в интерьере частного дома, система охлаждения этого необычного вычислительного решения строится на вентиляторах Noctua, которые напиханы буквально во все доступные посадочные места. В качестве опций рабочую станцию можно оснастить сетевыми платами Bluefield-3 и ConnectX-7, твердотельными накопителями объёмом до 8 Тбайт, а также жёсткими дисками объёмом до 30 Тбайт. Внутри системного блока может прописаться даже видеокарта GeForce RTX 4060, если пользователю потребуется работать с графикой на более серьёзном уровне. Впрочем, поскольку в качестве операционной системы может использоваться только Ubuntu, рассчитывать на игровое применение такой рабочей станции просто бессмысленно, учитывая концентрацию вычислительных ресурсов именно на стороне NVIDIA GH200.

В принципе, для определённых условий покупка такой рабочей станции примерно за $50 000 может считаться выгодной сделкой, если учесть, что ускоритель NVIDIA H100 предыдущего поколения сам по себе стоит $40 000. Клиенты GPTshop за чуть большие деньги просто получают готовую систему с более высокой производительностью.

Годовая выручка OpenAI выросла до $2 млрд, но компания тратит больше

Доходы стартапа из Сан-Франциско OpenAI на фоне всплеска популярности разработанного им ИИ-чат-бота ChatGPT стремительно растут. По данным источников Financial Times, в декабре 2023 года годовой оборот OpenAI (показатель выручки за предыдущий месяц, умноженный на 12) достиг отметки в $2 млрд, хотя ещё в октябре годовой доход компании, по данным The Information, составлял $1,3 млрд.

 Источник изображения: Andrew Neel/unsplash.com

Источник изображения: Andrew Neel/unsplash.com

Компания считает возможным удвоить эту сумму в 2025 году на фоне сильного интереса к её решениям со стороны бизнес-клиентов, стремящихся использовать инструменты генеративного ИИ для повышения эффективности своей работы. Благодаря стремительному росту у OpenAI есть все шансы войти в число немногих компаний Кремниевой долины, таких как Google и Meta, которым удалось получить годовой доход в $1 млрд в первые десять лет с момента своего основания.

По словам генерального директора OpenAI Сэма Альтмана (Sam Altman), по состоянию на ноябрь прошлого года 92 % компаний из списка Fortune 500 использовали продукты OpenAI, включая ChatGPT и лежащую в его основе модель искусственного интеллекта GPT-4, в то время как аудитория чат-бота выросла до 100 млн пользователей в неделю.

Интерес потребителей и бизнеса к генеративному ИИ — системам, которые могут генерировать код, текст, изображения, видео и анализировать информацию из подсказок пользователя — резко возрос, отметила Financial Times. Крупные технологические конкуренты OpenAI, такие, как Google и Meta, а также стартапы, включая Anthropic, Mistral и Cohere, тоже начали коммерциализацию своих ИИ-продуктов. Например, на этой неделе Google сделала доступной для широкой публики нейросеть Gemini Ultra, стоимость подписки на которую составляет всего $20 в месяц.

Вместе с тем Альтман отметил, что OpenAI по-прежнему работает с убытками из-за огромных затрат на создание и эксплуатацию её ИИ-моделей. По всей видимости эта тенденция сохранится ещё какое-то время из-за разработки ещё более сложных моделей, и компании, вероятно, придётся дополнительно привлекать значительные суммы, чтобы покрыть растущие расходы. Microsoft инвестировала в OpenAI до $13 млрд, но этого явно недостаточно.

«Расходы на обучение просто огромны, но это вполне ожидаемо», — сообщил Альтман газете Financial Times в ноябре прошлого года.

Смарт-очки Frame с мультимодальным ИИ Noa оценены в $349

Стартап Brilliant Labs представил умные очки Frame на открытой платформе с мультимодальным ИИ, с помощью которых можно осуществлять поиск в Сети, выполнять перевод текста или разговора, генерировать картинки и т. д.

 Источник изображений: Brilliant Labs

Источник изображений: Brilliant Labs

Frame весом всего 40 г используют чип nRF52840 Cortex-M4F и оснащены цветным микро-OLED-дисплеем с разрешением 640 x 400 пикселей, который проецируют изображение через призму прямо перед пользователем. Картинка отображается в поле зрения всего-то 20°. Для сравнения, поле зрения у Air 2 Ultra от Xreal составляет 52°. То есть пользователь Frame будет видеть изображение или текст в небольшом окошке.

Смарт-очки работают под управлением специальной операционной системы с «полностью открытым исходным кодом», а также поддерживают приложение Noa. Приложение включает ИИ-ассистента, который использует OpenAI для визуального анализа, Whisper для перевода и Perplexity для веб-поиска. В интервью Venture Beat компания заявила, что ИИ Noa «обучается и адаптируется как к пользователю, так и к задачам, которые он получает». Пользоваться Noa можно бесплатно, есть ежедневные лимиты. Устройством также можно управлять с помощью голоса.

В комплект поставки Frame входит камера с разрешением 1280 × 720 пикселей, микрофон, аккумулятор ёмкостью 222 мА·ч и зарядное устройство Mister Power, которое при подключении добавляет очкам «нос».

Frame поставляются в трех цветах: чёрном, сером и прозрачном. Цена новинки — $349. Можно также добавить линзы по рецепту, что увеличит цену до $448. Смарт-очки Frame уже доступны для предзаказа, поставки начнутся 15 апреля.

Copilot будет разъяснять пользователям смысл текста в «Блокноте»

Microsoft подтвердила, что функции службы искусственного интеллекта Copilot скоро появятся даже в базовом текстовом редакторе «Блокнот» — первыми испробовать новые возможности смогут участники программы Windows Insiders на каналах Canary и Dev предварительных версий Windows 11.

 Источник изображений: blogs.windows.com

Источник изображений: blogs.windows.com

Впервые сведения об интеграции Copilot в «Блокнот» появились около месяца назад, теперь же Microsoft подтвердила слухи, хотя это осталось почти незамеченным на фоне появления команды «sudo» в Windows. Даже простой текстовый редактор оказался не застрахован от одержимости Microsoft искусственным интеллектом. Новая функция реализована без каких-либо спецэффектов, довольно ненавязчиво.

Открыв в «Блокноте» текстовый файл, пользователь может выделить его фрагмент, нажать сочетание клавиш Ctrl+E или выбрать пункт «Объяснить с помощью Copilot», после чего ИИ-помощник предоставит свои разъяснения по данному фрагменту. Это может быть полезно при изучении файлов журналов, сегментов кода или любого другого содержимого, уточнили в Microsoft. И пока нет гарантии, что это нововведение станет общедоступным — разработчик часто использует программу Windows Insider для обкатки идей.

Компания подготовила ещё одно полезное нововведение. В утилите «Ножницы» теперь можно добавлять на снимки экрана различные геометрические фигуры — это избавит пользователей от необходимости открывать графический редактор, чтобы что-нибудь выделить на скриншоте.

Google по умолчанию собирается хранить переписку пользователей с Gemini три года

Google опубликовала на портале техподдержки разъяснение о пользовательских данных, которые собираются при взаимодействии с чат-ботом Gemini — это касается веб-интерфейса, а также переписки в приложениях для Android и iOS: по умолчанию она будет храниться три года.

 Источник изображения: Sascha Bosshard / unsplash.com

Источник изображения: Sascha Bosshard / unsplash.com

Компания отмечает, что создатели аннотаций для искусственного интеллекта регулярно читают, размечают и иным образом обрабатывают диалоги с Gemini для улучшения сервиса. Журналы переписки «отключены» от учётных записей Google, но не уточняется, кто именно читает их — собственные сотрудники компании или сторонние подрядчики. Диалоги хранятся на серверах до трёх лет вместе со «связанными данными»: языком переписки, устройством пользователя и его местоположением.

В разделе «Мои действия» настроек учётной записи Google есть страница с активной по умолчанию опцией, которая отключает сохранение переписки с Gemini — здесь же можно вручную удалить все запросы и команды, ранее отданные приложениям Gemini. Но в компании предупредили, что даже при отключении записи журналов переписка с чат-ботом будет сохраняться на сроки до 72 часов — это поможет «обеспечить безопасность приложений Gemini и улучшать приложения Gemini». Поэтому Google просит пользователей не вводить в переписке с ИИ конфиденциальные данные или любую другую информацию, которую они не хотели бы показывать сотрудникам сервиса или использовать для улучшения продуктов компании, а также её технологий машинного обучения.

Обработка конфиденциальных данных генеративным ИИ сегодня является проблемной областью. OpenAI в минувшем году пришлось по этому поводу объясняться с американскими и итальянскими властями. Amazon, Google, Microsoft и та же OpenAI предлагают основанные на ИИ сервисы для предприятий, и эти сервисы не предполагают продолжительного хранения данных. Отношения с потребителями, однако, выстраиваются по иным схемам.

Процессоры с ИИ-движками пропишутся в 60 % новых ПК к 2027 году

Разработчики центральных процессоров и некоторые производители ПК уцепились за идею создания клиентских систем, которые будут локально ускорять некоторые вычисления, связанные с работой искусственного интеллекта. По мнению представителей IDC, к 2027 году подобные процессоры будут находиться в 60 % новых ПК, поставляемых на рынок.

 Источник изображения: Lenovo

Источник изображения: Lenovo

В целом, как поясняют аналитики, по итогам текущего года объёмы поставок ПК на базе центральных процессоров с функцией аппаратного ускорения ИИ достигнут 50 млн штук, а к 2027 году увеличатся до 167 млн штук. Из этого можно сделать вывод, что эксперты IDC не рассчитывают на существенное увеличение оборотов на рынке ПК как таковом к 2027 году, поскольку 167 млн изделий будут составлять 60 % от 278 млн поставленных персональных компьютеров к концу периода прогнозирования. Системы, использующие ресурсы дискретных графических процессоров (GPU) для ускорения работы искусственного интеллекта, в статистику не попали.

По мнению представителей IDC, популярности ПК на базе процессоров с такими возможностями будут способствовать не только рост производительности соответствующих операций, но и повышение степени информационной безопасности. Пользователю уже не потребуется отправлять в облако чувствительные данные для ускорения их обработки на сервере провайдера, эти операции можно будет эффективно осуществлять на локальном компьютере. К 2027 году технология превратится из нишевой в доминирующую, как убеждены представители IDC.

Специалисты компании уже предлагают классифицировать центральные процессоры по своей вычислительной способности с точки зрения обработки информации в системах искусственного интеллекта. Наделённые нейронным блоком процессоры первого поколения сейчас предлагаются компаниями Qualcomm, Apple, AMD и Intel, они обладают способностью обрабатывать не более 40 триллионов операций в секунду (TOPS). При помощи таких процессоров достигается аппаратное ускорение отдельных функций в составе приложений, использующих системы искусственного интеллекта.

В следующем поколении центральных процессоров быстродействие нейронных блоков будет поднято до 40–60 TOPS, и это уже будет способствовать распространению специфических функций работы с ИИ на уровне операционной системы и множества приложений. Скорее всего, поставки подходящих процессоров Intel, AMD и Qualcomm начнут в текущем году. Microsoft при этом предусмотрит поддержку соответствующих функциональных возможностей на уровне Windows 11.

Процессоры третьего поколения с производительностью выше 60 TOPS никем из разработчиков пока не анонсированы, и они даже не включаются IDC в текущий вариант прогноза развития рынка до 2027 года, но по мере анонса таких процессоров в ближайшие годы в аналитические материалы будут внесены соответствующие коррективы. К 2027 году процессоры второго поколения будут примерно в два раза превосходить по численности процессоры первого поколения, как считают в IDC. Немалая часть ПК на основе таких процессоров будет продаваться корпоративным заказчикам.

В целом, перенос части вычислений из облака на локальный ПК при работе систем искусственного интеллекта выгодно по трём основным причинам. Во-первых, это снижает задержки в обработке информации, неизбежно возникающие при сетевом взаимодействии. Во-вторых, достигается более высокая информационная безопасность. В-третьих, дорогие облачные ресурсы высвобождаются под другие вычислительные задачи.

Глава OpenAI Сэм Альтман предложил скинуться всем миром, чтобы построить десятки новых предприятий для TSMC

Возможности систем генеративного искусственного интеллекта, на которых OpenAI очень быстро сделала себе имя, в своём развитии упираются в нехватку полупроводниковых компонентов и высокие расходы на электроэнергию, поэтому основатель компании Сэм Альтман сейчас сосредоточен на проекте по привлечению до $7 трлн на решение этих проблем.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как поясняет The Wall Street Journal, Сэм Альтман уже давно вкладывается в стартапы, связанные с созданием источников дешёвой электроэнергии по принципу термоядерного синтеза, но сейчас предприниматель поставил перед собой не менее амбициозную цель: собрать триллионы долларов США для финансирования строительства внушительного количества предприятий, способных выпускать заметно большее количество ускорителей вычислений для систем искусственного интеллекта, чем это возможно сейчас.

По информации осведомлённых источников, Альтман сейчас ведёт активные переговоры как с властями США, так и с правящими кругами ОАЭ, а также руководством TSMC. По его замыслу, арабские инвесторы могли бы предоставить внушительную сумму денег, до $5 трлн или $7 трлн, в совокупности с другими источниками финансирования, чтобы в ближайшие несколько лет построить несколько десятков новых предприятий по контрактному выпуску чипов, которые можно было бы передать в управление компании TSMC. На них предполагается наладить выпуск чипов для ускорителей систем искусственного интеллекта в количествах, пропорциональным амбициям Альтмана по развитию функциональных возможностей разрабатываемых OpenAI чат-ботов и больших языковых моделей.

Следует отметить, что $7 трлн являются весьма внушительной суммой не только по меркам инвестиционных проектов, но и в масштабах суверенного долга некоторых государств. В конце концов, оборот всего рынка полупроводниковых компонентов достигнет рубежа в $1 трлн лишь к концу десятилетия, а совокупная капитализация двух самых дорогих американских компаний, Microsoft и Apple, приближается к $6 трлн.

Альтман, как поясняют источники, поставил в известность о своих намерениях не только министра торговли США Джину Раймондо (Gina Raimondo), но и руководство компании TSMC, не говоря уже о правительстве ОАЭ, у которого собирается просить существенную часть денег на реализацию этого амбициозного проекта. К сожалению, на пути к претворению этого проекта в жизнь стоит немало препятствий. Во-первых, не совсем понятно, где будут построены десятки новых предприятий по выпуску чипов. США заинтересованы в их «приземлении» на родном материке, для самой TSMC реализация столь масштабных зарубежных проектов даже на стадии эксплуатации может представлять серьёзную проблему из-за определённого кадрового голода, а арабские инвесторы очевидным образом намерены развивать национальную промышленность ОАЭ. С другой стороны, власти США настороженно относятся к инвестициям арабских стран в передовые отрасли американской экономики, забывая при этом, что компания GlobalFoundries уже более десяти лет финансируется по этому принципу. Словом, замыслу Альтмана предстоит выдержать испытания суровой реальностью, поэтому прислушиваться к его планам пока приходится больше с точки зрения развлечения.

В США стало незаконным использование в робозвонках сгенерированных ИИ голосов

Федеральная комиссия по связи (FCC) США объявила незаконным использование сгенерированных искусственным интеллектом голосов в роботизированных звонках. Новое постановление ведомства позволит прокурорам штатов принимать соответствующие меры в отношении людей, использующих технологию клонирования голоса с помощью генеративных нейросетей.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

В постановлении FCC сказано, что сгенерированные с помощью ИИ голоса теперь считаются «искусственными или записанными заранее голосами» в соответствии с Законом о защите потребителей услуг телефонной связи. Это означает, что звонящие больше не смогут задействовать сгенерированные голоса при совершении неэкстренных звонков или без предварительного согласия потребителей. Упомянутый закон включает в себя ряд запретов на использование разных методов автоматического обзвона. Любопытно, что запрет на использование «искусственного или заранее записанного голоса» для распространения сообщений в законе был и прежде, но не было чёткого указания на то, что к этой категории относятся голоса, клонированные с помощью ИИ.

«Злоумышленники используют голоса, сгенерированные искусственным интеллектом, для совершения нежелательных роботизированных звонков, чтобы вымогать деньги у людей, подражать знаменитостям и дезинформировать избирателей. Теперь у генеральных прокуроров штатов будут новые инструменты для борьбы с этим мошенничеством и обеспечения защиты общественности от мошенничества и дезинформации», — заявила председатель FCC Джессика Розенворсель (Jessica Rosenworcel).

Прокуроры штатов и прежде могли наказывать мошенников, использующих роботизированные звонки для обмана граждан. Теперь же они смогут привлекать их к ответственности только лишь на основании использования голоса, клонированного с помощью ИИ.

Google открыла свою мощнейшую нейросеть широкой публике за $20 в месяц, а Bard переименовала в Gemini

Как и ожидалось, компания Google объявила о ребрендинге своего ИИ-бота Bard, который теперь официально называется Gemini. Вместе с этим пользователи могут задействовать новое Android-приложение Gemini, открывающее доступ к ИИ-боту, а функции Duet AI в Google Workspace объединяются вокруг единого бренда, символизирующего ИИ-инструменты от Google.

 Источник изображений: Google

Источник изображений: Google

Вероятно, мобильное приложение Gemini станет наиболее доступным вариантом для ознакомления с возможностями ИИ-бота Google. После установки на устройство с Android ИИ-бот Gemini, помимо прочего, может заменить собой голосового ассистента Google Assistant. «Я думаю, что это важный шаг на пути к созданию настоящего ИИ-помощника», — заявила Сисси Сяо (Sissie Hsiao), глава подразделения по разработке Bard (теперь Gemini). Она также добавила, что голосовой помощник компании стал «более полезным, чем когда-либо».

Приложения Gemini для iOS не существует, вероятно, из-за того, что пользователи iPhone всё равно не могли бы задействовать бота Google в качестве помощника по умолчанию. Однако владельцы устройств Apple могут получить доступ ко всем ИИ-функциям в приложении Google.

Остальные изменения в основном касаются брендинга. Google отказывается от имени Bard, но чат-бот компании при этом никуда не денется и будет развиваться в будущем. Это касается и всех ИИ-функций Google Workspace, которые прежде назывались Duet AI, но теперь объединились под брендом Gemini. Пользователи по-прежнему могут задействовать их для составления электронных писем, таблиц и выполнения других рабочих задач.

В основе бесплатной общедоступной версии ИИ-бота лежит большая языковая модель Gemini Pro. Чтобы получить доступ к самой мощной языковой модели Google Gemini Ultra, придётся оформить подписку Gemini Advanced, которая входит в пакет Google One AI Premium стоимостью $20 в месяц. Подписка также включает в себя 2 Тбайт облачного хранилища и другие возможности Google One.

Стремление Google активно продвигать Gemini вполне объяснимо, поскольку компания пытается конкурировать на рынке искусственного интеллекта с другими крупными игроками, такими как OpenAI, Anthropic, Perplexity и др. Google ещё предстоит доказать свою способность идти в ногу с отраслью, поскольку компания стремится одновременно создать привлекательный потребительский продукт и пытается убедить разработчиков использовать Gemini, а не ChatGPT.

Apple представила ИИ для редактирования фото по текстовым командам

Научное подразделение Apple совместно с исследователями Калифорнийского университета в Санта-Барбаре выпустило мультимодальную модель искусственного интеллекта MGIE, предназначенную для редактирования изображений. Чтобы внести изменения в снимок, пользователю достаточно естественным языком описать, что он хочет получить на выходе.

 Источник изображений: Apple

Источник изображений: Apple

MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для задач различной сложности, связанных с редактированием изображений: можно добавлять различные объекты, убирать или изменять их. При получении команды модель интерпретирует слова пользователя, а затем «представляет себе», как будет выглядеть изменённая в соответствии с ними картинка.

В описывающей MGIE статье приводятся несколько примеров её работы. Когда модели дали на редактирование фото пиццы и предложили «сделать её более здоровой», та добавила овощную начинку. Далее ей предложили излишне тёмный снимок гепарда в пустыне и предложили «добавить контраста, имитируя больше света» — изображение стало ярче. MGIE доступна для бесплатного скачивания на GitHub, а опробовать её в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы планы компании в отношении модели вне исследовательского проекта.

Редактирование изображений поддерживается некоторыми ИИ-генераторами, включая OpenAI DALL-E 3; функции генеративного ИИ присутствуют и в Photoshop благодаря модели Adobe Firefly. Apple не позиционирует себя как крупного игрока в области ИИ в отличие от Microsoft, Meta или Google, но недавно гендиректор компании Тим Кук заявил, что в этом году производитель добавит на свои устройства новые функции ИИ. В минувшем декабре компания выпустила открытую платформу MLX для обучения ИИ-моделей на чипах Apple Silicon.

Год назад Microsoft встроила ИИ в Bing, но это не помогло победить Google — теперь силы брошены на Copilot

Год назад Microsoft внедрила ИИ-чат-бот ChatGPT в свою поисковую систему Bing. Этот шаг вывел ИИ на новый уровень и должен был резко увеличить популярность Bing. Но год спустя доля Google на мировом поисковом рынке по-прежнему составляет более 91 %, а Bing вырос менее чем на процент. В то же время количество пользователей ChatGPT возросло до 100 миллионов в неделю. Поэтому Microsoft пересмотрела стратегию и направила свои усилия на развитие ИИ-помощника Copilot.

 Источник изображений: Microsoft

Источник изображений: Microsoft

Microsoft не считает провалом малый рост рыночной доли Bing. «Мы наблюдаем рост доли [Bing], — заявил директор по потребительскому маркетингу Microsoft Юсуф Мехди (Yusuf Mehdi). — Даже несколько пунктов роста акций имеют большое значение для Microsoft и для клиентов, поскольку они создают большую конкуренцию». В соответствии со своей новой стратегией, Microsoft постепенно отходит от возобновившейся было поисковой борьбы с Google и сосредоточивается на продвижении Copilot как отдельного продукта.

Copilot позиционируется как будущее усилий Microsoft в области ИИ, которые больше ориентированы на производительность и творчество, чем просто на поиск. За последний год компания внедрила функции ИИ практически везде, вплоть до интеграции новой клавиши Copilot на клавиатуры для ноутбуков и компьютеров с Windows, которая позволит пользователям буквально одним нажатием начинать взаимодействие с ИИ-помощником. «Мы действительно поддерживали единый бренд под названием Copilot, поэтому мы убрали все остальные вещи, — говорит Мехди. — Итак, у нас один бренд, один опыт».

В новом рекламном ролике Microsoft Copilot, приуроченному к Суперкубку по американскому футболу, де-факто национальному празднику в США, нет ПК с Windows, электронных таблиц или консолей Xbox — только один смартфон и стремление побудить людей загрузить приложение Copilot на iOS и Android. Человек, никогда прежде не слышавший о Copilot, до самого конца даже не догадается, что это реклама Microsoft.

«Это довольно большое событие для компании, которая исторически была серьёзно нацелена на ПК», — считает Мехди. Microsoft планомерно запускает новые функции Copilot, которые улучшают общий пользовательский опыт и возможности создания изображений с помощью своего ИИ-помощника. Рекламный ролик, в котором основное внимание уделяется идее использования ИИ для творчества, проводит тонкую грань между расширением творческих возможностей и навыков людей, и опасениями по поводу замены человека искусственным интеллектом.

Microsoft существенно улучшила возможности по созданию и обработке изображений с помощью ИИ. «Вы увидите новый внешний вид. Мы сделали много очень тонких вещей для пользовательского опыта, таких как обработка цвета, — говорит Мехди. — Создание имиджа — одна из вещей, которая действительно находит отклик. Я думаю, что это первый шаг к тому, чтобы люди почувствовали, что они снова могут быть творцами».

Создание изображений при помощи Copilot стало чрезвычайно популярным благодаря доступности и бесплатности. К сожалению, это открыло возможности для злоупотреблений этими инструментами, в частности для создания фейковых откровенных изображений знаменитостей. В настоящий момент Microsoft сообщила, что «продолжает исследовать эти изображения и усилила существующие системы безопасности, чтобы ещё больше предотвратить неправомерное использование наших сервисов для создания подобных изображений».

Помимо создания изображений многие пользователи Copilot используют его для программирования, написания кода, проведения исследований и анализа, но поисковые запросы всё же преобладают. «Из пяти миллиардов чатов, о которых мы говорили, я бы сказал, что преобладающее количество чатов — это, по сути, поисковые запросы, примерно 70 процентов», — говорит Мехди.

Очевидно, что отказ от поиска как основной точки входа в ИИ для Microsoft также влияет на то, как Copilot отображается в различных продуктах и услугах. Это был довольно запутанный год для бренда Copilot, который начинался внутри GitHub, затем появился в некоторых программных продуктах, а потом получил большой импульс развития в качестве Microsoft 365 Copilot в приложениях Office. В конечном итоге его переименовали в Copilot для Microsoft 365, при этом казалось, что каждый отдел Microsoft был занят запуском отдельных Copilot без единого и чёткого плана.

Теперь ситуация меняется. «Мы хотим добиться, чтобы у каждого человека был лишь один Copilot, — говорит Мехди. — и можно будет добавлять возможности, просто выбирая тарифный план подписки». Так что в будущем любой тарифный план, например, Copilot Pro или Copilot для Microsoft 365, будет просто дополнением к основному Copilot. Мехди заверил, что со временем Microsoft продолжит добавлять новые возможности, вплоть до создания пользователем собственных вариантов Copilot.

Microsoft также работает над большим обновлением Windows, ориентированным на ИИ. «Уникальная особенность Copilot внутри Windows заключается в том, что он знает, в каком контексте вы находитесь, — говорит Мехди. — Он может понимать ситуацию и выполнять более сложные задачи». Microsoft также рассматривает возможность запуска передовых моделей ИИ локально на ПК с использованием специализированных нейронных процессоров (NPU).

Microsoft также предполагает использовать ИИ для упрощения коммуникаций пользователя с ПК и периферийным оборудованием. «Я думаю, что около 20 процентов пользователей [Windows] используют 10 процентов функций. Как только вы сможете сказать: ‘Эй, переключи мой компьютер в тёмный режим, настрой для меня этот принтер, помоги мне сделать следующее’, мы сможем превратить каждого в опытного пользователя Windows, — говорит Мехди. — Это звучит банально, но я думаю, что то, что откроет перед людьми способность использовать компьютеры для выполнения удивительных вещей, будет весьма востребовано».

OpenAI будет незаметно маркировать творчество ИИ-художника DALL-E 3

Генератор изображений OpenAI DALL-E 3 будет помечать созданные им картинки метаданными в соответствии со стандартами организации C2PA (Coalition for Content Provenance and Authenticity — «Коалиции по происхождению и аутентичности контента»). Такая маркировка позволит легко узнать, что изображение создано ИИ, а не человеком.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

При помощи метаданных будут маркироваться изображения, созданные искусственным интеллектом на сайте ChatGPT и при подключении к API для модели DALL-E 3, сообщила OpenAI. При выводе таких изображений на поддерживающих технологию Content Credentials ресурсах будет отображаться изображение с символами «CR» в левом верхнем углу каждой картинки. Это позволит установить происхождение файла, но пока маркировку получат только картинки, а не видеозаписи или текст. Добавление метаданных лишь незначительно повлияет на скорость работы системы и никак не скажется на качестве картинки, подчеркнули в OpenAI.

 Источник изображения: openai.com

Источник изображения: openai.com

Организация C2PA, в которую входят крупные технологические компании масштаба Adobe и Microsoft, продвигает собственный стандарт Content Credentials — это решение позволяет определять происхождение контента. Ранее о намерении помечать на своих платформах созданные ИИ материалы сообщила компания Meta.

Американские разработчики технологий ИИ взяли на себя обязательства обеспечивать средства идентификации генерируемого ИИ контента. Метаданные, однако, трудно назвать надёжным способом защиты — их легко удалить, случайно или намеренно. Так, они часто в принудительном порядке удаляются при загрузке в соцсети. Метаданные также не сохраняются при снятии снимков экрана.


window-new
Soft
Hard
Тренды 🔥
Мошенники начали заменять контакты на смартфонах жертв при помощи файлов VCF 5 ч.
Сэм Альтман рассказал о перспективах OpenAI, ИИ и других технологий 7 ч.
Meta проведёт масштабные изменения в структуре ИИ-подразделений — в четвёртый раз за полгода 9 ч.
GPT-5 пока не смогла порадовать потребителей, зато корпоративные клиенты пришли в восторг 11 ч.
В рамках вторичного размещения персонал OpenAI продаст акций на сумму $6 млрд 17 ч.
Волна интереса к ИИ порождает новых миллиардеров с рекордной скоростью 20 ч.
Почти 30 тыс. серверов Microsoft Exchange Server оказались уязвимыми из-за нерасторопности администраторов 23 ч.
OpenAI заработала $2 млрд на мобильном приложении ChatGPT — в 30 раз больше всех конкурентом вместе 23 ч.
Google Gemini внезапно заработал в России без ограничений и ухищрений 23 ч.
Новая статья: Titan Quest II — квесты есть, титаны будут позже. Предварительный обзор 24 ч.
Новые китайские аккумуляторы вдвое обошли ячейки Tesla 4680 по ёмкости — им прямая дорога в небо 2 ч.
Китайская ракета-носитель на метановом топливе, созданная LandSpace, разрушилась при лётном испытании 5 ч.
В Пекине стартовали первые в мире Всемирные игры человекоподобных роботов 7 ч.
Автономность планшетов Surface Pro 11 снизилась вдвое — Microsoft изучает проблему 8 ч.
Asus выпустила белые версии GeForce RTX 5060 и Radeon RX 9060 XT в исполнении Dual 8 ч.
В преддверии десятого испытательного полёта Starship компания SpaceX раскрыла причины двух прошлых неудач 9 ч.
Inspur представила суперускоритель Metabrain SD200 для ИИ-моделей с триллионами параметров 9 ч.
Представлена первая в мире контактная OLED-линза для самостоятельной диагностики сетчатки глаза 9 ч.
Dell представила ИИ-серверы PowerEdge R7725 и R770 на базе NVIDIA RTX Pro 6000 Blackwell Server Edition 10 ч.
Lamborghini выпустит самый быстрый в истории подключаемый гиперкар Fenomeno по цене $3,5 млн 12 ч.