Сегодня 25 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Google открыла всем американским пользователям доступ к генератору изображений Imagen 3

Google без громких анонсов открыла всем пользователям из США доступ к последней модели генератора изображений с искусственным интеллектом Imagen 3 на платформе ImageFX. Компания также опубликовала исследовательскую работу, в которой подробно описывается эта технология.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

Модель Imagen 3 была анонсирована в мае на конференции Google I/O и выпущена в ограниченный доступ для пользователей платформы Vertex AI. «Представляем Imagen 3 — модель скрытой диффузии, которая генерирует высококачественные изображения по текстовым запросам. На момент проведения оценки Imagen 3 является более предпочтительной, чем другие современные модели», — говорится в научной работе.

Выпуск Google нового генератора изображений для широкой общественности в США — важный стратегический шаг для компании, вступившей в гонку технологий ИИ. С одной стороны, разработчику удалось повысить качестве её работы, с другой — модель подвергается критике за излишне строгие фильтры контента. Пользователи Reddit, в частности, сообщают, что генератор изображений отклоняет до половины запросов, даже если не предлагать ему «нарисовать» нечто сомнительное — дошло до того, что он отказался создать изображение киборга.

Это резко контрастирует с подходом стартапа Илона Маска (Elon Musk) xAI, который на этой неделе выпустил модель Grok-2. Она генерирует изображения практически без ограничений, допуская создание картинок с общественными деятелями и деталями, которые на других платформах считаются недопустимыми. Это тоже вызвало недоумение общественности и породило предположения, что на xAI будет оказываться давление. Перед отраслью ИИ встаёт вопрос о балансе между творчеством и ответственностью, а также возможном влиянии генераторов изображений на публичный дискурс и достоверность информации.

Pixel 9 для Google станет каналом для продаж ИИ-продуктов, а не просто очередным смартфоном

На этой неделе Google представила смартфоны серии Pixel 9, но настоящей целью этого проекта является не укрепление позиций компании как производителя потребительской электроники, а расширение продаж продуктов на основе искусственного интеллекта, пишет Wall Street Journal.

 Источник изображений: store.google.com

Источник изображений: store.google.com

Телефоны Google Pixel разрабатываются внутри компании и получают высокие оценки от авторов обзоров, но они генерируют незначительный доход для компании. В минувшем году и первой половине этого данные устройства заняли менее 1 % мирового рынка смартфонов, подсчитали аналитики Counterpoint Research. Но они открывают Google возможность углубиться в область генеративного ИИ. Поэтому на презентации компания больше рассказывала о программной части Google Pixel, чем о самих телефонах.

Некоторые из их функций не будут ограничиваться только семейством Pixel, ведь Google стремится распространить свои инструменты ИИ на устройства других производителей, работающие под управлением Android. В ближайшее время в широкий доступ выйдет чат-бот с ИИ Gemini Live, который появится на всех совместимых телефонах англоязычных пользователей, а после он дебютирует и на iOS. Но Gemini Live и некоторые другие функции с ИИ доступны только подписчикам плана Gemini Advanced — он обойдётся в $20 в месяц, хотя и предлагается на год бесплатно для владельцев старших телефонов Pixel 9 Pro, XL и Fold.

В этом, видимо, и состоит бизнес-модель Google: потребители уже привыкли, что голосовой помощник компании бесплатен. Компания уже не впервые начинает предлагать премиум-подписку на то, что первоначально было бесплатным — например, на YouTube без рекламы. Только премиальная подписка на YouTube в минувшем года принесла компании $11,9 млрд или на 20 % больше, чем доход от продажи всех устройств. И среднегодовой рост сегмента YouTube Premium за последние четыре года составил 52 % против 16 % у направления по продаже устройств.

Монетизация ИИ для мобильных устройств — задача непростая. Сначала Google пришлось сражаться за место под солнцем с альянсом Microsoft и OpenAI, а теперь на рынок готовится выйти очередной крупный игрок в лице Apple Intelligence. Таким образом, хотя Google и остаётся скромным игроком в области устройств, но её основные продукты, такие как поиск, Gmail и Android, в реальности оказываются крупнейшей в мире сетью распространения новых технологий, в том числе генеративного ИИ. Поэтому компания и анонсировала новые телефоны Pixel на этой неделе — за месяц до презентации новых iPhone. И поэтому Google несколько раз подчеркнула, что её продукты с ИИ уже готовы к выходу на рынок — тогда как пакет Apple Intelligence будет развёртываться постепенно.

Новая статья: Фотомаска, я вас знаю!

Данные берутся из публикации Фотомаска, я вас знаю!

ИИ-ответы в поисковой выдаче Google обрушили посещаемость множества сайтов

Удобные «Обзоры ИИ» (AI Overviews), которые Google теперь размещает в верхней части результатов поиска, лишают трафика сайты, на которые пользователи могли бы перейти из поисковой системы. Попытки владельцев интернет-ресурсов блокировать ИИ Google приводят к пропаданию сайта из результатов поиска и ещё более резкому снижению посещаемости, так как генератор ИИ-ответов и поисковый бот Google объединены в единую систему, и раздельно контролировать доступ для них невозможно.

 Источник изображений: unsplash.com

Источник изображений: unsplash.com

Доминирование Google в поиске, которое федеральный суд на прошлой неделе определил как «незаконную монополию», даёт компании решающее преимущество — издателям приходится выбирать между предоставлением своего контента для использования моделями ИИ и исчезновением из поиска Google, являющегося главным источником трафика. Многие из них не готовы идти на подобный риск.

Google утверждает, что AI Overviews — сводки, отображаемые в верхней части поисковой выдачи, — являются результатом её давней приверженности предоставлению более качественной информации и расширению возможностей для издателей.

«Каждый день Google отправляет миллиарды пользователей на сайты по всему интернету, и мы намерены продолжать этот давно устоявшийся обмен ценностями, — заявил представитель Google. — Благодаря обзорам ИИ люди находят “Поиск Google” более полезным и возвращаются, чтобы искать больше, создавая новые возможности для обнаружения контента».

Google использует отдельных краулеров для некоторых продуктов, таких как чат-бот Gemini. Но Googlebot, основной краулер компании, обслуживает как AI Overviews, так и «Поиск Google», так как, по словам представителя компании, «они тесно переплетены». Google сообщила, что издатели могут блокировать появление определённых страниц или их фрагментов в AI Overviews, но это также, вероятно, запретит их появление во всех других функциях поиска Google.

Генеральный директор iFixit Кайл Винс (Kyle Wiens) сообщил, что отношения сайта iFixit с Google «гораздо более слабые», чем с другими компаниями, занимающимися ИИ. «Я могу запретить ClaudeBot индексировать нас, не навредив нашему бизнесу, — заявил он, имея в виду стартап Anthropic, занимающийся генеративным ИИ. — Но, если я заблокирую Googlebot, мы потеряем трафик и клиентов».

«Это выглядит как экзистенциальный кризис [для владельцев интернет-ресурсов], — говорит издатель новостного сайта Talking Points Memo Джо Рагаццо (Joe Ragazzo). — Есть два плохих варианта. Вы уходите и немедленно умираете, или вы сотрудничаете с ними и, вероятно, просто медленно умираете, потому что в конечном итоге они тоже не будут нуждаться в вас».

Рост генеративного ИИ породил волну стартапов, предлагающих поисковые продукты на основе ИИ. Растущая популярность чат-ботов может стать серьёзной угрозой для поискового бизнеса Google. Но, чтобы составить конкуренцию поисковому гиганту, требуется максимально полное сканирование и индексирование интернет-ресурсов, что представляет собой непростую задачу. Для этого требуются деньги, вычислительные мощности и ёмкие хранилища информации.

Многие издатели, борясь с нелицензированным использованием контента для индексирования, ограничивают сканирование своих ресурсов для сторонних компаний, предоставляя наибольшую свободу действий лишь крупным поисковым системам, таким как Google или Bing, которые служат для них источниками трафика.

Поисковые стартапы не могут обеспечить трафик, сопоставимый с ведущими игроками в сфере интернет-поиска, поэтому они вынуждены платить издателям за лицензирование контента. На фоне волны сделок между медиакомпаниями и стартапами в области ИИ отказ Google от попыток лицензирования контента особенно заметен, а у издателей практически отсутствуют рычаги влияния на компанию. Если не считать единственной сделки на $60 млн с Reddit, которая привела к скачкообразному росту трафика на сайт социальной сети, Google дала понять издателям, что не заинтересована в подобных переговорах.

По свидетельствам осведомлённых источников, попытки поискового стартапа Perplexity заключить с Reddit подобную сделку не увенчались успехом из-за слишком высокой планки, установленной Google. Другие поисковые стартапы также не имеют возможности получить доступ к контенту ресурсов, подобных Reddit. «Нам понадобится 20 лет наших текущих доходов только для того, чтобы заплатить Reddit, — сказал Владимир Преловац, основатель поискового стартапа Kagi. — Я даже не рассматриваю такую ​​возможность».

Трудности с индексированием контента испытывают не только небольшие стартапы. Крупные популярные сайты, включая Amazon, Goodreads и Uniqlo, заблокировали поисковый робот SearchGPT от OpenAI, что потенциально создаёт проблемы для амбиций компании в интернет-поиске. OpenAI настаивает, что сайты могут появляться в результатах поиска, даже если запретят индексирование. Дело в том, что файлы robots.txt, которые устанавливают правила сканирования, не были признаны юридически значимыми, поэтому публичные данные можно индексировать, если не требуется вход в систему или ввод учётных данных.

После знаменательного судебного решения, установившего, что Google монополизировала рынок онлайн-поиска, Министерство юстиции США рассматривает разные варианты правовой защиты, от предоставления конкурентам доступа к поисковому индексу Google до разделения компании. Закон ЕC «О цифровых рынках» уже требует от Google делиться некоторыми данными поисковых запросов.

Винс считает, что «отделение поиска Google от их работы в области ИИ позволит устранить конфликты». Вице-президент по связям с общественностью поисковой системы DuckDuckGo Камил Базбаз (Kamyl Bazbaz) отметил важность поисковых индексов в эпоху ИИ, он уверен, что «технологические сдвиги, происходящие в поиске, делают индекс Google, связанный с антимонопольными проблемами, ещё более проблематичным».

Независимо от исхода антимонопольного дела против Google, изменения, происходящие в поисковой среде, лишний раз доказывают, что издателям нельзя становиться чрезмерно зависимыми от какой-либо одной технологической платформы, включая Google. «Мы убеждены, что вам нужно формировать настоящие отношения с читателями, — считает Рагаццо, — и именно так вы создаёте издание, которое может выдержать разные эпохи».

Google добавила в поисковую выдачу сгенерированные ИИ ответы в шести новых странах

Google объявила, что функция генерации сводок на запросы пользователей в поисковике компании теперь доступна за пределами США. Это произошло через два месяца после того, как поисковый гигант был вынужден ограничить доступность упомянутой функции из-за проблем с генерацией корректных сводок, которые наблюдались на момент первоначального запуска.

 Источник изображения: Jonny Gios / unsplash.com

Источник изображения: Jonny Gios / unsplash.com

В мае Google сделала доступными сгенерированные искусственным интеллектом сводки, которые выводились в поисковике перед обычными ссылками, всем пользователям в США. До этого почти год компания тестировала этот инструмент с привлечением ограниченного числа пользователей. Однако вскоре после запуска нововведение подверглось критике, а в интернете появилось немало скриншотов, демонстрирующих неточности в генерируемых сводках. К примеру, по запросу рецепта пиццы поисковик рекомендовал добавить клей, чтобы удержать сыр.

Google признала наличие проблемы и анонсировала обновление, которое должно было исправить ситуацию с неточными сводками. В итоге вместе с обновлением были введены определённые ограничения, благодаря чему генерируемые ИИ сводки стали появляться в ответ только на определённые пользовательские запросы. В дополнение к этому Google запретила своей нейросети генерировать сводки на основе пользовательского контента из соцсетей, таких как Reddit.

«У меня достаточно доказательств, чтобы сказать, что качество только улучшается», — заявила в беседе с журналистами Хема Будараджу (Hema Budaraju), директор по продуктам Google. Она добавила, что собираемые Google данные об использовании сгенерированных ИИ сводок указывают на то, что пользователи отмечают более высокий уровень удовлетворённости качеством работы функции.

На этом фоне Google решила открыть доступ к сводкам в поисковике для более широкого круга пользователей. Теперь увидеть их можно не только в США, но и в Бразилии, Индии, Индонезии, Японии, Мексике и Великобритании. Причём реализована поддержка не только английского, но и нескольких других языков, включая хинди и португальский.

Lenovo увеличила выручку по итогам квартала на 20 % благодаря ИИ и восстановлению рынка ПК

Последовавшие за активной фазой пандемии два года не характеризовались высоким спросом на новые ПК, поэтому для Lenovo сохранение положительной динамики выручки по итогам уже третьего квартала подряд определённо служит хорошим знаком. Выручка компании в прошлом квартале выросла на 20 % до $15,4 млрд и превзошла ожидания аналитиков сразу на $1,3 млрд.

 Источник изображения: Lenovo

Источник изображения: Lenovo

Генеральный директор Lenovo Ян Юаньцин (Yang Yuanqing) связал хорошее начало фискального года с чёткой рыночной стратегией и последовательной её реализацией, хорошей операционной дисциплиной компании и постоянными инновациями, а также преимуществами компании с точки зрения глобализации. Недавно в календаре Lenovo завершился первый квартал фискального года, во всех сферах деятельности компания завершила его с прибылью. Чистая прибыль выросла в годовом сравнении на 65 % до $315 млн.

Направление «умных» устройств продемонстрировало двухзначный рост выручки Lenovo до $11,4 млрд. В сегменте ПК доля компании на мировом рынке достигла 23 % и позволяет ей считаться крупнейшим производителем в мире. В сегменте смартфонов и планшетов выручка Lenovo в годовом сравнении выросла на 30 % в обоих случаях. Особое внимание уделяется выпуску новых моделей ПК с функцией локального ускорения операций, связанных с работой систем искусственного интеллекта. В сентябре и октябре ожидается анонс дополнительных моделей ПК с такими возможностями. По прогнозам руководства Lenovo, к 2027 году такие ПК будут формировать более 50 % первичного рынка. В Китае соответствующие модели ПК уже пользуются высокой популярностью, поскольку Lenovo локализует их с учётом требований местного рынка.

Intel и Softbank обсуждали проект ИИ-ускорителя для конкуренции с Nvidia, но так и не договорились

Как выясняется, среди вероятных партнёров Intel то и дело находились инициативные компании, готовые поручить ей выпуск передовых ускорителей для систем искусственного интеллекта. Помимо упущенной возможности сотрудничать с OpenAI в этой сфере, Intel также не стала сближаться с японской корпорацией SoftBank, которой принадлежит британский разработчик процессорных архитектур Arm.

 Источник изображения: Intel

Источник изображения: Intel

Издание Financial Times выяснило, что в течение нескольких предыдущих месяцев SoftBank пыталась договориться с Intel о выпуске специализированных ИИ-чипов, разработанных выходцами из купленной ею компании Graphcore. В данной ситуации Intel должна была выступать в роли контрактного производителя чипов. После того, как переговоры с Intel привели к неудовлетворительному результату, SoftBank решила сосредоточиться на переговорах с TSMC.

Если бы сотрудничество с Intel состоялось, как продолжают источники, SoftBank смогла бы претендовать на часть американских субсидий по так называемому «Закону о чипах», поскольку выпуск соответствующих компонентов для её нужд осуществлялся бы на территории США. Как утверждает источник, переговоры SoftBank с Intel развалились по вине последней из сторон. По крайней мере, на этом настаивает первая из них. Заказчика не устраивали возможности Intel в части скорости выпуска чипов и объёма их производства. Тем не менее, учитывая высокую загруженность TSMC подобными заказами, Intel с точки зрения SoftBank всё ещё не списывается со счетов.

Руководство SoftBank рассчитывало привлечь к финансированию данной инициативы потенциальных покупателей подобных ускорителей, созданных с использованием разработок Graphcore. Выход SoftBank в этот сегмент рынка мог бы навредить отношениям Arm и Nvidia, поскольку последняя является крупным клиентом этого британского холдинга. Впрочем, сейчас рынок компонентов для ИИ является лакомым кусочком для многих компаний, и потенциальная выгода могла бы компенсировать подобный риск. SoftBank не теряет надежды создать прототипы собственного ускорителя в ближайшие месяцы, но рассчитывать на возможности TSMC в этой сфере затруднительно из-за высокой нагрузки на эту тайваньскую компанию. Intel была бы полезна SoftBank в этом случае и своими компетенциями в разработке чипов, а не только как контрактный производитель. Проект, финансирование которого потребовало бы многих десятков миллиардов долларов США, планировалось реализовать с участием арабских инвесторов. Недавно стало известно, что Intel избавилась от купленных в прошлом году акций Arm, чтобы максимально мобилизовать собственные финансовые ресурсы.

Opera выпустила для iOS браузер Opera One с голосовым ИИ-помощником Aria

Компания Opera выпустила iOS-версию браузера Opera One со встроенным помощником Aria на базе искусственного интеллекта. Мобильное приложение повторяет минималистичный дизайн десктопной версии веб-обозревателя и позволяет скрывать ненужные элементы, обеспечивая комфортный просмотр веб-страниц.

 Источник изображения: Opera

Источник изображения: Opera

Строка поиска для удобства расположена в нижней части интерфейса и предоставляет быстрые подсказки при вводе запроса. В поиск также интегрирован ИИ-ассистент Aria. Кроме того, как сообщает MacRumors, новая функция Swipe to search позволяет активировать строку поиска простым свайпом вниз, аналогично поиску приложений через Spotlight на домашнем экране iPhone. Несмотря на то, что панель поиска по умолчанию располагается внизу, пользователи могут выбрать стандартную навигацию.

Встроенный ИИ-помощник Aria способен выполнять широкий спектр задач — от поиска в интернете до генерации текста и изображений. С помощью функции голосового ввода можно задавать вопросы устно, не прибегая к вводу текста с клавиатуры, а с помощью ИИ-генератора Imagen2 от Google создавать визуальный контент путём ввода текстовых запросов.

Кроме того, в Opera One на стартовом экране появилась новая карусель, которая предназначена для информирования пользователей. В неё интегрированы новости, спортивные результаты и советы по продуктам Opera. В браузер также встроен блокировщик рекламы. Предусмотрена возможность настройки тем оформления.

Скачать Opera One для iOS можно в магазине приложений App Store.

Стартап xAI Илона Маска запустил новый чат-бот Grok-2, который вошёл в пятёрку лучших

Принадлежащая Илону Маску (Elon Musk) компания xAI выпустила бета-версии нейросетей Grok-2 и Grok-2 mini. Новый алгоритм Grok-2 уже используется для генерации изображений по текстовому описанию в социальной сети X, но на данном этапе испытать его в деле могут только платные подписчики на тарифах Premium и Premium+.

 Источник изображений: xAI

Источник изображений: xAI

«Мы рады сообщить о запуске ранней предварительной версии Grok-2, которая является значительным шагом вперёд по сравнению с предыдущей версией Grok-1.5 и обеспечивает передовые возможности в общении, кодировании и рассуждениях. В это же время мы представляем Grok-2 mini, небольшую, но способную версию Grok-2», — говорится в сообщении xAI.

В сообщении также сказано, что ранняя версия Grok-2 была протестирована в бенчмарках LMSYS. В скором времени оба алгоритма станут доступны разработчикам через корпоративный API компании.

Первые изображения, которые пользователи X создали с помощью нового алгоритма, показывают, что, по всей видимости, Grok-2 не имеет ограничений, в том числе при создании картинок с политиками. Однако на фоне предстоящих выборов в США xAI, скорее всего, столкнётся с давлением со стороны властей, и компании придётся ограничить возможности Grok-2 в плане генерации изображений.

Текст под опубликованными изображениями указывает на то, что Grok-2 использует алгоритм FLUX.1 компании Black Forest Labs при генерации картинок. На данный момент имеется не так много информации о реальных возможностях нейросети. По словам разработчиков, Grok-2 лучше справляется с генерацией программного кода, созданием текстов и обобщением новостей, хотя подтверждающих это фактов пока нет. В дальнейшем разработчики планируют развернуть в соцсети X функции на основе Grok-2 и Grok-2 mini. Речь идёт об улучшении инструментов поиска, аналитики публикаций и др.

Художники одержали важную победу в деле об авторских правах против Stability AI и Midjourney

Группа художников, которая объединилась в коллективном иске против разработчиков наиболее популярных моделей искусственного интеллекта для генерации изображений, устроила празднование по случаю того, что судья дал ход этому делу и санкционировал раскрытие информации.

 Источник изображения: Alexandra_Koch / pixabay.com

Источник изображения: Alexandra_Koch / pixabay.com

Ответчиками по делу выступают создатели сервисов Midjourney, Runway, Stability AI и DeviantArt — по версии истцов, разработчики систем на основе модели Stable Diffusion использовали их защищённые авторским правом работы для обучения ИИ. Судья Северного окружного суда Калифорнии Уильям Оррик (William H. Orrick), курирующий Сан-Франциско, где располагаются многие крупнейшие разработчики систем ИИ, пока не вынес окончательного решения по делу, но счёл, что предъявленных ответчикам обвинений достаточно, чтобы дело перешло к стадии раскрытия информации. Это значит, что представляющие истцов юристы могут изучить документы компаний — разработчиков генераторов изображений с ИИ; огласке будут преданы подробности о массивах обучающих данных, механизмах и внутренней работе систем.

Модель Stable Diffusion предположительно обучалась на наборе данных LAION-5B из 5 млрд изображений, который был опубликован в 2022 году. Но, как отмечается в деле, эта база содержала только URL-адреса, то есть ссылки на изображения, а также их текстовые описания, то есть компаниям приходилось самостоятельно собирать эти изображения.

Основанные на Stable Diffusion модели используют в работе механизм «CLIP-guided diffusion», помогающий им при генерации изображений отталкиваться от пользовательских запросов, которые могут включать имена художников. Метод CLIP (Contrastive Language-Image Pre-training) разработала и ещё в 2021 году опубликовала компания OpenAI — более чем за год до выпуска ChatGPT. Модель OpenAI CLIP способна работать как база данных по фирменному стилю, и если при обучении схожей с ней модели Midjourney использовались имена художников и их работы с сопоставленными с ними описаниями, то этот факт может представлять собой нарушение авторских прав.

Стандартный Google Assistant в новых смартфонах Google Pixel 9 заменён на ИИ-чат-бот Gemini

Новая линейка Google Pixel 9 отличается от других Android-смартфонов компании одной большой деталью: в качестве стандартного цифрового помощника в этих устройствах используется новый ИИ-чат-бот Gemini, а не привычный Google Assistant.

 Источник изображения: Google

Источник изображения: Google

«В мобильном сегменте Gemini является эволюцией Google Assistant. Пользователи по-прежнему могут использовать классический Google Assistant, но Gemini — новый Assistant», — сказала в интервью Engadget вице-президент и генеральный менеджер Gemini Experiences компании Google Сисси Сяо (Sissie Hsiao).

По словам Сяо, Gemini способен выполнять все задачи, которые может делать классический Google Assistant, и даже больше. Он может выключать свет в доме, оснащённом умными устройствами, включать музыку или отвечать на более сложные вопросы, например, о погоде и её разнице между тем или иным городом.

«Он эффективнее даже в тех вещах, которые люди привыкли выполнять с помощью Assistant. Это действительно значительная эволюция в генеративном ИИ. Он может создавать изображения и текст, но также выполнять простые задачи более эффективным и более естественным образом», — заявила Сяо.

Следует прояснить, что Gemini можно использовать в качестве цифрового помощника на большинстве современных Android-смартфонов, будь то модели Pixel или любые другие модели от других производителей, но в качестве возможной опции, а не в качестве стандартного приложения. Для этого необходимо запустить Google Assistant, а затем согласиться на его замену на Gemini.

Ранее Google воздерживалась от ответа на вопрос, заменит ли новый Gemini старый Google Assistant в будущем. «Суть в том, что Gemini — это опциональная возможность на смартфоне. Я думаю, что со временем Gemini будет развиваться и становиться всё более продвинутым. Сегодня нам нечего анонсировать, но у потребителей есть выбор. Теперь они могут сделать выбор в пользу нового помощника на базе искусственного интеллекта. Они могут попробовать его в работе, и мы видим, что люди это делают. Мы получаем много хороших отзывов», — сказал Самир Самат (Sameer Samat), президент экосистемы Android в Google в интервью Wired в мае.

OpenAI развернула свежую версию модели GPT-4o в ChatGPT, но её отличия разработчики скрывают

OpenAI без громких анонсов обновила большую языковую модель GPT-4o, которая лежит в основе сервиса ChatGPT. Компания не перечислила, чем она отличается от предыдущих, но обмолвилась, что она научилась давать ещё более качественные ответы.

 Источник изображения: Levart_Photographer / unsplash.com

Источник изображения: Levart_Photographer / unsplash.com

«С прошлой недели в ChatGPT появилась новая модель GPT-4o. Надеемся, она вам уже пришлась по душе — попробуйте, если ещё не сделали этого. Думаем, вам понравится!»сообщил официальный аккаунт ChatGPT в соцсети X. «Мы развернули обновление GPT-4o, которое, как мы обнаружили по результатам экспериментов и отзывам, предпочитают пользователи ChatGPT. Это не новая модель передового класса. Хотя мы и хотели бы рассказать вам, чем именно отличаются ответы модели, изучение того, как детально сопоставлять и рассказывать об улучшениях модели, остаётся в области исследований (над которой мы работаем!)», — написала после этого OpenAI в корпоративном блоге.

Первоначально пользователи предположили, что GPT-4o в ChatGPT научилась рассуждать но, как впоследствии пояснил представитель OpenAI, в реальности новых механизмов рассуждения не появилось, хотя ChatGPT может описать ход своих «мыслей» по специальному запросу. Люди также отметили, что качество ответов ChatGPT действительно улучшилось, и видимо, заработала генерация изображений силами самой GPT-4o — её предшественница, базовая версия GPT-4, не будучи мультимодальной, подключала для этого отдельную модель DALL-E 3. Но GPT-4o справляется с созданием изображений ещё лучше: она эффективнее понимает текстовые подсказки, а также более точно и реалистично создаёт иллюстрированный текст в изображениях.

Разработчики сторонних приложений также обратили внимание, что новая модель для ChatGPT ещё недоступна по умолчанию при работе через API. В OpenAI пояснили, что при работе через API можно вызвать её через «chatgpt-4o-latest», но лучше делать это только для тестирования, а в большинстве случаев для сторонних приложений пока рекомендуется вариант «gpt-4o-2024-08-06». Хотя новая версия, признали в компании, оптимизирована для работы в режиме чата и лучше всего раскрывает свои способности в диалоге.

Китайский ИИ-пузырь сдувается: за последние 600 дней в стране закрылись 80 тысяч ИИ-стартапов

Коррекция американского фондового рынка, которая наблюдалась в начале месяца, заставила многих инвесторов задуматься, насколько эффективно сфера искусственного интеллекта способна возвращать вкладываемые в неё денежные средства. Статистика китайского сегмента стартапов показывает, что за предыдущие 600 дней закрылись почти 80 000 молодых компаний, связанных со сферой искусственного интеллекта.

 Источник изображения: Huawei Technologies

Источник изображения: Huawei Technologies

Такие данные приводит Commercial Times со ссылкой на китайское издание TMTPost. Если быть точнее, после выхода нашумевшего чат-бота ChatGPT в конце ноября 2022 года и до 29 июля текущего года включительно, в Китае из 878 000 зарегистрированных компаний, так или иначе связанных с темой искусственного интеллекта, были закрыты 78 612 штук. По сути, из общего числа прошедших регистрацию в Китае за указанный период ИИ-стартапов закрылись примерно 8,9 %.

По мнению экспертов, столь высокий отток компаний с китайского рынка технологий искусственного интеллекта вызван не только ухудшением экономической ситуации, но и высоким порогом входа, поскольку инновационная деятельность в этой сфере требует колоссальных инвестиций. Объёмы венчурного финансирования в целом в Китае за это время сократились, так что это не только проблема сегмента искусственного интеллекта как такового.

За последние десять лет в КНР покинули рынок около 353 000 компаний, связанных с темой ИИ. Из них примерно 200 000 ушли с рынка за последние три года. Впрочем, наблюдается и стабильный приток участников в этот сегмент. С начала года до 7 августа в этой сфере были зарегистрированы 300 700 новых организаций, а общее количество действующих участников рынка в Китае достигает 1 804 300 компаний. Промышленных масштабов в своей деятельности достигли более 4500 организаций. Они эксплуатируют более 180 больших языковых моделей, которые связаны с предоставлением общественных услуг, а совокупная пользовательская база этих систем превышает 564 млн человек. Участники китайской ИИ-отрасли уже призывают соотечественников к консолидации с целью более разумного расходования средств и достижения скорейшего прогресса.

Google Pixel 9 с помощью ИИ-функции поможет создавать идеальные фотографии

В рамках презентации новых устройств 13 августа Google представила серию Pixel 9 со встроенной в камеру функцией искусственного интеллекта, которая поможет снимать и редактировать фотографии на профессиональном уровне без каких-либо технических навыков.

 Источник изображения: Google

Источник изображения: Google

Одной из ключевых новинок стала функция «Add Me», позволяющая добавлять фотографа в групповой снимок. Система сканирует окружение, делает фото группы, а затем предлагает фотографу занять место в кадре, создавая иллюзию одновременного присутствия всех участников.

Функция «Reimagine» в Magic Editor дает возможность изменять фон фотографии с помощью обычных текстовых запросов. Пользователи могут, например, превратить дневной снимок в ночной или добавить на небо НЛО.

 Источник изображения: Google

Источник изображения: Google

«Autoframe» — еще одна функция Magic Editor, основанная на ИИ. Она анализирует фотографию и предлагает четыре варианта кадрирования, улучшая композицию снимка. Функция может добавить «сгенерированные пиксели» по краям кадра, чтобы объект съёмки был расположен в соответствии с правилом третей, или даже предложить вертикальное кадрирование для изначально горизонтальной фотографии.

 Источник изображения: Google

Источник изображения: Google

Долгожданная функция «Zoom Enhance» наконец-то появилась в линейке Pixel 9. С её помощью можно увеличить определённые участки фотографии, генерируя дополнительные пиксели для повышения чёткости всего изображения.

Google также улучшила функцию «Video Boost», ускорив обработку видео в два раза и добавив поддержку телеобъектива и масштабирования до 20x. Теперь система может повышать разрешение видео до 8K.

Кроме того, полностью переработана функция панорамной съёмки, в неё интегрированы технологии HDR+ и Night Sight, а также изменён процесс захвата изображений.

 Источник изображения: Google

Источник изображения: Google

Представитель Google заявил: «Наша цель — предоставить пользователям самые передовые инструменты для фото- и видеосъемки, делая процесс творчества максимально простым и интуитивным».

Google запускает голосовой чат Gemini Live для живых интеллектуальных бесед

На презентации Pixel 9 компания Google объявила о запуске нового режима голосового чата для Gemini под названием «Gemini Live». Эта функция во многом напоминает функцию голосового чата ChatGPT, предлагая на выбор несколько вариантов голосов и возможность вести разговор в естественной манере, включая прерывание ответов ИИ в любое время.

 Источник изображения: Google

Источник изображения: Google

Как поясняет TheVerge, общение с Gemini Live может происходить в свободной форме, позволяя прерывать ответы на полуслове, приостанавливать разговор не нажимая никаких кнопок и возобновлять его позднее. Функция также работает в фоновом режиме и при заблокированном экране смартфона. Интересно, что о планах запуска Gemini Live компания Google впервые объявила на своей конференции разработчиков I/O ранее в этом году, где также было сказано, что «Live» сможет интерпретировать видео в режиме реального времени.

В дополнение к этому, Google представила 10 новых голосов для Gemini, которые пользователи смогут выбрать по своему усмотрению. Функция начала развёртываться сегодня на устройствах Android, пока только на английском языке, но нам обещают, что в ближайшие недели Gemini Live станет доступен на iOS и получит поддержку дополнительных языков.

 Источник изображения: Google

Источник изображения: Google

Помимо Gemini Live, анонсированы и другие функции для ИИ-ассистента, в частности возможность анализировать контекст экрана пользователя, что напоминает функцию ИИ, анонсированную недавно Apple на мероприятии WWDC. После того как пользователь выберет опцию «Ask about this screen» (Спросить о том, что изображено на экране) или «Ask about this video» (Спросить, что показано на видео), Gemini сможет предоставить информацию, включая извлечение деталей, например, пунктов назначения из туристических видео, для добавления в Google Maps.

Отметим, что Gemini Live будет доступен пока только для подписчиков Gemini Advanced.


window-new
Soft
Hard
Тренды 🔥
В Steam стартовала летняя распродажа с «чертовски большими» скидками на тысячи игр 29 мин.
«Яндекс» сделал «Алису AI» более человечной — она запоминает пользователей и подстраивается под их стиль общения 30 мин.
Код в мешке: Rockstar снабдила «дисковую» версию GTA VI для PS5 региональными ограничениями 3 ч.
Несколько лет разочарований с Destiny 2 обернулись для Bungie массовыми увольнениями, но разработчики «должны гордиться» собой 4 ч.
ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA 4 ч.
Adobe купила разработчика ИИ для повышения качества изображений и видео Topaz Labs 4 ч.
Глава Epic Games раскритиковал Valve за «очень безответственную» политику Steam в отношении генеративного ИИ 5 ч.
Ролевой боевик Enshrouded с выживанием в волшебном мире и кооперативом на 16 человек скоро выйдет из раннего доступа — дата релиза и новый трейлер 5 ч.
Московский суд оштрафовал Apple на 500 000 рублей, но дело не в удалении VK 5 ч.
Инженерные профессии оказались наиболее устойчивы в эпоху ИИ 6 ч.
Xbox Series X и S снова подорожают по всему миру — теперь сразу на $100–150 24 мин.
Планшет Honor MagicPad 4 с большим OLED-экраном и Snapdragon 8 Gen 5 поступил в продажу в России за 100 тыс. рублей 3 ч.
Акции Apple упали более чем на 5 % после резкого повышения цен на MacBook и iPad 3 ч.
Эволюция гольф-кара: выходцы из Apple и Audi создали электрический багги для дорог общего пользования за $25 000 4 ч.
Французский ретейлер подшутил над Steam Machine за €1039, предложив свою Stim Machine c RX 9060 XT чуть дешевле 4 ч.
Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт нишу между SL3 и SL3-S 4 ч.
«Звёздный разум» заполнит орбиту: SpaceX назвала будущую миллионную группировку ИИ-спутников Starmind 5 ч.
Apple подняла цены на все Mac и iPad на $100–1300 — причина та же, что и у всех 6 ч.
Qualcomm анонсировала HBC — альтернативу HBM на базе LPDDR 7 ч.
Представлен Samsara Tracking Label — Bluetooth-наклейка для отслеживания грузов в пути 8 ч.