Опрос
|
реклама
Быстрый переход
Google представила Gemini Live — ИИ-ассистента с памятью, естественной речью и компьютерным зрением
14.05.2024 [22:12],
Андрей Созинов
Во вторник на конференции Google I/O 2024 была анонсирована новая возможность для ИИ-чат-бота Gemini — функция Gemini Live, которая позволяет пользователям вести «углубленные» голосовые диалоги с Gemini на своих смартфонах. Пользователи могут прерывать Gemini во время его реплик, чтобы задать уточняющие вопросы, и чат-бот будет адаптироваться к речи пользователя в режиме реального времени. Кроме того, Gemini может видеть и реагировать на окружение пользователя, используя фотографии или видео, снятые камерами смартфонов. ![]() Источник изображений: Google Gemini Live — это в некотором роде соединение платформы компьютерного зрения Google Lens и виртуального помощника Google Assistant, и их дальнейшая эволюция. На первый взгляд Gemini Live не кажется кардинальным обновлением по сравнению с существующими технологиями. Но Google утверждает, что система использует новые методы генеративного ИИ, чтобы обеспечить превосходный, менее подверженный ошибкам анализ изображений, и сочетает эти методы с улучшенным речевым движком для более последовательного, эмоционально выразительного и реалистичного многооборотного диалога. Технические инновации, используемые в Gemini Live, частично связаны с проектом Project Astra, новой инициативой DeepMind по созданию приложений и «агентов» на базе ИИ с поддержкой «понимания» в реальном времени различных источников данных — текста, аудио и изображения. «Мы всегда хотели создать универсального агента, который будет полезен в повседневной жизни, — сказал на брифинге Демис Хассабис (Demis Hassabis), генеральный директор DeepMind. — Представьте себе агентов, которые могут видеть и слышать то, что мы делаем, лучше понимать контекст, в котором мы находимся, и быстро реагировать в разговоре, делая темп и качество взаимодействия гораздо более естественными». Gemini Live, который будет запущен только в конце этого года, сможет отвечать на вопросы о предметах, находящихся в поле зрения (или недавно попавших в поле зрения) камеры смартфона, например, в каком районе находится пользователь или как называется сломавшаяся деталь велосипеда. Либо пользователь сможет указать системе на часть компьютерного кода, а Live объяснит, за что она отвечает. А на вопрос о том, где могут находиться очки пользователя, Gemini Live скажет, где он видел их в последний раз. А как это облегчит поиск потерянного пульта от телевизора! Live также сможет стать своеобразным виртуальным наставником, помогая пользователям отрепетировать речь к мероприятию, обдумать идеи и так далее. Live может подсказать, какие навыки следует подчеркнуть на предстоящем собеседовании или стажировке, или дать совет по публичному выступлению. Способность Gemini Live «запоминать», что происходило недавно, стала возможной благодаря архитектуре модели, лежащей в ее основе — Gemini 1.5 Pro, а также, но в меньшей степени, других «специфических» генеративных моделей. У Gemini 1.5 Pro весьма ёмкое контекстное окно, а значит, она может принять и обработать большое количество данных — около часа видео — прежде чем подготовить ответ. В Google отметили, что Gemini Live будет помнить всё, что происходило в последние часы. Gemini Live напоминает генеративный ИИ, применяемый в очках Meta✴, которые аналогичным образом могут просматривать изображения, снятые камерой, и интерпретировать их практически в реальном времени. Судя по демонстрационным роликам, которые Google показала во время презентации, Live также очень похож на недавно обновленный ChatGPT от OpenAI. Ключевое различие между новым ChatGPT и Gemini Live заключается в том, что решение от Google не будет бесплатным. После запуска Live будет эксклюзивом для Gemini Advanced, более сложной версии Gemini, которая доступна подписчикам плана Google One AI Premium Plan, стоимостью 20 долларов в месяц. Возможно, в качестве отсылки к очкам Meta✴, в одном из демонстрационных роликов Google был показан человек в AR-очках, оснащенных приложением, похожим на Gemini Live. Правда, компания Google, желая избежать очередного провала в сфере умных очков, отказалась сообщить, появятся ли этот или подобный продукт с генеративным ИИ на рынке в ближайшем будущем. ИИ-чат-бот Anthropic Claude запущен в Европе — это один из главных конкурентов ChatGPT
14.05.2024 [12:41],
Павел Котов
Специализирующийся на технологиях искусственного интеллекта стартап Anthropic открыл для европейских пользователей чат-бот Claude и услуги по подписке — в стремлении нарастить число пользователей и объёмы доходов компания решилась выйти на рынок с более жёстким регулированием, чем в США. ![]() Источник изображения: anthropic.com Базовые программные продукты от Anthropic уже пользуются некоторой популярностью в финансовом секторе и гостиничном бизнесе, сообщили в компании, и теперь здесь решили закрепить успех. Соблюдать действующие в Европе жёсткие ограничения на управление данными Anthropic помогут её основные партнёры в области облачных вычислений — Amazon и Google, — сообщил гендиректор компании Дарио Амодей (Dario Amodei). Anthropic, основанная в 2021 году бывшими сотрудниками OpenAI, позиционирует себя как разработчика ответственного и этичного ИИ. Подобно многим другим представителям отрасли, компания уделяет много внимания продаже услуг корпоративным клиентам. В мае Anthropic представила корпоративный тарифный план Team, но спрос на него глава компании комментировать отказался. В Европе цены будут аналогичными — здесь стартапу придётся конкурировать с OpenAI и французским разработчиком Mistral. Anthropic также придётся соблюдать требования принятого ранее «Закона об ИИ». Он требует от разработчиков применять адекватные средства контроля кибербезопасности, а также раскрывать некоторые подробности об архитектуре и потенциальных угрозах, которые могут представлять модели ИИ. Механизмы соблюдения требований закона будут зависеть правоприменительной практики, которую станут реализовывать местные регуляторы, отметил соучредитель компании Джек Кларк (Jack Clark). TikTok тестирует поиск с использованием ИИ
14.05.2024 [12:29],
Владимир Мироненко
Сервис коротких видео TikTok тестирует новую функцию поиска с использованием генеративного ИИ, получившую название Search Highlights («основные моменты поиска»), сообщает ресурс The Verge. ![]() Источник изображения: Solen Feyissa/unsplash.com Теперь в верхней части некоторых страниц результатов поиска TikTok появляется фрагмент с результатами, сгенерированными ИИ, и при нажатии на него открывается новая страница с развёрнутым ответом. В пояснении сообщается, что результаты сгенерированы с использованием ChatGPT, и что TikTok отображает контент, «когда [алгоритм] считает его релевантным для поискового запроса пользователя». На данный момент функция ограничена, и не на все запросы предоставляются результаты поиска, полученные с использованием ИИ. Как отметил The Verge, у видеосервиса также есть аналогичная функция, которая не помечена как использующая ИИ. Этот перечень тоже отображается вверху результатов поиска, но неясно, откуда взята эта информация. Во всяком случае, TikTok пока не ответил на просьбу ресурса дать комментарии по этому поводу. Похоже, что TikTok пытается использовать появившуюся у отдельных пользователей, особенно молодых людей, привычку использовать видеосервис в качестве поисковой системы, предпочитая с его помощью находить ответы на интересующие вопросы. И теперь TikTok опирается на результаты поиска с ИИ, добавляя их над контентом авторов, чтобы ещё больше заинтересовать аудиторию в использовании видеосервиса. Власти рекомендовали китайским техногигантам отдавать предпочтение ускорителям вычислений местной разработки
14.05.2024 [07:03],
Алексей Разин
Само по себе стремление китайских компаний добиться технологического суверенитета в сфере разработки и выпуска ускорителей вычислений не является новостью, та же Huawei давно предлагает свои ускорители семейства Ascend, но в производительности они до сих пор уступали решениям Nvidia. Теперь продвигать ускорители китайской разработки взялись власти страны, рекомендуя участникам рынка воздерживаться от покупки продукции Nvidia. ![]() Источник изображения: Huawei Technologies Напомним, что власти США планомерно ограничивают ассортимент поставляемых в КНР по легальным каналам ускорителей вычислений Nvidia, и последняя волна таких ограничений к началу этого года породила специальные решения для Китая: H20, L20 и L2, которые соответствуют требованиям США в области экспортного контроля. Теперь китайские регуляторы, как сообщает The Information со ссылкой на представителей китайских компаний технологического сектора (ByteDance, Tencent, Alibaba и Baidu), рекомендуют им ограничить закупки ускорителей вычислений иностранного производства и отдавать предпочтение отечественным. При этом H20 — наиболее производительное из доступных в Китае решений Nvidia, в Китае можно заказывать с марта этого года, и некоторые местные компании успели понять, что купив достаточное количество таких ускорителей, они смогут в значительной степени компенсировать отсутствие доступа к более производительным решениям этой марки. Китайские компании уже заказали в поставку не менее 350 000 ускорителей H20 на общую сумму около $4 млрд, хотя она и меньше прошлогодних $5 млрд, направленных на закупку более производительных ускорителей. Рекомендация правительства КНР покупать больше китайских ускорителей поступила ещё несколько месяцев назад, но пока сложно судить, насколько сильно она изменит расстановку сил на китайском рынке. Для самой Nvidia подобные рекомендации являются потенциальным источником снижения выручки на китайском рынке, даже без учёта американских санкций как таковых. Если в 2023 фискальном году Китай отвечал за 19 % всей выручки компании, то в 2024 фискальном году эта доля сократилась до 14 %. Рекомендации властей КНР должны ударить и по доходам компаний Intel и AMD, также поставляющим в Китай определённый ассортимент ускорителей вычислений. OpenAI обновила интерфейс ChatGPT — теперь это чёрная дыра
14.05.2024 [05:01],
Анжелла Марина
OpenAI обновила интерфейс ChatGPT, сделав его минималистичным. Теперь пользователь будет «общаться» с большой чёрной точкой, которая изменяется в зависимости от происходящих событий. Когда ИИ говорит, круг меняется, визуально усиливая ощущение диалога и взаимодействия. ![]() Источник изображения: OpenAI По словам технического директора OpenAI Миры Мурати (Mira Murati), новый интерфейс должен свести к минимуму отвлекающие факторы, чтобы пользователи могли полностью сосредоточиться на диалоге с ИИ. Чёрный круг, выступающий в роли собеседника, превращается в стилизованные волны звука, когда ChatGPT даёт ответ. Это визуально усиливает у пользователя ощущение коммуникации. Интересно, что выбор минималистичного дизайна в духе Apple может показаться смелым и неожиданным, но, похоже, он основан на тщательном анализе. Более яркие цвета или образ человека могут отвлекать и даже вызывать дискомфорт, а вот нейтральный чёрный круг, как считают разработчики OpenAI, универсален и легко адаптируем для отображения в дальнейшем новых функций ChatGPT. При этом такая простая геометрическая форма помогает избежать самых тревожных ассоциаций с «всевидящим и всезнающим» ИИ из мира научной фантастики. Например, нельзя не вспомнить компьютер HAL 9000 с его красным «глазом» из фильма Стэнли Кубрика «Космическая одиссея 2001 года». Или же суперкомпьютер-провидец «Небесная машина» из романов Артура Кларка (Arthur Clarke), который фактически управлял всем человечеством. ![]() Источник изображения: OpenAI Как отмечает Techcrunch, упрощенный интерфейс, основанный на простой форме, похоже, хорошо вписывается в общий тренд в индустрии ИИ. Компании вроде Apple, Meta✴ и другие также экспериментируют с минималистичными аватарками для своих голосовых помощников. По сравнению с некоторыми из них, круг ChatGPT выглядит даже довольно скромно. Пока обновленный интерфейс будет доступен только для настольных и мобильных приложений ChatGPT. В веб-версии по-прежнему используется стандартный текстовый интерфейс. OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно
13.05.2024 [22:50],
Владимир Мироненко
OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o. ![]() Источник изображений: OpenAI Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами». Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов. ![]() Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией. GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?». В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати. ![]() Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных. Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store. OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости. В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров». Представители британской прессы заявили, что нововведения Apple iOS оставят их без средств к существованию
13.05.2024 [05:13],
Алексей Разин
Операционная система Apple iOS 18 ещё не представлена, но обсуждаемые нововведения затрагивают интересы целых отраслей, поэтому представители британской прессы обратились к американской компании с призывом внимательно оценить последствия внедрения новых способов блокировки онлайн-рекламы для пользователей и инструмента для автоматического редактирования статей. ![]() Источник изображения: Unsplash, Austin Distel Как сообщает Financial Times, члены ассоциации News Media Association, которая объединяет около 900 изданий, выразили свою обеспокоенность перспективами появления в iOS 18 основанных на искусственном интеллекте функций, блокирующих в браузере Safari рекламу и автоматически удаляющих тот или иной контент. Представители британской прессы озабочены тем, что блокировка рекламы сократит и без того измельчавший в последние годы финансовый поток, поддерживающий интернет-издания на плаву. Письмо подписано рядом крупных СМИ, включая The Times, The Guardian и The Daily Telegraph. С одной стороны, представители прессы заявили об угрозе для своих доходов со стороны блокирующего рекламу инструмента. С другой стороны, они возмутились потенциальной автоматической цензурой, которая будет удалять те или иные фрагменты публикаций, тем самым противореча редакционной политике. Авторы письма попытались внушить Apple мысль о существовании угрозы для британской журналистики в целом, призвав компанию не лишать свою аудиторию такого важного канала получения информации. Политика Apple по защите персональной информации пользователей и неприкосновенности их частной жизни постепенно привела к потере эффективности некоторых алгоритмов, которые использовались рекламодателями для более точного позиционирования своих товаров и услуг среди интернет-аудитории. Соответственно, рекламодатели снизили финансирование этого канала продвижения своих товаров и услуг, и на интернет-изданиях это уже сказалось отрицательным образом. Поддержка новостного бизнеса со стороны администрации определённых социальных сетей тоже ослабла, ухудшая и без того незавидное положение интернет-изданий. Раздражение представителей СМИ вызывает и тот факт, что социальные сети часто используют публикации интернет-изданий для привлечения и наращивания своей аудитории, а первоисточники в этом случае почти не получают выгоды. В Великобритании запустили платформу для оценки безопасности ИИ
12.05.2024 [15:37],
Владимир Мироненко
Британский Институт безопасности ИИ (AISI), созданный в ноябре 2023 года, запустил платформу Inspect, предназначенную для тестирования и оценки безопасности ИИ. Она упростит оценку ИИ для применения в промышленных, исследовательских и научных организациях. ![]() Источник изображения: geralt/Pixabay Набор инструментов Inspect, доступный по лицензии с открытым исходным кодом, включая лицензии MIT, предназначен для оценки определённых возможностей моделей ИИ в различных сферах, включая основные знания моделей и способность рассуждать, и выработки оценки на основе полученных результатов. По данным ресурса TechCrunch, платформа Inspect состоит из трех основных компонентов: наборов данных, инструментов решения и инструментов оценки. Наборы данных предоставляют образцы для оценочных тестов. Инструменты решения выполняют работу по проведению тестов. А инструменты оценки оценивают результаты и суммируют баллы тестов в метрики. Компоненты Inspect можно дополнить с помощью сторонних пакетов, написанных на Python. «Мы надеемся, что глобальное сообщество ИИ будет использовать Inspect не только для проведения собственных испытаний на безопасность моделей, но и для адаптации и развития платформы с открытым исходным кодом, чтобы мы могли производить высококачественные оценки по всем направлениям», — заявил председатель AISI Ян Хогарт (Ian Hogarth). Платформа Inspect была представлена спустя несколько дней после того, как Национальный институт стандартов и технологий США (The National Institute of Standards and Technology, NIST) анонсировал в конце апреля программу NIST GenAI, предназначенную для оценки различных технологий генеративного ИИ, включая модели, генерирующие текст и изображения. В апреле США и Великобритания объявили о партнёрстве, в рамках которого «правительства будут обмениваться техническими знаниями, информацией и талантливыми специалистами в области безопасности ИИ». В рамках сотрудничества в США будет создан институт безопасности ИИ, который займётся оценкой рисков, связанных с ИИ и генеративным ИИ. OpenAI представит ИИ-ассистента с пониманием сарказма и добавит в ChatGPT звонки
12.05.2024 [11:40],
Владимир Мироненко
Компания OpenAI может вскоре представить цифрового помощника с поддержкой мультимодального искусственным интеллектом. Как сообщает ресурс The Information, новый ассистент OpenAI способен даже распознать сарказм. ![]() Источник изображения: Mariia Shalabaieva/unsplash.com По данным источников The Information, OpenAI продемонстрировала ряду клиентов новую мультимодальную ИИ-модель, способную как вести диалог с пользователем, так и распознавать объекты. Не исключено, что она будет представлена завтра, 13 мая, на мероприятии, которое начнётся в 20:00 мск. Новая модель обеспечивает более быструю и точную интерпретацию изображений и аудио по сравнению с существующими ИИ-моделями для транскрипции или преобразования текста в речь. Как предполагает The Information, она может помочь сотрудникам службы поддержки клиентов «лучше понимать интонацию голосов звонящих или то, саркастичны ли они». «Теоретически» модель может помочь студентам в решении задач по математике или переводе реальных обозначений. По словам источников ресурса, новая ИИ-модель может превзойти GPT-4 Turbo в «ответах на некоторые типы вопросов», но все же будет более склонна к ошибочным решениям. По словам разработчика Ананая Ароры (Ananay Arora), OpenAI также готовится добавить чат-боту ChatGPT функцию телефонных звонков. Арора утверждает, что нашёл доказательства того, что OpenAI уже предусмотрела использование серверов для аудио- и видеосвязи в реальном времени. Следует отметить, что этой функции не будет у модели GPT-5, если её вдруг представят на следующей неделе, поскольку гендиректор Сэм Альтман (Sam Altman) отрицает тот факт, что предстоящее мероприятие будет иметь какое-либо отношение к последователю ИИ-модели GPT-4. Он также опроверг слухи о том, что компания на следующей неделе представит новую поисковую систему на базе ИИ. Arm разработает собственный ИИ ускоритель — его массовое производство запустят в 2025 году
11.05.2024 [23:33],
Владимир Мироненко
Базирующаяся в Великобритании компания Arm, 90 % которой принадлежит японскому конгломерату SoftBank Group, займётся разработкой ИИ-ускорителй, для чего будет сформировано отдельное подразделение, пишет ресурс Nikkei Asia. Как ожидается, первый прототип ИИ-чипа Arm будет готов к весне 2025 года, а уже осенью будет запущено его массовое производство, которым будут заниматься контрактные производители. ![]() Источник изображения: Pixabay Гендиректор SoftBank Масаёси Сон (Masayoshi Son) решил преобразовать свою компанию в крупного игрока ИИ-рынка, на что готов выделить как минимум 10 трлн иен (около $64 млрд). Как сообщается, Arm возьмёт на себя первоначальные траты на разработку ИИ-чипа, которые могут достичь сотен миллиардов иен, но при этом SoftBank также внесёт свой вклад в финансирование проекта. Как только будет запущено массовое производство, новый бизнес могут передать в управление SoftBank. По данным Nikkei Asia, SoftBank уже ведёт переговоры с TSMC и другими контрактными производителями, чтобы забронировать необходимые производственные мощности. Масаёси Сон также провёл встречи с руководителями ряда компаний, чтобы заручиться поддержкой в реализации проекта. В соответствии с представлениями Сона о революции ИИ, SoftBank планирует объединить новейшие технологии ИИ, полупроводников и робототехники, чтобы стимулировать инновации в различных отраслях. В основу проекта лягут ИИ-ускорители, способные обрабатывать большие объёмы данных. Уже в 2026 году SoftBank планирует построить ЦОД, оснащённые чипами собственного производства, в США, Европе, Азии и на Ближнем Востоке. Поскольку ЦОД потребуется огромное количество электроэнергии, SoftBank также будет заниматься производством электроэнергии. Компания собирается строить ветряные и солнечные электростанции, при этом уделяя особое внимание термоядерным технологиям следующего поколения. В прошлом SoftBank уже не раз меняла основной бизнес, чтобы идти в ногу с технологическими трендами. В конце 1990-х годов она управляла интернет-бизнесом через совместное предприятие с Yahoo в США, в конце 2000-х годов переключилась на мобильный бизнес, приобретя британскую компанию Vodafone и американскую Spring. Теперь SoftBank пытается трансформироваться в группу, ориентированную на ИИ. По данным Precedence Research of Canada, в настоящее время ИИ-рынок оценивается в $30 млрд и к 2029 году превысит $100 млрд, а к 2032 году — $200 млрд. Лидирующая сейчас на рынке Nvidia не может удовлетворить растущий спрос и SoftBank видит в этом для себя большие возможности. Meta✴ использует для обучения ИИ контент из Instagram✴ и Facebook✴
11.05.2024 [15:39],
Владимир Мироненко
В то время как технологические компании, занимающиеся разработкой ИИ, находятся в поиске источников данных для обучения своих ИИ-моделей, у Meta✴, как оказалось, есть большое преимущество перед ними, поскольку она может использовать для этих целей контент Instagram✴ и Facebook✴. Об этом сообщил директор по продукту Meta✴ Крис Кокс (Chris Cox) на саммите Bloomberg Tech Summit, прошедшем на этой неделе. ![]() Источник изображения: geralt/Pixabay Крис Кокс уточнил, что Meta✴ использует для обучения своего генератора изображений по текстовым запросам на базе ИИ общедоступные фотографии и текст из Instagram✴ и Facebook✴. «Мы не тренируемся на личных данных, мы не тренируемся на данных, которыми люди делятся со своими друзьями, мы тренируемся на публичных данных», — сказал он. Крис Кокс отметил, что Meta✴ AI позволяет создавать изображения «действительно потрясающего качества», поскольку в Instagram✴ много фотографий «искусства, моды, культуры, а также просто изображений людей и нас». Чтобы создать изображение с помощью Meta✴ AI, пользователю достаточно набрать запрос, начинающийся со слова «нарисовать», и, как указано на сайте сайт Meta✴.ai, он сгенерирует четыре изображения. Для получения данных, используемых для обучения ИИ, компании объединяют усилия с другими фирмами. Например, OpenAI договорилась о сотрудничестве с несколькими СМИ, чтобы лицензировать их контент для разработки своих ИИ-моделей. В свою очередь, Meta✴ рассматривала возможность приобретения издательства Simon & Schuster, чтобы получить больше данных для обучения собственных ИИ-моделей, сообщила в прошлом месяце газета The New York Times. Помимо наборов необработанных данных, компании используют так называемые «петли обратной связи», представляющие собой процесс использования результатов работы системы ИИ и соответствующих действий конечного пользователя для переобучения и улучшения моделей. Гендиректор Meta✴ Марк Цукерберг (Mark Zuckerberg) ранее заявил, что циклы обратной связи будут «более ценными», чем любой «предварительный контент». Глава OpenAI опроверг слухи о запуске ИИ-поисковика на следующей неделе
11.05.2024 [07:30],
Николай Хижняк
Глава OpenAI Сэм Альтман (Sam Altman) опроверг сообщение Reuters о том, что компания в следующий понедельник, за день до конференции Google I/O, представит свой собственный ИИ-поисковик, который будет позиционироваться как потенциальный конкурент поисковику Google и ИИ-поисковику стартапа Perplexity. ![]() Источник изображения: OpenAI На своей станице в соцсети X Альтман подтвердил, что компания действительно собирается представить некий новый продукт, который, по его мнению, «ощущается словно магия», но это «не GPT-5 и не поисковый движок». ![]() Альтман также ретвитнул сообщение официального канала OpenAI, в котором говорится, что компания в понедельник, в 10:00 утра по местному времени (20:00 мск) расскажет о свежих обновлениях для чат-бота ChatGPT и языковой модели GPT-4. По информации The Verge, OpenAI активно пытается переманивать сотрудников Google в свою команду, которая ведёт разработку некоего нового продукта. Издания Bloomberg и The Information ранее сообщали, что речь может идти о разработке поисковой системы. Появление функций ChatGPT в iOS 18 — вопрос почти решённый
11.05.2024 [06:56],
Алексей Разин
Сфера систем искусственного интеллекта с точки зрения практического его использования и реализации разного рода сотрудничества в последнее время полна событиями как более или менее явными, так и скрытыми. К последним Bloomberg относит почти достигнутую Apple договорённость об использовании чат-бота ChatGPT компании OpenAI в операционной системе iOS 18. ![]() Источник изображения: Unsplash, Solen Feyissa Об этом событии агентство Bloomberg традиционно сообщает со ссылкой на собственные источники, но с учётом близости конференции для разработчиков WWDC 2024, которая начнёт работу в середине июня, подобная новость достаточно скоро может получить официальное подтверждение. По данным источника, Apple и OpenAI уже находятся на заключительных этапах подписания соглашения о сотрудничестве, которое позволит первой использовать элементы ChatGPT в операционной системе Apple iOS 18. Попутно отмечается, что переговоры Apple с Google о внедрении чат-бота Gemini в экосистему первой из компаний успехом пока не увенчались, хотя попытки продолжаются. Как поясняет Bloomberg, на данном этапе нет твёрдых гарантий, что о соглашении между Apple и OpenAI будет объявлено официально в ближайшие недели, но скорое начало конференции WWDC 2024 вполне предсказуемо подгоняет первую из сторон. Сотрудничество с OpenAI может стать одним из шагов Apple по развитию собственной экосистемы искусственного интеллекта. Ранее сообщалось, что она собирается не только развивать способность фирменных процессоров ускорять работу искусственного интеллекта с использованием аппаратных ресурсов клиентских устройств, но и до конца года внедрить процессоры M2 Ultra в серверную инфраструктуру соответствующего назначения. При этом часть облачной экосистемы Apple продолжит опираться на мощности сторонних провайдеров из соображений экономической целесообразности. Apple обновит Siri: виртуальный помощник устарел и отстаёт от конкурентов
11.05.2024 [05:51],
Анжелла Марина
Компания Apple осознала, что её виртуальный помощник Siri безнадёжно отстаёт от конкурентов, в частности от ChatGPT, разработанного OpenAI. Это привело к масштабной реорганизации внутри компании и срочным усилиям по модернизации Siri с использованием новейших технологий ИИ. Apple сосредоточится на улучшении существующей функциональности Siri, а не на создании нового чат-бота. ![]() Изображение: Kandinsky В начале прошлого года топ-менеджеры Apple по программному обеспечению пришли к выводу, что виртуальный помощник Siri нуждается в переменах. Siri слишком часто неправильно понимает вопросы и не может вести диалоги. Поводом для этого стало тестирование нового чат-бота ChatGPT компании OpenAI. Использование передовых технологий генеративного искусственного интеллекта, способного создавать стихи, код и вести диалог с пользователями, заставило Siri выглядеть устаревшей. Осознав отставание Siri, руководство Apple во главе с Тимом Куком (Tim Cook) решило сделать модернизацию виртуального помощника приоритетным проектом компании и догнать конкурентов в сфере AI любой ценой. Apple уже работает над тем, чтобы виртуальный помощник смог вести диалог по принципу чат-ботов, а не просто отвечать на отдельные запросы. Сможет ли Siri сочинять стихи и писать код, пока не известно. В любом случае, все подробности станут известны на ежегодной конференции Apple для разработчиков 10 июня. Стоит отметить, что модернизация Siri — это лишь часть более масштабных планов Apple по интеграции технологий генеративного ИИ в свои продукты и сервисы. В частности, компания планирует увеличить объём памяти в новых моделях iPhone, чтобы поддерживать расширенные возможности Siri. Кроме того, обсуждается приобретение лицензий на использование передовых моделей ИИ таких компаний как Google, Cohere и OpenAI. Как сообщает The New York Times, топ-менеджмент Apple обеспокоен тем, что новые технологии ИИ могут подорвать доминирующие позиции компании на рынке смартфонов. В частности, есть опасения, что генеративный ИИ может со временем стать альтернативной мобильной операционной системой, вытеснив полностью iOS. Кроме того, ИИ открывает путь для создания экосистемы «интеллектуальных агентов», способных заменить множество приложений из AppStore. Чтобы не допустить такого развития событий, Apple решила сконцентрироваться на усилении собственных позиций в сфере ИИ. В частности, не так давно компания отменила проект по созданию беспилотных автомобилей стоимостью 10 млрд долларов и вместо этого сотни инженеров были переведены на разработку в области ИИ. Хотя Apple не планирует создавать аналог ChatGPT, основные усилия сосредоточены на расширении возможностей Siri как помощника для решения повседневных задач. Помимо улучшенного диалога, обновленная Siri сможет точнее устанавливать таймеры, планировать встречи, составлять списки покупок и резюмировать тексты. При этом в Apple подчёркивают, что новая Siri будет более приватной, чем конкурирующие ИИ, так как обработка запросов будет производиться непосредственно на iPhone, а не на удалённых серверах. 64 пикселя за 20 минут: на 40-летнем компьютере Commodore 64 запустили ИИ-генератор изображений
10.05.2024 [17:58],
Павел Котов
В августе 1982 года вышел компьютер Commodore 64, которому было суждено стать одним из самых продаваемых ПК всех времён. Как оказалось, оборудование той эпохи и может справляться и с современными алгоритмами искусственного интеллекта — конечно, с некоторыми оговорками. ![]() Источник изображения: github.com/nickbild Энтузиаст Ник Бильд (Nick Bild) разработал для Commodore 64 систему генеративного ИИ, способную создавать изображения размером 8 × 8 пикселей, которые затем преобразуются в картинки 64 × 64 точки. Эти изображения призваны служить источником вдохновения при разработке концепций игрового дизайна. Как оказалось, современную модель генеративного ИИ действительно можно запускать на таком старом оборудовании. На выполнение 94 итерации для построения окончательного изображения у Commodore 64 ушли 20 минут — и это, пожалуй, совсем неплохо, учитывая возраст компьютера. О проектах уровня OpenAI речи, конечно, не идёт, но и «вероятностный алгоритм PCA», запущенный на 40-летней машине, в реальности был обучен на современном компьютере. Таким образом, хотя модель и по-честному работала на Commodore 64, для её запуска всё равно оказался необходим современный ПК. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |