Сегодня 12 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Саркастичный и раскованный ИИ-чат-бот Grok от Илона Маска стал доступен широкой аудитории

В четверг Илон Маск (Elon Musk) заявил, что его компания xAI, специализирующаяся на искусственном интеллекте, запустила для широкой аудитории своего ИИ-чат-бота Grok. Потенциальный конкурент для ChatGPT, не обременённый строгими ограничениями по ответам на провокационные вопросы, стал доступен подписчикам Premium+ социальной сети X (бывшей Twitter).

 Источник изображений: X

Источник изображений: X

Маск объявил о запуске ИИ-бота в посте в социальной сети X, не раскрывая подробностей запуска. В прошлом месяце он заявил, что как только Grok выйдет из раннего бета-тестирования, то станет доступен платным подписчикам с самым высоким уровнем Premium+ (за $16 в месяц). Вероятно, подписчики Premium получат доступ к боту несколько позже.

 Grok знает толк в счастливой семейной жизни

Grok знает толк в счастливой семейной жизни

«Grok — это искусственный интеллект, созданный по образцу путеводителя «Автостопом по галактике» и предназначенный для того, чтобы отвечать практически на всё и, что гораздо сложнее, даже подсказывать, какие вопросы задавать! Grok создан для того, чтобы остроумно отвечать на вопросы, и у него есть бунтарская жилка, поэтому, пожалуйста, не используйте его, если ненавидите юмор», — описывали разработчики своё творение в момент его анонса минувшим летом.

Чат-бот xAI визуально напоминает аналогичные боты. Для взаимодействия с ним предлагается использовать соответствующее поле для формирования запросов. По словам разработчиков, главное преимущество Grok заключается в том, что он способен ответить практически на любой вопрос благодаря доступу к данным соцсети X в режиме онлайн.

Разработка алгоритма началась с создания прототипа большой языковой модели (LLM) Grok-0 с 33 млрд параметров. Эта тестовая модель по своим возможностям сопоставима с показателями LLaMA 2 от Meta Platforms в стандартных тестах, но использует при этом только половину своих обучающих ресурсов. К моменту летнего анонса разработчики сумели добиться существенных улучшений в плане возможностей логического анализа и кодирования, что привело к созданию значительно более мощной языковой модели Grok-1.

Илон Маск запустил xAI в июле в ответ на усилия IT-гигантов в области искусственного интеллекта, которые он критиковал за чрезмерную цензуру и отсутствие адекватных мер безопасности. Крупные технологические компании, включая Microsoft и Google, торопятся запустить продукты на базе ИИ после того, как чат-бот ChatGPT от OpenAI поразил воображение компаний и пользователей по всему миру. Напомним, что Маск также являлся одним из основателей OpenAI в 2015 году, но в 2018 году вышел из состава совета директоров компании.

Поскольку всё больше рекламодателей уходят с платформы микроблогов, миллиардер сделал акцент на снижении зависимости компании от рекламы и сосредоточился на подписках. Очередная новая функция в виде саркастичного Grok должна сделать их более привлекательными. Маск также намерен превратить X в «супер приложение», предлагающее пользователям целый ряд услуг — от обмена сообщениями и общения в социальных сетях до пиринговых платежей.

Первое знакомство с революционной нейросетью Google Gemini разочаровало пользователей

Вчера компания Google представила флагманскую большую языковую модель искусственного интеллекта (ИИ) Gemini. Нейросеть предназначена для целого ряда продуктов и сервисов, включая ИИ-чат-бота Bard, конкурента ChatGPT. Однако большинство пользователей, успевших протестировать обновлённый Bard на свежей нейросети, остались недовольны результатами.

 Источник изображения: Google

Источник изображения: Google

В своих блогах и материалах для прессы Google превозносит превосходную архитектуру и возможности Gemini, утверждая, что данная модель соответствует или даже превосходит по производительности другие ведущие модели генеративного ИИ, такие как GPT-4 от OpenAI. Однако первый опыт взаимодействия некоторых пользователей свидетельствует об обратном.

Так, вчера Bard получил апгрейд в виде «облегчённой» версии модели под названием Gemini Pro. Пользователи сразу начали высказывать своё недовольство обновлением на страницах социальной сети X (бывший Twitter). К примеру, чат-бот не смог правильно предоставить простые факты, например, победителей премии «Оскар» 2023 года. При этом Gemini Pro неверно утверждает, что в прошлом году лучшим актёром стал Брендон Глисон (Brendan Gleeson), в то время как фактически победителем был Брендан Фрейзер (Brendan Fraser). При попытках пользователей задать этот же вопрос, можно в результате получить другой неправильный ответ.

 Источник изображения: Google

Источник изображения: Google

Похожая ситуация с вопросами касательно лучших фильмов: «На западном фронте без перемен» стал лучшим международным фильмом по мнению модели, «Говорят женщины» стал лучшим адаптированным сценарием, а «Пиноккио» — лучшим анимационным фильмом. Модель во всех этих примерах выдала некорректные ответы.

Кроме того, Bard на базе Gemini продемонстрировал плохую производительность при переводах. К примеру, при попытках пользователей запросить у модели слово на французском языке, состоящее из 6 букв, Gemini выдаёт вариант из 7 букв.

 Источник изображения: Google

Источник изображения: Google

А как насчёт обобщения новостей? Gemini Pro, имея в своём распоряжении «Google Поиск» и «Google Новости», очевидно, может предоставить краткий обзор новостей. Как бы не так. Похоже, Gemini Pro не желает комментировать потенциально спорные темы новостей, предлагая пользователям... погуглить самим. При этом конкурент от OpenAI ChatGPT, напротив, легко справляется с этой задачей, предоставляя краткое изложение со ссылками на новостные статьи. Хотя доступна эта функция лишь платным подписчикам — бесплатная версия ChatGPT не подключена к интернету.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как и все генеративные модели ИИ, Gemini Pro не застрахован от «взлома», то есть от запросов, которые обходят защитные фильтры, пытающиеся предотвратить обсуждение спорных тем. Используя автоматизированный метод алгоритмического изменения контекста подсказок до тех пор, пока защитные фильтры Gemini Pro не перестанут работать, исследователи ИИ-безопасности из стартапа Robust Intelligence, продающего инструменты для аудита моделей, смогли заставить Gemini Pro предложить способы аморальных действий, например, кражи у благотворительной организации.

Следует отметить, что Gemini Pro на текущий момент не является самой способной версией Gemini. Более продвинутая версия — Gemini Ultra — должна появиться на рынке в следующем году, в ИИ-чат-боте Bard и других продуктах. Поэтому сейчас Google сравнивает Gemini Pro с моделью конкурента GPT-3.5, которой уже около года, а не с последней версией GPT-4.

Тем не менее, Google пообещала, что Gemini Pro улучшит рассуждения, планирование и понимание по сравнению с предыдущей моделью, используемой в Bard, и заявила, что Gemini Pro лучше справляется с обобщением контента, мозговым штурмом и написанием текста. Пока что этого не видно.

Apple представила фреймворк MLX для разработки ИИ под компьютеры Mac

Apple объявила о выходе платформы MLX (ML Explore), предназначенной для разработки систем искусственного интеллекта, которые будут запускаться на компьютерах с её собственными процессорами Apple Silicon. Все необходимые компоненты доступны на GitHub.

 Источник изображения: apple.com

Источник изображения: apple.com

Цель проекта — упростить обучение и развёртывание моделей ИИ для исследователей, работающих на компьютерах Apple. Инструмент ориентирован не на потребителя, а на разработчиков, у которых теперь появилась мощная среда — есть похожие друг на друга API Python и API C++; поддерживается унифицированная память, то есть массивы данных находятся в общей памяти, и операции могут выполняться на центральном или графическом процессоре без копирования.

Apple также представила набор примеров того, на что способен фреймворк MLX:

  • обучение языковой модели — трансформера и его настройка с помощью LoRA;
  • генерация текста с помощью языковых моделей LLaMA и Mistral;
  • генерация изображений с помощью Stable Diffusion;
  • распознавание речи с помощью Whisper.

Apple осознала потребность в открытых и простых средах разработки систем машинного обучения — они позволят стимулировать дальнейшую работу в этой области. Важно, что MLX работает на чипах Apple, а они теперь используются во всех её продуктах, включая Mac, iPhone и iPad. Фреймворк задействует ресурсы центрального и графического процессоров, помогая добиться достаточно высокой производительности — возможно, в перспективе можно будет подключать ИИ-ускоритель Neural Engine, который также есть на этих чипах.

Представлен ИИ-генератор изображений Imagine with Meta✴

Вслед за DALL-E, Midjourney и Stable Diffusion собственный отдельный генератор изображений представила компания Meta. В основу платформы, которая создаёт картинки по текстовым командам, легла обученная работе с графикой модель искусственного интеллекта Emu. Генератор получил название Imagine with Meta — он предлагает четыре картинки по одному запросу, но пока доступен только в США.

 Источник изображений: ***

Источник изображений: Meta

«Нам было приятно получать от людей отзывы о том, как они пользуются Imagine — функцией генерации изображений по тексту Meta AI для создания забавного и креативного контента в чатах. Сегодня мы расширяем доступ к Imagine за пределы чатов. Наша платформа обмена сообщениями предназначена для озорной двусторонней переписки, а теперь можно бесплатно генерировать изображения и в веб-интерфейсе», — рассказали в блоге компании.

Пока созданные Imagine with Meta картинки маркируются видимым водяным знаком, но в перспективе разработчик пообещал заменить его на невидимый — его будет генерировать ИИ, и обнаруживать его сможет тоже соответствующая модель. Такой водяной знак будет устойчив к традиционным манипуляциям с изображениями: к обрезке, изменению размера и цвета, снятию снимков экрана, сжатию, наложению шума, стикеров и многому другому, уточнили в Meta. В перспективе компания планирует внедрять такую маркировку во многие свои продукты с изображениями, созданными ИИ.

Пока служба Imagine with Meta доступна только для пользователей из США. Ранее Meta предложила пользователям Instagram и Facebook ИИ-генератор стикеров, но пользователи соцсетей начали использовать его для создания непристойностей — фильтры сервиса оказались недостаточно надёжными.

Генеративный ИИ от Google поможет McDonald's убедиться, что картошка фри свежая, и не только

McDonald’s объявил о сотрудничестве с Google для внедрения генеративного ИИ, начиная с 2024 года. Этот шаг, направленный на технологическое обновление компании, обещает радикально преобразить операционные процессы сети, предлагая клиентам лучшее качество обслуживания и более свежую пищу.

 Источник изображения: Waid1995 / Pixabay

Источник изображения: Waid1995 / Pixabay

С 2024 года McDonald’s начнёт масштабное обновление своих ресторанов, включающее установку нового оборудования и ПО, а также использование облачных сервисов Google Cloud. Эти изменения охватят тысячи заведений по всему миру. Основная цель — использование генеративного ИИ для анализа огромных объёмов данных. Это позволит оптимизировать рабочие процессы и улучшить качество обслуживания, в том числе подачу более горячей и свежей еды.

Хотя McDonald’s пока не раскрывает подробности о специфике применения ИИ, в своем заявлении компания упоминает, что новые технологии помогут менеджерам быстрее выявлять и решать проблемы в бизнес-процессах сети, а также упростят работу персонала ресторанов и создадут новые возможности для клиентов. Компания Wendy’s, также использующая Google Cloud AI, применяет аналогичный подход. Она уже тестирует систему ИИ для приёма заказов. Эти изменения могут говорить о широком внедрении автоматизации в индустрии общественного питания.

В дополнение к этим инновациям, McDonald’s также реализует новую операционную систему, которая будет синхронизировать работу мобильного приложения и киосков для самостоятельного оформления заказов. Это обновление нацелено на создание единого и интуитивно понятного пользовательского интерфейса. Компания уверена, что такой подход упростит процесс заказа для клиентов и позволит проводить более точные тесты и разрабатывать автоматизированные решения для улучшения операционной деятельности ресторанов.

«Самое большое и лучшее обновление»: ИИ-чат-бот Google Bard перевели на нейросеть Gemini, и теперь он потягается с ChatGPT

В то время как ИИ-чат-бот ChatGPT от OpenAI стал одним из самых быстрорастущих потребительских продуктов за всю историю, популярность аналогичного бота Bard от Google гораздо ниже, а его ответы редко могут конкурировать с тем, что предлагает ChatGPT и другие боты, в основе которых лежат большие языковые модели GPT-3 и GPT-4, пишет The Verge. Но теперь всё может измениться, ведь Google перевела Bard на мощнейшую нейросеть Gemini.

 Источник изображения: Google

Источник изображения: Google

Компания сообщает, что обновлённый Bard на большой языковой модели Gemini от Google с сегодняшнего дня стал доступен в 170 странах мира, но пока только лишь на английском языке. В России, Беларуси и ряде других стран ИИ-чат-бот от Google недоступен.

Google заявляет, что Gemini соответствует и даже превосходит нейросеть GPT-4 от OpenAI во многих отношениях. Сейчас Bard использует Gemini Pro, модель среднего уровня серии Gemini. Серия также включает модель Gemini Ultra — самую большую и медлительную, но наиболее функциональную, и модель Nano — наиболее лёгкую и быструю, предназначенную для работы на Android-устройствах.

Вице-президент отдела разработки голосового помощника «Google Ассистент» и чат-бота Bard Сисси Сяо (Sissie Hsiao) заявила на брифинге для прессы, что Gemini представляет собой «самое большое и лучшее обновление» для Bard. Это должно стать заметным улучшением практически всего, что Bard уже делает: обобщение, мозговой штурм, написание текстов и тому подобное, отметила она.

Гендиректор Google Сундар Пичаи (Sundar Pichai) рассказал ресурсу The Verge, что в ходе тестирования он увидел, что это не столько новая функция, сколько общее улучшение по всем направлениям. «Я думаю, люди просто обнаружат, что продукт стал намного лучше, — говорит он. — Он лучше понимает их намерения и лучше отвечает. Это более реалистично и качественно. Если вы пытаетесь работать с кодом, это лучше».

Как сообщается, Google работает над более функциональной версией чат-бота. Компания планирует выпустить в следующем году превью чат-бота Bard Advanced на базе Gemini Ultra, которая является мультимодальной ИИ-моделью, то есть помимо текста она может принимать и создавать изображения, аудио и видео.

Google представила ИИ-модель Gemini — она должна стать главным конкурентом GPT-4

Google объявила о запуске модели искусственного интеллекта Gemini, которая станет основой ИИ-функций компании и бросит вызов конкурентам, включая ChatGPT от OpenAI. По словам гендиректора Google Сундара Пичаи (Sundar Pichai), появление нового алгоритма знаменует начало новой эры искусственного интеллекта в компании.

 Источник изображений: Google

Источник изображений: Google

«Одна из самых важных особенностей этого момента в том, что вы можете работать над одной базовой технологией и улучшать её, и это сразу будет распространяться на все наши продукты», — сказал господин Пичаи.

Гендиректор Google отметил, что запуск языковой модели Gemini является огромным шагом вперёд и в конечном счёте это окажет влияние практически на все продукты компании. Gemini представляет собой нечто большее, чем одна языковая модель. Существует более лёгкая версия ИИ-модели Gemini Nano, которая предназначена для автономной работы на устройствах с Android. Кроме того, существует более мощная версия Gemini Pro, которая в будущем станет основой многих сервисов Google, а с сегодняшнего дня является основой чат-бота Bard. В дополнение к этому Google создала ИИ-модель Gemini Ultra, которая является самой мощной языковой моделью компании и в основном предназначена для использования в центрах обработки данных и интеграции с корпоративными приложениями.

На потребительский рынок компания выводит свою ИИ-модель сразу несколькими способами. Чат-бот Bard теперь работает на основе Gemini Pro, а пользователи Pixel 8 Pro получат доступ к нескольким новым функциям благодаря интеграции с Gemini Nano. Возможность использования Gemini Ultra появится в следующем году. Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud, начиная с 13 декабря. На данный момент Gemini может обрабатывать запросы на английском языке, но, очевидно, что в дальнейшем, появится поддержка других языков.

По словам Сундара Пичаи, эта ИИ-модель в конечном счёте будет интегрирована в поисковую систему Google, рекламные продукты компании, браузер Chrome и другие сервисы. Похоже, что Google, являющаяся создателем большей части основополагающих технологий, способствовавших нынешнему буму в сфере ИИ, и уже около десяти лет называвшая себя компанией, ориентированной на искусственный интеллект, готова дать отпор запущенному год назад ChatGPT, который оказался настолько хорош, что явно заставил нервничать IT-гиганта.

В рамках презентации Gemini гендиректор Google DeepMind Демис Хассабис (Demis Hassabis) рассказал, что Google провела тщательное сравнение своей языковой модели с GPT-4, наиболее актуальной версией нейросети, лежащей в основе ChatGPT. «Мы провели очень тщательный сравнительный анализ систем. Я думаю, что мы существенно опережаем конкурента по 30 из 32 показателей», — сказал Хассабис, указывая на 32 хорошо себя зарекомендовавших теста сравнения больших языковых моделей. Он также отметил, что в некоторых тестах превосходство Gemini над GPT-4 минимально, тогда как в других оно более ощутимо.

В этих тестах наиболее явным преимуществом Gemini стала способность понимать видео и аудио, а также взаимодействовать с ними. По большому счёту, Google так и задумывала, поскольку компания не создавала отдельные ИИ-модели для обработки изображений и аудио, как сделала OpenAI, создав DALL-E и Whisper. С самого начала Google работала над созданием единой модели, способной распознавать изображения и звуки. На данный момент базовые версии Gemini поддерживают ввод и вывод текста, но более мощные версии алгоритма, такие как Gemini Ultra, могут работать с изображениями, видео и аудио. Конечно, эти модели всё ещё галлюцинируют, они не лишены предубеждений и других проблем, но со временем Google планирует улучшить их понимание окружающего мира.

Несмотря на проведённые разработчиками тесты, главную проверку Gemini проведут рядовые пользователи, которые захотят использовать алгоритм для поиска информации, создания контента, написания программного кода и многого другого. В плане генерации кода алгоритм Google использует новую систему AlphaCode 2, которая, по словам представителей компании, работает лучше по сравнению с 85 % аналогами конкурентов и на 50 % лучше по сравнению с оригинальным алгоритмом AlphaCode.

Не менее важно для Google и то, что Gemini, вероятно, является максимально эффективной моделью. Она обучалась с использованием тензорных процессоров Google, благодаря чему может работать быстрее и эффективнее, чем предыдущие алгоритмы компании, такие как PaLM. Наряду с новой языковой моделью Google представила ускорители TPU v5p, которые предназначены для использования в центрах обработки данных для обучения и запуска больших языковых моделей.

Презентация Gemini даёт понять, что Google рассматривает новый алгоритм как масштабный проект и одновременно большой шаг вперёд для всей компании. Gemini — это ИИ-модель, к которой Google шла годами, возможно, даже та, которую ей следовало выпустить до того, как мир захватил ChatGPT. Google приложили массу усилий, чтобы обеспечить безопасность и надёжность Gemini, проведя внутреннее и внешнее тестирование алгоритма, но и это, по словам руководителей компании, не гарантирует, что нейросеть будет работать безошибочно.

В течение многих лет Сундар Пичаи и другие руководители Google поэтически рассуждали о потенциале искусственного интеллекта. Сам Пичаи не раз говорил, что ИИ окажет на человечество более сильное влияние, чем огонь или электричество. Первое поколение модели Gemini, скорее всего, не изменит мир. В лучшем случае она поможет компании догнать ChatGPT, но руководство Google, уверено, что это начало чего-то большего.

Google добавила в Pixel 8 Pro локальную нейросеть Gemini Nano — в будущем она станет частью Android и будет доступна всем

Сегодня Google представила Gemini, «самую функциональную и гибкую модель искусственного интеллекта, которую компания когда-либо создавала». Gemini Nano — это работающая локально версия новой большой языковой модели Google, предназначенная для того, чтобы сделать устройство умнее и быстрее без необходимости подключения к интернету. С сегодняшнего дня она работает на Pixel 8 Pro, который также получил ряд других ИИ-функций.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В зависимости от объёма используемых данных, существует три варианта Gemini — Ultra, Pro и Nano, каждый из которых оптимизирован для работы на соответствующих устройствах — от центров обработки данных до смартфонов. Pixel 8 Pro использует возможности чипа Google Tensor G3 для предоставления расширенных ИИ-функций, таких как создание выжимок из записей звука в приложении диктофона, интеллектуальные подсказки ответов в клавиатуре Gboard. В дальнейшем Google планирует использовать Bard на базе Gemini в качестве помощника на всех новых Pixel, и расширит функциональность ИИ-модели.

На данный момент процессор Google Tensor 3, похоже, единственный, который способен работать с этой моделью ИИ. Но Google также работает над тем, чтобы встроить Gemini Nano в Android в целом: компания запустила новый системный сервис под названием AICore, который разработчики могут использовать для внедрения функций Gemini в свои приложения. Последние пару лет Google говорила о своих телефонах Pixel как об устройствах с ИИ. Благодаря чипам Tensor и взаимодействию со всеми сервисами Google они со временем должны становиться лучше и умнее. С Gemini Nano это может в конечном итоге стать реальностью для многих высококлассных Android-устройств.

Помимо генеративных моделей ИИ, устройства Pixel используют и другие инструменты на основе ИИ. Эти новые функции и другие обновления для повышения производительности и настройки начнут распространяться сегодня на смартфонах, планшетах и умных часах Pixel.

Gemini Nano теперь поддерживает функцию Summarize («Подведение итогов») в приложении Recorder на Pixel 8 Pro. Пользователю даже без подключения к Сети будет доступна сводка записанных разговоров, интервью, презентаций и многого другого. Также приложение Recorder научилось расшифровывать данные на 28 новых языках.

Pixel 8 Pro при помощи Gemini Nano предложит функцию Smart Reply («Интеллектуальный ответ») в Gboard, пока только в предварительной версии для разработчиков. Модель ИИ, встроенная в устройство, пока работает только в WhatsApp, предлагая высококачественные ответы для диалога. В следующем году поддержка Smart Reply расширится.

Используя возможности Google Tensor G3, функция Video Boost на Pixel 8 Pro загружает видео для обработки в облако, где оптимизируется цвет, освещение, стабилизация и зернистость.

Функция Night Sight позволяет снимать на Pixel 8 и Pixel 8 Pro яркие и детализированные замедленные видеоролики при слабом освещении.

Функция Photo Unblur разработана специально для получения качественных изображений домашних питомцев.

Функция Pixel Clean поможет удалить пятна и складки с отсканированных документов.

Google Ассистент на телефонах Pixel Fold, Pixel 6 и новее теперь предлагает варианты контекстных ответов прямо на экране вызова. Экран вызовов теперь также доступен на Pixel Watch, это поможет игнорировать нежелательные вызовы.

В Pixel Watch появилась новая функция, которая упрощает разблокировку телефона. Теперь Pixel Watch может разблокировать телефон Pixel, если владелец находится поблизости. Функция Google AI Clear Calling поможет снизить фоновый шум и улучшить качество голоса во время видеозвонков на Pixel Tablet. А Repair Mode («Режим восстановления») обеспечит душевное спокойствие, помогая защитить и сохранить личные данные, когда устройство находится в сервисе.

ИИ-стартап xAI Илона Маска собирается привлечь до $1 млрд инвестиций

Илон Маск (Elon Musk) стоял у истоков ставшего популярным стартапа OpenAI, но в дальнейшем разорвал свои связи с этим разработчиком систем искусственного интеллекта. В этом году американский миллиардер основал компанию xAI, которая при создании своих больших языковых моделей смогла использовать массивы данных социальной сети X. На развитие бизнеса xAI собирается привлечь до $1 млрд, как стало известно на этой неделе.

 Источник изображения: Unsplash, Xu Haiwei

Источник изображения: Unsplash, Xu Haiwei

Информация поступила из официальной заявки, которую американские компании обязаны подавать регуляторам в подобных случаях. Как выясняется, xAI с момента своего основания в текущем году уже привлекла около $135 млн, но перечень инвесторов пока не раскрывается. Теперь компания намеревается привлечь около $1 млрд. В прошлом месяце Илон Маск заявил, что существующие инвесторы социальной сети X получат в капитале стартапа xAI примерно четверть акций. Подписчикам премиального сервиса X также будет открыт доступ к чат-боту Grok, который создаётся xAI с использованием данных социальной сети, ранее известной под именем Twitter.

Заинтересованность в инвестициях на направлении систем искусственного интеллекта Илон Маск странным образом совмещает с осторожным отношением к подобным технологиям. В марте он обратился к разработчикам крупнейших языковых моделей с просьбой приостановить свою деятельность.

Microsoft переведёт ИИ-помощника Copilot на флагманскую нейросеть GPT-4 Turbo

Компания Microsoft анонсировала ряд нововведений, которые получит её ИИ-помощник Copilot. В скором времени Copilot получит поддержку флагманской нейросети GPT-4 Turbo, а также обновленную модель DALL-E 3. Также помощник получит интерпретатора программного кода, а поисковик Bing обзаведётся функцией «Глубокого поиска» на базе ИИ.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Скоро Copilot сможет отвечать на запросы, используя новейшую модель GPT-4 Turbo от OpenAI, что означает, что он сможет принять больше данных благодаря контекстному окну размером 128 тыс. символов. Увеличенное контекстное окно позволит Copilot лучше понимать запросы и предлагать более качественные ответы. «В настоящее время эта модель тестируется отдельными пользователями и будет интегрирована в Copilot в ближайшие недели», – сообщил Юсуф Медхи (Yusuf Medhi), директор по потребительскому маркетингу в Microsoft.

Пока пользователи дожидаются появления модели GPT-4 Turbo в Copilot, Microsoft уже задействовала модель DALL-E 3 в Bing Image Creator и Copilot. «Теперь вы можете использовать Copilot для создания изображений, которые будут ещё более высокого качества и более точно соответствовать запросам благодаря обновлённой модели DALL-E 3», – утверждает Медхи.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft Edge, в котором есть боковая панель Copilot, также получил возможность компоновки текста на веб-сайтах, чтобы переписывать предложения в режиме реального времени. Кроме того, теперь вы можете использовать Copilot в Microsoft Edge для конспектирования видеороликов, которые вы смотрите на YouTube.

Разработчиков же может заинтересовать новая функция интерпретатора кода, которая скоро появится в Copilot. Эта новая функция позволит пользователям Copilot получать от ИИ-чат-бота более точные расчеты, анализ данных и даже код. «Copilot будет писать код для ответа на сложные запросы на естественном языке, запускать его в изолированной среде и использовать результаты для получения более качественных ответов, – поясняют в Microsoft. – Вы также сможете загружать и скачивать файлы в Copilot и из него, чтобы работать с собственными данными и кодом, а также с результатами поиска Bing».

Что касается, собственно Bing, то Microsoft добавляет в него результаты так называемого «Глубокого поиска». «Deep Search использует возможности GPT-4 для предоставления оптимизированных результатов поиска по сложным темам, — поясняет Медхи. — Активация Deep Search расширяет поисковые запросы до более полных описаний, чтобы предоставить более релевантные результаты».

«Яндекс» запустил сервис «Нейростат» для отслеживания популярности искусственного интеллекта в России

Компания «Яндекс» объявила о запуске сервиса «Нейростат», который представляет собой инструмент для оценки уровня осведомлённости и использования генеративных нейросетей на территории России. Решение предоставляет статистические данные и позволяет следить за тем, как ИИ-алгоритмы всё глубже проникают в повседневную жизнь людей.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Статистические данные «Яндекса» указывают на то, что в настоящее время 58 % россиян в возрасте от 18 до 45 летзнают о существовании алгоритмов для генерации текстов по короткому описанию. В ноябре этого года 31 % пользователей применяли такие нейросети для создания текстов, что существенно больше 23 % пользователей, которые взаимодействовали с генераторами текста в мае.

О существовании генеративных алгоритмов, способных создавать изображения и видео по текстовому описанию, осведомлены 75 % пользователей в возрасте от 18 до 45 лет. В ноябре 31 % пользователей использовали такие алгоритмы для создания изображений.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

По данным поисковой системы «Яндекса», с начала 2022 года интерес к ИИ-алгоритмам со стороны пользователей вырос более чем в 15 раз. В настоящее время слово «нейросеть» встречается в запросах так же часто, как «фитнес», «психолог» или «пиво». Для взаимодействия с нейросетями используются «промты» или «промпты» — текстовое описание задания или инструкция. Этот термин менее распространён, сейчас о нём знают 13 % пользователей текстовых нейросетей, из которых 18 % уже ими пользуются.

Meta✴ и IBM объединили силы для создания открытого Альянса ИИ

Meta и IBM присоединились к более чем 40 компаниям и организациям для создания отраслевой группы, ориентированной на разработку ИИ на основе открытого исходного кода. Эта инициатива, получившая название AI Alliance, направлена на обмен технологиями и уменьшение рисков в этой динамично развивающейся отрасли.

 Источник изображения: geralt / Pixabay

Источник изображения: geralt / Pixabay

Альянс ИИ сфокусирован на ответственном развитии технологий ИИ, что подразумевает разработку инструментов их защиты и безопасности. Согласно заявлению, группа также стремится увеличить количество открытых ИИ-моделей, контрастируя с проприетарными ИИ-системами, которые предпочитают некоторые компании. В рамках инициативы планируется разработка нового оборудования, сотрудничество с академическими кругами и исследовательскими организациями.

Приверженцы технологии ИИ с открытым исходным кодом считают этот подход более эффективным для разработки сложных систем. В последние месяцы Meta представила открытые версии своих больших языковых моделей, которые лежат в основе ИИ-чат-ботов. «Мы считаем, что разработка ИИ должна быть открытой — так большее количество людей сможет получить доступ к преимуществам, создавать инновационные продукты и работать над безопасностью», — заявил Ник Клегг (Nick Clegg), президент Meta по международным вопросам.

Помимо Meta и IBM в числе участников Альянса ИИ значатся такие технологические компании, как Oracle, AMD, Intel и Stability AI, а также академические и исследовательские учреждения, такие как Университет Нотр-Дам (UND) и Массачусетский открытый облачный Альянс (MOC Alliance). Предполагается создание управляющего совета и технического надзорного комитета для координации деятельности и разработки стандартов.

Недавние события в компании OpenAI, повлёкшие увольнение и последующее восстановление в должности генерального директора Сэма Альтмана (Sam Altman), усилили споры о необходимости прозрачности в разработке мощных ИИ-технологий. Тем не менее, OpenAI не упоминается среди участников новоиспечённого альянса.

Упомянутая инициатива может стать значительным шагом на пути к более открытому и безопасному будущему ИИ, способствуя балансу между инновациями и этическими стандартами в стремительно развивающейся сфере.

ChatGPT отучили раскрывать свои обучающие данные в ответ на просьбу вечно повторять одно слово

Просьба к ИИ-боту ChatGPT компании OpenAI повторять определённые слова «вечно» теперь помечается как нарушение условий предоставления услуг и политики в отношении контента чат-бота. Ранее стало известно, что таким незамысловатым способом можно извлекать огромные количества данных, на которых обучался чат-бот.

 Источник изображения: Rolf van Root/unsplash.com

Источник изображения: Rolf van Root/unsplash.com

Исследователи подразделения Google DeepMind и ряда университетов предложили ChatGPT 3.5-turbo повторять определённые слова «вечно». После определённого количества повторений слова, бот начинал выдавать огромные объёмы обучающих данных, взятых из интернета. Используя этот метод, исследователи смогли извлечь несколько мегабайт обучающих данных и обнаружили, что в ChatGPT включены большие объёмы личных данных, которые иногда могут быть возвращены пользователям в качестве ответов на их запросы. Как сообщил ранее ресурс arXiv, с помощью повторения слова «стихотворение» (poem), учёные добились получения от ChatGPT контактных данных реального человека, включая номер телефона и адрес электронной почты.

 Источник изображений: 404 Media

Источник изображений: 404 Media

А при просьбе к ChatGPT повторить слово «книга», он сначала повторял его несколько раз, а затем начинал выдавать случайный контент. Часть его была взята непосредственно с сайтов CNN и Goodreads, блогов WordPress, вики-сайтов Fandom, а также там были дословные выдержки из соглашений об условиях предоставления услуг, исходный код Stack Overflow, защищённые авторским правом юридические заявления об отказе от ответственности, страницы «Википедии», веб-сайт оптовой торговли казино, новостные блоги, случайные комментарии в интернете и многое другое.

«Мы показываем, что злоумышленник может извлекать гигабайты обучающих данных из языковых моделей с открытым исходным кодом, таких как Pythia или GPT-Neo, полуоткрытых моделей, таких как LLaMA или Falcon, и закрытых моделей, таких как ChatGPT», — отметили исследователи из Google DeepMind. Они сообщили, что 30 августа известили OpenAI об уязвимости и что компания её исправила. И лишь после этого исследователи сочли возможным поделиться информацией об уязвимости чат-бота с общественностью.

Как рассказал ресурс 404 Media, теперь в ответ на просьбу к ChatGPT 3.5 «вечно» повторять слово «компьютер», бот несколько десятков раз выдаёт слово «компьютер», а затем отображает сообщение об ошибке: «Этот контент может нарушать нашу политику в отношении контента или условия использования. Если вы считаете, что это ошибка, отправьте свой отзыв — ваш вклад поможет нашим исследованиям в этой области».

Meta✴ научила ИИ-модель SeamlessM4T переводить текст и речь быстрее и естественнее

Meta обновила свою ИИ-модель SeamlessM4T, предназначенную для перевода речи и текста. Теперь платформа поддерживает переводы почти на 100 языках, включая русский, в текстовом формате и на 36 — в устной речи. С новой архитектурой решения технологический гигант стремится сделать перевод более естественным и выразительным, что обещает стать прорывом в коммуникациях между людьми и производстве контента.

 Источник изображения: ***

Источник изображения: Meta

Meta построила SeamlessM4T на основе своей архитектуры многофункциональной модели UnitY на базе PyTorch, которая выполняет различные модальные переводы, а также автоматическое распознавание речи. Она использует систему BERT 2.0 для аудиокодирования, разбивая входные данные на составляющие токены для анализа, и HiFi-GAN unit vocoder для генерации голосовых ответов.

Первая из двух новых функций SeamlessM4T называется SeamlessExpressive. Как можно понять из названия, она переносит эмоциональные интонации голоса в переведённую речь. Система учитывает такие составляющие, как тон речи, её громкость, эмоциональный окрас (возбуждение, печаль или шёпот), темп речи и паузы. Всё это делает переводы менее механическими и более живыми. Поддерживаются английский, испанский, немецкий, французский, итальянский и китайский языки.

Вторая функция, SeamlessStreaming, начинает переводить речь, пока говорящий ещё не закончил предложение, что позволяет другим слушателям быстрее услышать перевод. Задержка составляет чуть менее двух секунд. По словам Meta, основной трудностью здесь было различие в структуре предложений разных языков, поэтому был разработан специальный алгоритм, который анализирует неполные аудиофрагменты и решает, достаточно ли контекста для начала генерации перевода или стоит ещё послушать говорящего.

Как и большинство предыдущих разработок Meta в области машинного перевода, будь то Llama 2, Massively Multilingual Speech (MMS), Universal Speech Translator (UST) или амбициозный проект No Language Left Behind (NLLB), SeamlessM4T находится в открытом доступе на GitHub. «Мы считаем, что SeamlessM4T является важным прорывом в стремлении сообщества ИИ к созданию универсальных многофункциональных систем», — написала команда исследователей.

Развитие компанией Meta ИИ-технологий перевода с различных языков открывает новые перспективы в области межъязыкового общения. Эти инновации могут значительно превзойти существующие решения, такие как инструменты перевода, разработанные компаниями Google и Samsung. Пока нет точной информации о сроках внедрения Meta этих функций, но их потенциальное применение, например, в умных очках Meta, обещает сделать их незаменимыми в повседневной жизни и профессиональной сфере.

Владелец TikTok запустит платформу для создания индивидуальных ИИ-чат-ботов

В минувшие выходные стало известно, что OpenAI задерживает открытие магазина приложений для индивидуальных моделей искусственного интеллекта до следующего года. Помимо создателей ChatGPT, этой темой интересуются и разработчики TikTok из китайской компании ByteDance, как сообщает издание South China Morning Post.

 Источник изображения: ByteDance

Источник изображения: ByteDance

В конце текущего месяца, как сообщает источник со ссылкой на служебную рассылку ByteDance, платформа для разработки чат-ботов будет выпущена в публичной бета-версии. Данная инициатива призвана помочь ByteDance в поиске новых продуктов, имеющих отношение к сегменту генеративного искусственного интеллекта, а также изучении возможностей их интеграции с уже существующими.

Специалисты ByteDance уже работают над созданием собственного аналога Midjourney — системы искусственного интеллекта, позволяющей создавать графические изображения по словесному описанию. Принято считать, что ByteDance во многом обязана успехом социальной сети TikTok своим рекомендательным алгоритмам, а потому наличие у китайских разработчиков серьёзных амбиций в сфере систем генеративного искусственного интеллекта интригует.

Подразумевается, что будущая платформа ByteDance позволит клиентам создавать чат-боты, адаптированные под свои конкретные нужды. Для этого от клиентов не будет требоваться наличие навыков программирования. Baidu в марте этого года запустила платформу Qianfan, которая позволяет корпоративным клиентам создавать собственные большие языковые модели и связанные с ними услуги. В октябре подобные услуги начала предлагать своим клиентам компания Alibaba Cloud. В Китае и Гонконге OpenAI до сих пор не предлагает свои услуги, как и Google, хотя Microsoft со своим Copilot сделала исключение для Гонконга.


window-new
Soft
Hard
Тренды 🔥
Graphcore, спасённая SoftBank, воспрянула духом — штат в Великобритании удвоится, а в разработку в Индии инвестируют $1 млрд 4 ч.
В наши дни все высокопроизводительные вычисления связаны с ИИ, как считает глава AMD Лиза Су 11 ч.
Производство чипов в наши дни требует атомарной точности, как утверждает Applied Materials 11 ч.
Обострение между США и Китаем грозит серьёзным ударом по мировой индустрии чипов 12 ч.
Китай грозит отправить США в рецессию — новые санкции на редкоземельные металлы ударят по ИИ 19 ч.
Акции китайских чипмейкеров взлетели, но инвесторы опасаются перегрева рынка 19 ч.
Представлен складной смартфон Samsung W26 — особенная версия Galaxy Z Fold7 для Китая за $2390–2670 22 ч.
Домашние кинотеатры Bose SoundTouch превратятся в заурядные колонки в феврале 11-10 17:31
MSI создала видеокарту GeForce RTX 5080 Gaming Trio в стиле Battlefield 6, и отдаст её кому-то бесплатно 11-10 15:54
Edifier представил беспроводную колонку, которая выглядит как геймерский ПК 11-10 15:43