Сегодня 01 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → чат-бот
Быстрый переход

ChatGPT научился читать свои ответы вслух

Компания OpenAI добавила в свой ИИ-бот ChatGPT функцию «Чтение вслух», которая озвучивает ответы на запросы пользователей с помощью одним из пяти голосов. Функция может пригодиться, например, в дороге, когда отвлечься на экран устройства для чтения ответа на запрос может оказаться невозможно. Новая функция «Чтение вслух» уже доступна как в веб-версии ChatGPT, так и в приложениях ChatGPT для iOS и Android.

 Источник изображения: Unsplash, Andrew Neel

Источник изображения: Unsplash, Andrew Neel

Функция «Чтение вслух» поддерживает 37 языков и автоматически определяет язык ответа. Она доступна как для чат-ботов на базе GPT-4, так и для GPT-3.5. Следует добавить, что аналогичные возможности для своих ИИ-моделей ранее добавила компания Anthropic, один из основных конкурентов OpenAI.

В сентябре минувшего года ChatGPT запустил функцию голосового запроса, благодаря которой пользователи могут голосом проговаривать запрос для чат-бота, не печатая его в форме. Новая же функция позволяет настроить чат-бота таким образом, чтобы он всегда устно отвечал на запросы пользователя.

Для работы функции «Чтение вслух» в мобильных приложениях необходимо нажать и удерживать поле введённого запроса. В результате откроется специальный плеер «Чтение вслух», где можно выбрать настройки воспроизведения, приостановки или перемотки аудио-ответа. В веб-версии чат-бота для активации функции «Чтение вслух» под текстом ответа отображается значок динамика.

NVIDIA представила Chat with RTX для запуска ИИ-чат-ботов локально на ПК

NVIDIA выпустила предварительную версию приложения Chat with RTX, которое позволяет запускать локально на ПК чат-бота c генеративным ИИ на основе большой языковой модели (LLM). Чат-бот способен создавать сводки и выдавать релевантные ответы на основе видеороликов и документов пользователя. Chat with RTX работает на ПК под управлением Windows с видеокартами NVIDIA GeForce RTX 30-й или 40-й серии, оснащёнными как минимум 8 Гбайт видеопамяти.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Chat with RTX умеет обрабатывать видео YouTube — достаточно просто ввести URL-адрес, чтобы получить от чат-бота краткое содержание в текстовом виде. Chat with RTX позволяет выполнять поиск по расшифровке видео. По отзывам экспертов, поиск в видеороликах занимает считанные секунды. При этом отмечены случаи, когда чат-бот по непонятной причине использовал для поиска содержание другого ролика вместо запрошенного. Это явно указывает на ошибки ранней демоверсии.

Исследователи находят Chat with RTX полезным при обработке PDF-файлов. Утверждается, что чат-бот от NVIDIA в этой задаче проявил себя лучше, чем Microsoft Copilot, без проблем извлекая ключевую информацию. Эксперты также отметили, что Chat with RTX даёт ответ практически мгновенно, без задержек, которые обычно наблюдаются при использовании облачных чат-ботов ChatGPT или Copilot. При помощи чат-бота тестировщикам удалось создать релевантный набор данных по судебному делу «FTC против Microsoft» и обобщить всю стратегию Microsoft в отношении Xbox Game Pass.

При инсталляции Chat with RTX на ПК пользователя устанавливается веб-сервер и экземпляр Python, который использует LLM Mistral или Llama 2. Тензорные ядра на графическом процессоре NVIDIA RTX применяются для ускорения обработки запросов. Установка Chat with RTX на ПК с процессором Intel Core i9-14900K и видеокартой NVIDIA GeForce RTX 4090 продолжается около 30 минут. На диске приложение занимает около 40 Гбайт, а интерпретатор Python при работе потребляет около 3 Гбайт ОЗУ. После запуска пользователь получает доступ к чат-боту через веб-интерфейс, а в командной строке отображается ход выполнения и коды ошибок.

Эксперты отмечают, что Chat with RTX пока больше всего напоминает раннюю демоверсию для разработчиков и компьютерных энтузиастов. Существует целый ряд известных проблем и ограничений. Попытка проиндексировать с помощью Chat with RTX папку с 25 000 документов привела к сбою приложения, потребовавшему сброса всех настроек для восстановления работоспособности. Кроме того, чат-бот создал файлы JSON внутри всех папок, которые индексировал, что не всегда уместно. Chat with RTX также не запоминает контекст, поэтому новый запрос не может опираться на содержание предыдущего.

Тем не менее, Chat with RTX — это хорошая техническая демонстрация возможностей и перспектив локально установленного на компьютере пользователя чат-бота с ИИ. Найдётся достаточно людей, которые не хотят для анализа личных данных использовать подписные облачные службы ИИ, такие как Copilot Pro или ChatGPT Plus.

В приложении Amazon появился Rufus — ИИ-консультант по покупкам

Amazon представила ИИ-помощника Rufus, который был обучен на огромном каталоге платформы и на информации со всего интернета. С сегодняшнего дня функция доступна небольшому числу пользователей из США, но в ближайшие недели её аудитория расширится. Чат-бот Rufus поможет в поиске товаров, их сравнении и посоветует, что купить.

 Источник изображения: aboutamazon.com

Источник изображения: aboutamazon.com

Ассистент в мобильном приложении — уже не первый ИИ-инструмент на платформе. Ранее здесь появились функции поиска подходящей одежды, сводки обзоров и отзывов, а также средства, адресованные продавцам и рекламодателям. Rufus представляет собой чат-бот, обученный на каталоге продуктов, отзывах покупателей, вопросах и ответах в сообществе и информации из интернета. Он способен отвечать на задаваемые естественным языком вопросы покупателей, связанные с их потребностями в покупках, охватывая общие рекомендации, помощь в выборе наиболее подходящего товара и уточняющие вопросы о конкретных продуктах. Общаться с ним можно так же, как с OpenAI ChatGPT и Google Bard — последний также включает интеграцию с интернет-магазинами.

Первоначально Rufus доступен в режиме бета-версии для покупателей из США в мобильном приложении Amazon, где он вызывается нажатием соответствующей кнопки в нижней навигационной панели. Закончив сеанс общения с чат-ботом, пользователь сворачивает диалоговое окно и возвращается к покупкам. Можно оценить работу Rufus или отправить на него отзыв в свободной форме. Об эффективности Rufus пока говорить преждевременно, но в конце минувшего года был представлен чат-бот Amazon Q для бизнеса, который быстро проявил склонность к «галлюцинациям» и начал раскрывать конфиденциальные данные.

Amazon тестирует ИИ-консультанта, который может придумывать сказки про жёсткие диски и не только

У некоторых пользователей приложения Amazon для iOS и Android появилась тестовая функция — основанный на искусственном интеллекте чат-бот, позволяющий задавать конкретные вопросы о продуктах. Он поддерживает и другие функции, порой выступая как развлекательный инструмент.

 Источник изображения: aboutamazon.com

Источник изображения: aboutamazon.com

Поле для ввода запроса к чат-боту появилось у некоторых пользователей мобильного приложения прямо на странице продуктов Amazon перед блоком с отзывами покупателей. Здесь можно задать системе конкретные вопросы о продукте на текущей странице, но чат-бот готов поддерживать разговоры и на отвлечённые темы. Он, например, сочинил анекдот про кардридеры, сказку на ночь про жёсткие диски и предложил кокетливое описание зимних ботинок.

А флиртовать с пользователям чат-бот Amazon отказался, хотя и создал кокетливое описание товара. «Прошу прощения, но личных чувств и кокетливого поведения я лишён», — заявил ИИ журналистам The Verge. В Amazon сообщили CNBC, что функция всё ещё тестируется — по версии издания, чат-бот не может вести беседы или отвечать на вопросы, не связанные с текущим продуктом, и это во многом так и есть. К примеру, когда на странице снегоступов у него попросили рецепт хумуса, тот сказал, что ответ генеративного ИИ недоступен. Но, например, он готов предположить, стал бы покупать себе как-то конкретный товар основатель компании Джефф Безос (Jeff Bezos) или нет.

Amazon активно внедряет функции ИИ на своей торговой площадке. Большие языковые модели помогают в создании сводок по обзорам продуктов, в обнаружении поддельных отзывов и дают рекомендации по размерам одежды. Компания также представила генератор изображений Titan. А в облачной инфраструктуре AWS доступны и модели сторонних разработчиков: Meta Llama 2, Anthropic Claude и Stable Diffusion.

OpenAI открыла GPT Store, где разработчики смогут размещать собственных чат-ботов

Вчера компания OpenAI запустила магазин чат-ботов, разработанных пользователями ChatGPT. Как отмечает Bloomberg, в общей сложности пользователи сервиса уже смогли создать 3 млн индивидуализированных чат-ботов, но не совсем ясно, какая часть из них представлена в фирменном магазине приложений на момент его запуска. Со временем разработчики чат-ботов смогут получать прибыль от их реализации на этой площадке.

 Источник изображения: Unsplash, Andrew Neel

Источник изображения: Unsplash, Andrew Neel

Как известно, для создания таких чат-ботов не требуются навыки программирования, поэтому активность разработчиков будет достаточно высокой. Площадка получила название GPT Store, она имеет развитый рубрикатор и систему поиска чат-ботов с необходимой функциональностью. Среди примеров такого «народного творчества» можно обнаружить чат-боты, которые или помогают обучать детей математике, или содержат набор рецептов разноцветных коктейлей.

На этой неделе пользователям ChatGPT был предложен новый тариф для корпоративных клиентов, который потребует ежемесячной абонентской платы в размере $25 с человека. За эти деньги небольшие компании, занимающиеся разработкой ИИ-систем, смогут использовать инфраструктуру OpenAI и её языковые модели. Тарифный план для корпоративных клиентов впервые появился у OpenAI ещё в августе прошлого года.

Возможности заработка на кастомных чат-ботах у пользователей сервиса пока нет, но она будет предложена к концу марта, как поясняет Bloomberg. Разработчики чат-ботов для GPT Store в США будут получать деньги пропорционально популярности своих разработок. Первоначально OpenAI планировала запустить такой магазин приложений в конце ноября, но скандал с отставкой и возвращением на пост генерального директора Сэма Альтмана (Sam Altman) помешал своевременной реализации этого плана. В магазине приложений новые чат-боты будут представляться каждую неделю.

OpenAI запустит интернет-магазин кастомных ИИ-чат-ботов на базе ChatGPT

На следующей неделе компания OpenAI запустит интернет-магазин, в котором пользователи смогут продавать и покупать кастомизированные версии популярного чат-бота на основе искусственного интеллекта ChatGPT, сообщил ресурс Bloomberg со ссылкой на электронные письма, отправленные компанией некоторым пользователям в четверг.

 Источник изображения: Andrew Neel/Pixabay

Источник изображения: Andrew Neel/Pixabay

OpenAI в прошлом году заявила, что планирует открыть такой интернет-магазин в ноябре. Здесь пользователи смогут размещать свои версии ИИ-чат-бота и находить адаптированные версии ChatGPT других пользователей. Пользователи смогут зарабатывать деньги, продавая свои версии чат-бота — так же, как это можно делать с приложениями в App Store или Play Маркет.

Однако запуск проекта пришлось отложить из-за неразберихи, создавшейся после внезапного увольнения в ноябре гендиректора Сэма Альтмана (Sam Altman) и последующего восстановления его на этой должности.

OpenAI объявила на конференции разработчиков в ноябре, что пользователи смогут сами создавать GPT (название пользовательских версий ChatGPT) без необходимости изучения даже основ кодирования. Эта функция позволит пользователям быстро создавать специализированные чат-боты, которые, например, могут учить детей математике или придумывать интересные рецепты коктейлей.

Google разрабатывает продвинутую версию ИИ-бота Bard, за использование которой придётся платить

Стало известно, что Google ведёт разработку продвинутой версии своего ИИ-бота Bard под названием Bard Advanced, которая будет доступна в рамках платной подписки Google One. Об этом пишет ресурс The Verge со ссылкой на разработчика Дилана Русселя (Dylan Roussel).

 Источник изображения: Google

Источник изображения: Google

По словам разработчика, в основе Bard Advanced находится ИИ-модель Gemini Ultra. Вероятно, это сделает новую версию бота более продвинутой по сравнению с текущей версией Bard, которая построена на основе языковой модели среднего уровня Gemini Pro. На одном из опубликованных разработчиком скриншотов Bard Ultra описывается как «более способная большая языковая модель с продвинутыми математическими навыками и способностями к рассуждению».

В дополнение к этому, Руссель смог обнаружить данные указывающие на то, что Google работает над новыми ИИ-инструментами. К примеру, речь идёт о функции с кодовым названием Motoko, которая позволит пользователям создавать собственных ботов. Однако на данный момент нет никаких указаний на то, как будет работать этот инструмент и будет ли он платным.

Google также может представить новую функцию на основе ИИ, которая позволит создавать более оптимизированные и расширенные запросы для чат-бота Bard. Также имеется упоминание о разработке раздела «Галерея», который должен стать источником вдохновения при работе с алгоритмом и показать, на что он способен. Ещё пользователям может быть представлен новый раздел «Задачи», в котором будет отображаться процесс выполнения более сложных задач, таких как, например, генерация изображений по текстовому описанию.

Когда именно упомянутые нововведения могут стать общедоступными, на данный момент неизвестно. Официальные представители Google воздерживаются от комментариев по данному вопросу.

Аудитория китайского аналога ChatGPT превысила 100 млн пользователей

Число пользователей чат-бота Ernie Bot на основе ИИ от Baidu, аналога ChatGPT, превысило 100 млн, пишет Reuters со ссылкой на заявление Вана Хайфэна (Wang Haifeng), технического директора китайской компании. О новом достижении Ernie Bot Хайфэн объявил в четверг на конференции разработчиков по машинному обучению в Пекине.

 Источник изображения: Baidu

Источник изображения: Baidu

Чат-бот Ernie Bot был представлен в марте этого года, и после более пяти месяцев тестирования среди отобранных пользователей, стал доступен для публики в августе.

Несмотря на то, что в марте компания в ходе презентации Ernie Bot ограничилась лишь показом видео, вызвав разочарование инвесторов, по мнению экспертов это обеспечило её преимущество первопроходца на локальном рынке, на котором с тех пор появилось множество новых игроков. Сейчас многие китайские компании разных размеров стремятся занять на новом рынке нишу, создавая собственные чат-боты на базе генеративного ИИ.

Вышедший в конце 2022 года чат-бот ChatGPT компании Open AI стал в течение полугодия самым быстрорастущим программным приложением в мире. Благодаря успеху ChatGPT рыночная стоимость OpenAI превысила более чем $80 млрд.

Гендиректор Baidu Робин Ли (Robin Li) неоднократно заявлял о высоком потенциале Ernie Bot и связанных с ним продуктов, которые помогут компании увеличить долю рынка по основным направлениям бизнеса, включая поисковые системы, облако и умные автомобили.

Согласно рейтингу, опубликованному в четверг агентством SuperCLUE, который оценивает генеративные чат-боты на базе ИИ, Ernie Bot лидирует среди китайских чат-ботов, но уступает более чем на 10 пунктов последней версии ChatGPT.

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Microsoft выпустила ИИ-помощника Copilot для устройств на Android

Компания Microsoft выпустила отдельное приложение с ИИ-помощником Copilot для платформы Android. Внутри приложения пользователям доступен чат бот, который может генерировать ответы на те или иные запросы, вести поиск в интернете, определять, что изображено на тех или иных фото, а также создавать картинки по текстовому описанию.

 Источник изображения: mspoweruser.com

Источник изображения: mspoweruser.com

Microsoft Copilot построен на языковой модели GPT-4 от OpenAI и поддерживает ИИ-генератор изображений DALL-E 3 от того же разработчика. ИИ-помощник отличается простотой в работе. При его запуске появляется окно чата, в котором можно либо ввести запрос, либо «пообщаться» с ИИ-ассистентом. Как ожидается, Microsoft Copilot для Android станет альтернативой популярному ИИ-чат-боту ChatGPT от OpenAI, приложение которого уже давно доступно на Android.

Microsoft Copilot для Android позволяет решать целый ряд задач, включая:

  • обработку черновиков писем;
  • сочинение историй или сценариев;
  • обобщение сложных и длинных текстов;
  • многоязычный перевод, корректуру и оптимизацию теста;
  • создание персонализированных маршрутов путешествий;
  • составление и обновление резюме.

Также Microsoft предлагает использовать возможность создания изображений в приложении Microsoft Copilot для Android, чтобы изучать новые стили и генерировать идеи, дополнять графикой контент в социальных сетях, разрабатывать логотипы, создавать собственные фоны, создавать и обновлять портфолио, создавать иллюстрации для книг и делать раскадровку фильмов и видео.

«ChatGPT, который знает всё о вашей жизни»: Google хочет рассказать людям историю их жизни с помощью ИИ

Проект Google с кодовым именем Ellmann позволит пользователям получить «ретроспективный взгляд» на историю их жизни. Идея заключается в том, чтобы использовать большие языковые модели, такие как Gemini, для обработки пользовательских поисковых запросов, выявления закономерностей в его фотографиях, создания индивидуального чат-бота и «ответов на ранее невозможные вопросы» о жизни человека. Команда также продемонстрировала «Чат Ellmann» с многообещающим и пугающим описанием: «Представьте, что вы открываете ChatGPT, а он уже знает всё о вашей жизни».

 Источник изображения: Google

Источник изображения: Google

Команда Google предложила использовать технологию искусственного интеллекта для создания картины жизни пользователей «в ретроспективе», используя данные мобильного телефона, такие как фотографии и поисковые запросы. Пока неясно, планирует ли компания внедрить эти возможности в «Google Фото» или в какой-либо другой свой продукт.

Проект Ellmann, названный в честь биографа и литературного критика Ричарда Дэвида Эллманна (Richard David Ellmann), предполагает использование LLM, таких как Gemini, для обработки результатов поиска, выявления закономерностей в фотографиях пользователя, создания чат-бота и «ответов на ранее невозможные вопросы», говорится в копии презентации Google. Цель проекта, как поясняется в презентации, — создать «Рассказчика истории вашей жизни».

Менеджер по продуктам «Google Фото» представил проект Ellmann вместе с командами Gemini на недавнем внутреннем саммите. Команды потратили несколько месяцев на то, чтобы определить, что большие языковые модели являются идеальной технологией для того, чтобы сделать этот подход к истории ретроспективного описания жизни реальностью.

Ellmann может использовать контекст биографии, предыдущих и последующих фотографий, чтобы описать конкретные фотографии пользователя более глубоко, чем «просто пиксели с ярлыками и метаданными», говорится в презентации. Он предлагает определять ряд моментов, таких как университетские годы, годы жизни в каком-то определённом месте и годы жизни в качестве родителя.

«Мы не сможем ответить на сложные вопросы или рассказать хорошую историю, не имея представления о вашей жизни в вашем же прошлом», — говорится в одном из описаний к фотографии маленького мальчика, играющего с собакой в грязи.

«Мы просматриваем ваши фотографии, изучаем их метки и местоположение, чтобы определить значимый момент, — говорится на слайде презентации. — Когда мы оглядываемся назад и понимаем вашу жизнь во всей её полноте, становится понятна ваша история жизни». В презентации отмечается, что большие языковые модели могут определять такие моменты, как рождение ребенка пользователя. «Эта LLM может использовать знания из более высоких частей дерева, чтобы сделать вывод о том, что это рождение Джека и что он первый и единственный ребенок Джеймса и Джеммы».

«Одна из причин, по которой LLM настолько эффективен для такого подхода ретроспективного анализа, заключается в том, что он может брать неструктурированный контекст с разных ветвей дерева модели и использовать его для улучшения понимания других областей дерева», — поясняется на слайде, сопровождающемся иллюстрацией различных жизненных «моментов» и «глав» из жизни пользователя.

Кроме того, команда проекта описала суть Ellmann следующей фразой: «Представьте, что вы открываете ChatGPT, а он уже знает всё о вашей жизни. О чём бы вы его спросили?». Далее команда показала пример чата, в котором пользователь спрашивает: «Есть ли у меня домашнее животное?». На что чат отвечает, что да, у пользователя есть собака, которая носит красный дождевик, затем предлагает имя собаки и имена двух членов семьи, с которыми питомец чаще всего проводит время.

Ellmann также представил краткую информацию о привычках пользователя в еде. «Похоже, вам нравится итальянская кухня. Здесь есть несколько фотографий блюд из пасты, а также фотография пиццы». В сообщении также говорилось, что пользователю, похоже, нравится новая еда, потому что на одной из его фотографий было меню с нераспознанным блюдом. Технология также определила, какие товары пользователь собирался приобрести, его интересы, работу и планы на путешествия, основываясь на скриншотах пользователя, говорится в презентации. Технология сможет узнать любимые сайты и приложения пользователей, приводя в пример Google Docs, Reddit и Instagram.

Представитель Google предоставил следующий комментарий: «В "Google Фото" всегда использовался искусственный интеллект для поиска фотографий и видео, и мы рады тому, что LLM могут открыть ещё более полезные возможности. Это было раннее внутреннее исследование, и, как всегда, если мы решим выпустить новые функции, мы потратим время, необходимое для того, чтобы убедиться, что они полезны для людей и разработаны с учётом защиты конфиденциальности и безопасности пользователей, что является нашим главным приоритетом».

Предлагаемый проект Ellmann может помочь Google в гонке вооружений между технологическими гигантами по созданию более персонализированных «воспоминаний» о жизни. Google Photos и Apple Photos уже много лет предлагают пользователям «воспоминания» и создают альбомы на основе тенденций в фотографиях.

В ноябре Google объявила, что с помощью искусственного интеллекта «Google Фото» теперь может группировать похожие фотографии и организовывать скриншоты в легко находимые альбомы.

Такие корпорации бигтеха, как Google, Facebook и Apple, со временем добавили элементы управления для минимизации нежелательных «воспоминаний», но пользователи сообщают, что иногда они всё равно появляются и требуют переключения нескольких настроек, чтобы минимизировать «неприятные воспоминания».

Первое знакомство с революционной нейросетью Google Gemini разочаровало пользователей

Вчера компания Google представила флагманскую большую языковую модель искусственного интеллекта (ИИ) Gemini. Нейросеть предназначена для целого ряда продуктов и сервисов, включая ИИ-чат-бота Bard, конкурента ChatGPT. Однако большинство пользователей, успевших протестировать обновлённый Bard на свежей нейросети, остались недовольны результатами.

 Источник изображения: Google

Источник изображения: Google

В своих блогах и материалах для прессы Google превозносит превосходную архитектуру и возможности Gemini, утверждая, что данная модель соответствует или даже превосходит по производительности другие ведущие модели генеративного ИИ, такие как GPT-4 от OpenAI. Однако первый опыт взаимодействия некоторых пользователей свидетельствует об обратном.

Так, вчера Bard получил апгрейд в виде «облегчённой» версии модели под названием Gemini Pro. Пользователи сразу начали высказывать своё недовольство обновлением на страницах социальной сети X (бывший Twitter). К примеру, чат-бот не смог правильно предоставить простые факты, например, победителей премии «Оскар» 2023 года. При этом Gemini Pro неверно утверждает, что в прошлом году лучшим актёром стал Брендон Глисон (Brendan Gleeson), в то время как фактически победителем был Брендан Фрейзер (Brendan Fraser). При попытках пользователей задать этот же вопрос, можно в результате получить другой неправильный ответ.

 Источник изображения: Google

Источник изображения: Google

Похожая ситуация с вопросами касательно лучших фильмов: «На западном фронте без перемен» стал лучшим международным фильмом по мнению модели, «Говорят женщины» стал лучшим адаптированным сценарием, а «Пиноккио» — лучшим анимационным фильмом. Модель во всех этих примерах выдала некорректные ответы.

Кроме того, Bard на базе Gemini продемонстрировал плохую производительность при переводах. К примеру, при попытках пользователей запросить у модели слово на французском языке, состоящее из 6 букв, Gemini выдаёт вариант из 7 букв.

 Источник изображения: Google

Источник изображения: Google

А как насчёт обобщения новостей? Gemini Pro, имея в своём распоряжении «Google Поиск» и «Google Новости», очевидно, может предоставить краткий обзор новостей. Как бы не так. Похоже, Gemini Pro не желает комментировать потенциально спорные темы новостей, предлагая пользователям... погуглить самим. При этом конкурент от OpenAI ChatGPT, напротив, легко справляется с этой задачей, предоставляя краткое изложение со ссылками на новостные статьи. Хотя доступна эта функция лишь платным подписчикам — бесплатная версия ChatGPT не подключена к интернету.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как и все генеративные модели ИИ, Gemini Pro не застрахован от «взлома», то есть от запросов, которые обходят защитные фильтры, пытающиеся предотвратить обсуждение спорных тем. Используя автоматизированный метод алгоритмического изменения контекста подсказок до тех пор, пока защитные фильтры Gemini Pro не перестанут работать, исследователи ИИ-безопасности из стартапа Robust Intelligence, продающего инструменты для аудита моделей, смогли заставить Gemini Pro предложить способы аморальных действий, например, кражи у благотворительной организации.

Следует отметить, что Gemini Pro на текущий момент не является самой способной версией Gemini. Более продвинутая версия — Gemini Ultra — должна появиться на рынке в следующем году, в ИИ-чат-боте Bard и других продуктах. Поэтому сейчас Google сравнивает Gemini Pro с моделью конкурента GPT-3.5, которой уже около года, а не с последней версией GPT-4.

Тем не менее, Google пообещала, что Gemini Pro улучшит рассуждения, планирование и понимание по сравнению с предыдущей моделью, используемой в Bard, и заявила, что Gemini Pro лучше справляется с обобщением контента, мозговым штурмом и написанием текста. Пока что этого не видно.

«Самое большое и лучшее обновление»: ИИ-чат-бот Google Bard перевели на нейросеть Gemini, и теперь он потягается с ChatGPT

В то время как ИИ-чат-бот ChatGPT от OpenAI стал одним из самых быстрорастущих потребительских продуктов за всю историю, популярность аналогичного бота Bard от Google гораздо ниже, а его ответы редко могут конкурировать с тем, что предлагает ChatGPT и другие боты, в основе которых лежат большие языковые модели GPT-3 и GPT-4, пишет The Verge. Но теперь всё может измениться, ведь Google перевела Bard на мощнейшую нейросеть Gemini.

 Источник изображения: Google

Источник изображения: Google

Компания сообщает, что обновлённый Bard на большой языковой модели Gemini от Google с сегодняшнего дня стал доступен в 170 странах мира, но пока только лишь на английском языке. В России, Беларуси и ряде других стран ИИ-чат-бот от Google недоступен.

Google заявляет, что Gemini соответствует и даже превосходит нейросеть GPT-4 от OpenAI во многих отношениях. Сейчас Bard использует Gemini Pro, модель среднего уровня серии Gemini. Серия также включает модель Gemini Ultra — самую большую и медлительную, но наиболее функциональную, и модель Nano — наиболее лёгкую и быструю, предназначенную для работы на Android-устройствах.

Вице-президент отдела разработки голосового помощника «Google Ассистент» и чат-бота Bard Сисси Сяо (Sissie Hsiao) заявила на брифинге для прессы, что Gemini представляет собой «самое большое и лучшее обновление» для Bard. Это должно стать заметным улучшением практически всего, что Bard уже делает: обобщение, мозговой штурм, написание текстов и тому подобное, отметила она.

Гендиректор Google Сундар Пичаи (Sundar Pichai) рассказал ресурсу The Verge, что в ходе тестирования он увидел, что это не столько новая функция, сколько общее улучшение по всем направлениям. «Я думаю, люди просто обнаружат, что продукт стал намного лучше, — говорит он. — Он лучше понимает их намерения и лучше отвечает. Это более реалистично и качественно. Если вы пытаетесь работать с кодом, это лучше».

Как сообщается, Google работает над более функциональной версией чат-бота. Компания планирует выпустить в следующем году превью чат-бота Bard Advanced на базе Gemini Ultra, которая является мультимодальной ИИ-моделью, то есть помимо текста она может принимать и создавать изображения, аудио и видео.

ChatGPT отучили раскрывать свои обучающие данные в ответ на просьбу вечно повторять одно слово

Просьба к ИИ-боту ChatGPT компании OpenAI повторять определённые слова «вечно» теперь помечается как нарушение условий предоставления услуг и политики в отношении контента чат-бота. Ранее стало известно, что таким незамысловатым способом можно извлекать огромные количества данных, на которых обучался чат-бот.

 Источник изображения: Rolf van Root/unsplash.com

Источник изображения: Rolf van Root/unsplash.com

Исследователи подразделения Google DeepMind и ряда университетов предложили ChatGPT 3.5-turbo повторять определённые слова «вечно». После определённого количества повторений слова, бот начинал выдавать огромные объёмы обучающих данных, взятых из интернета. Используя этот метод, исследователи смогли извлечь несколько мегабайт обучающих данных и обнаружили, что в ChatGPT включены большие объёмы личных данных, которые иногда могут быть возвращены пользователям в качестве ответов на их запросы. Как сообщил ранее ресурс arXiv, с помощью повторения слова «стихотворение» (poem), учёные добились получения от ChatGPT контактных данных реального человека, включая номер телефона и адрес электронной почты.

 Источник изображений: 404 Media

Источник изображений: 404 Media

А при просьбе к ChatGPT повторить слово «книга», он сначала повторял его несколько раз, а затем начинал выдавать случайный контент. Часть его была взята непосредственно с сайтов CNN и Goodreads, блогов WordPress, вики-сайтов Fandom, а также там были дословные выдержки из соглашений об условиях предоставления услуг, исходный код Stack Overflow, защищённые авторским правом юридические заявления об отказе от ответственности, страницы «Википедии», веб-сайт оптовой торговли казино, новостные блоги, случайные комментарии в интернете и многое другое.

«Мы показываем, что злоумышленник может извлекать гигабайты обучающих данных из языковых моделей с открытым исходным кодом, таких как Pythia или GPT-Neo, полуоткрытых моделей, таких как LLaMA или Falcon, и закрытых моделей, таких как ChatGPT», — отметили исследователи из Google DeepMind. Они сообщили, что 30 августа известили OpenAI об уязвимости и что компания её исправила. И лишь после этого исследователи сочли возможным поделиться информацией об уязвимости чат-бота с общественностью.

Как рассказал ресурс 404 Media, теперь в ответ на просьбу к ChatGPT 3.5 «вечно» повторять слово «компьютер», бот несколько десятков раз выдаёт слово «компьютер», а затем отображает сообщение об ошибке: «Этот контент может нарушать нашу политику в отношении контента или условия использования. Если вы считаете, что это ошибка, отправьте свой отзыв — ваш вклад поможет нашим исследованиям в этой области».

Владелец TikTok запустит платформу для создания индивидуальных ИИ-чат-ботов

В минувшие выходные стало известно, что OpenAI задерживает открытие магазина приложений для индивидуальных моделей искусственного интеллекта до следующего года. Помимо создателей ChatGPT, этой темой интересуются и разработчики TikTok из китайской компании ByteDance, как сообщает издание South China Morning Post.

 Источник изображения: ByteDance

Источник изображения: ByteDance

В конце текущего месяца, как сообщает источник со ссылкой на служебную рассылку ByteDance, платформа для разработки чат-ботов будет выпущена в публичной бета-версии. Данная инициатива призвана помочь ByteDance в поиске новых продуктов, имеющих отношение к сегменту генеративного искусственного интеллекта, а также изучении возможностей их интеграции с уже существующими.

Специалисты ByteDance уже работают над созданием собственного аналога Midjourney — системы искусственного интеллекта, позволяющей создавать графические изображения по словесному описанию. Принято считать, что ByteDance во многом обязана успехом социальной сети TikTok своим рекомендательным алгоритмам, а потому наличие у китайских разработчиков серьёзных амбиций в сфере систем генеративного искусственного интеллекта интригует.

Подразумевается, что будущая платформа ByteDance позволит клиентам создавать чат-боты, адаптированные под свои конкретные нужды. Для этого от клиентов не будет требоваться наличие навыков программирования. Baidu в марте этого года запустила платформу Qianfan, которая позволяет корпоративным клиентам создавать собственные большие языковые модели и связанные с ними услуги. В октябре подобные услуги начала предлагать своим клиентам компания Alibaba Cloud. В Китае и Гонконге OpenAI до сих пор не предлагает свои услуги, как и Google, хотя Microsoft со своим Copilot сделала исключение для Гонконга.


window-new
Soft
Hard
Тренды 🔥
Владелец Ticketmaster подтвердил утечку данных 560 млн пользователей спустя 11 дней 3 ч.
В Telegram добавили сообщения с анимированными эффектами, глобальные хештеги и другие нововведения 4 ч.
Anthropic позволит создавать персональных помощников на базе ИИ-чат-бота Claude 6 ч.
ElevenLabs запустила ИИ-генератор звуковых эффектов по текстовому описанию 6 ч.
Новая статья: Songs of Conquest — песнь величия. Рецензия 17 ч.
В ранний доступ Steam ворвался олдскульный шутер Selaco на движке классических Doom — с перестрелками и умными врагами в духе F.E.A.R. 20 ч.
Warhorse официально подтвердила перевод на русский язык в Kingdom Come: Deliverance 2 21 ч.
Perplexity AI превратит поисковую выдачу в веб-страницу, которой удобно делиться с другими 21 ч.
Google добавила редактирование RCS-сообщений и другие полезные функции в Android 22 ч.
Эндгейм подкрался незаметно: авторы перспективного «дьяблоида» Wolcen: Lords of Mayhem решили забросить разработку всего через четыре года после релиза 22 ч.
Наелся завтраками: японский миллиардер отменил круиз вокруг Луны на корабле Starship 6 мин.
Vivo оккупировала значительную часть майского рейтинга производительности AnTuTu 56 мин.
Игровой монитор Xiaomi G Pro 27i на панели Mini LED с 1152 зонами затенения выйдет на мировой рынок 59 мин.
Starlink хочет открыть для пользователей спутниковую сотовую связь уже осенью 3 ч.
Новые спутники Starlink могут уничтожить радиоастрономию на Земле, предупреждают учёные 5 ч.
Корейский профсоюз Samsung объявил забастовку, но на производство и поставки памяти это не повлияет 6 ч.
Последний «дружественный» поставщик VSAT-оборудования Gilat Satellite Networks приостановил работу в РФ 6 ч.
Samsung проиграла Huawei и больше не первая по продажам складных смартфонов в мире 6 ч.
Минцифры предлагает выдавать льготные кредиты для строительства ЦОД 6 ч.
Госархив РФ построит в Калужской области дата-центр за 1 млрд руб., оснастив его российскими серверами и СХД Depo 6 ч.