Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → chatgpt
Быстрый переход

OpenAI для обучения GPT-4 расшифровала миллионы видео с YouTube — текстов в интернете не хватило. Google тоже так делает

Несколько дней назад сообщалось, что разработчики ИИ столкнулись с нехваткой данных для обучения передовых моделей, в том числе о планах Open AI обучать GPT-5 на видео с YouTube. Согласно материалу The New York Times, в погоне за новыми данными корпорации забывают об этике и морали.

 Источник изображения: freepik.com

Источник изображения: freepik.com

К концу 2021 года OpenAI столкнулась с нехваткой авторитетных англоязычных текстов в интернете для обучения новейшей модели искусственного интеллекта — ей требовалось гораздо больше данных. Тогда разработчики OpenAI создали расшифровывающую аудиозаписи из видеороликов на YouTube систему распознавания речи Whisper, которая выдаёт текст для обучения ИИ. По словам нескольких сотрудников, в компании понимали, что такой шаг может противоречить правилам использования YouTube, запрещающим использовать видеоролики «независимо» от платформы. Это не остановило OpenAI, расшифровавшую более миллиона часов видеороликов с YouTube. Полученный текст использовался для обучения GPT-4 — одной из мощнейших систем искусственного интеллекта в основе последней версии ChatGPT. В исследовании The New York Times говорится, что в гонку за данными включились все передовые разработчики ИИ, включая OpenAI, Google и Meta, причём компании зачастую игнорируют корпоративные политики, а иногда и закон.

Разработчики ИИ всё сильнее упираются в нехватку материала. Передовые чат-боты обучались на массивах цифровых текстов объёмом до трёх триллионов слов, что примерно вдвое больше объёма материалов в Бодлианской библиотеке Оксфордского университета, в том числе датирующихся ещё 1602 годом. Наибольшую ценность для обучения ИИ представляют высококачественные данные из отредактированных профессионалами книг и статей. По данным исследовательского института Epoch, такие тексты могут закончиться уже в 2026 году.

«Единственный практический способ существования таких инструментов — обучение на огромных массивах информации без разрешения её создателей. Объём необходимых данных настолько велик, что не поможет даже коллективное лицензирование», — говорит представляющий интересы венчурной компании Andreessen Horowitz Сай Дамле (Sy Damle).

OpenAI, Google и Meta не скрывают, что их модели ИИ обучаются на открытых данных, однако не все создатели соответствующего контента приветствуют данную инициативу, что уже стало причиной множества судебных разбирательств. В прошлом сама The New York Times подавала в суд на OpenAI и Microsoft за то, что компании обучали чат-ботов на защищённых авторским правом материалах без разрешения владельцев. Тогда Microsoft и OpenAI заявили, что «добросовестно используют» материалы для создания собственных работ, что не запрещено законом об авторском праве.

 Джаред Каплан. Источник: physics-astronomy.jhu.edu

Джаред Каплан. Источник: physics-astronomy.jhu.edu

В январе 2020 года физик-теоретик из Университета Джонса Хопкинса Джаред Каплан (Jared Kaplan) опубликовал работу об ИИ, которая разожгла аппетиты их разработчиков. Он высказался однозначно: чем больше данных используется для обучения языковой модели, тем лучше она работает, подобно тому, как студенты получают всё больше знаний из прочитанных книг. Языковые модели могут устанавливать закономерности и взаимосвязи, что позволяет точнее обрабатывать новую информацию.

«Все сильно удивились, что эти тенденции, или законы масштабирования, как мы их называем, не менее точны, чем физические и астрономические», — говорит ныне работающий в Anthropic Каплан.

Разработчики ИИ уже давно используют огромные массивы публичных цифровых данных, в том числе статьи из «Википедии» и Common Crawl — базы данных из более чем 250 млрд интернет-страниц, собранных с 2007 года. Прежде чем «скормить» эти данные ИИ, их тщательно фильтровали на предмет «нежелательных» материалов. Объёмы необходимых для обучения ИИ в 2020 году данных сейчас кажутся смешными, ведь тогда массив из 30 тысяч картинок с Flickr казался огромным.

Создание вышедшей в ноябре 2020 года GPT-3 ознаменовало начало эры погони за новыми данными — модель обучали на 300 млрд «токенов», представляющих отдельные слова или их фрагменты. Обучившись на этих данных, система генерировала посты в блогах, стихи и даже писала программы. В 2022 году подразделение Google Deepmind протестировало 400 ИИ-моделей, меняя объём данных для обучения и другие факторы. Оказалось, что Каплан прав, и чем больше входящих данных, тем лучше работает ИИ. Гонка продолжается: в 2023 году китайцы представили обученную ни 3,2 триллионах английских и китайских лексем модель Skywork, а PaLM 2 от Google «поглотила» 3,6 триллиона токенов.

 Сэм Альтман. Источник изображения: wikipedia.org

Сэм Альтман. Источник изображения: wikipedia.org

Позднее Сэм Альтман (Sam Altman) из OpenAI заявил, что данные рано или поздно кончатся — он знает, о чём говорит, ведь компания годами собирала данные, обрабатывала и обучали на них ИИ. Среди использованных данных был программный код с GitHub, базы данных шахматных ходов, школьные тесты и домашние задания старшеклассников. К концу 2021 года они закончились. Помимо расшифровки аудио- и видеоматериалов, рассматривалась покупка компаний, имеющих доступ к огромным объёмам цифровых данных.

Некоторые сотрудники Google знали, что OpenAI расшифровывает видео с YouTube, но бездействовали, потому что этим же занималась сама Google, а это потенциально нарушало авторские права создателей видеороликов. Подняв шумиху вокруг OpenAI, Google рискует привлечь общественное внимание и к своим разработкам. Впрочем, представители Google говорят, что правила использования сервиса позволяют использовать данные YouTube для разработки новых функций видеоплатформы. Специализирующийся на интеллектуальной собственности юрист Berger Singerman Джеффри Лоттенберг (Geoffrey Lottenberg) отмечает, что в своих правилах Google использует крайне расплывчатые формулировки. И это сделано намеренно.

Google хотела обучать свои модели на открытых данных Google Docs, Google Sheets и других продуктов. В политике конфиденциальности Google говорилось, что компания может использовать публичные данные для обучения языковых моделей Google и других продуктов вроде Google Translate. Теперь же перечень продуктов помимо Google Translate содержит упоминания Bard и «облачных ИИ». Сотрудников компании специально проинструктировали выпустить новую редакцию политики конфиденциальности перед Днём независимости США, когда мысли людей заняты предстоящими праздниками.

 Марк Цукерберг. Источник изображения: профиль в ***

Марк Цукерберг. Источник изображения: профиль в Facebook

Глава Meta Марк Цукерберг (Mark Zuckerberg) годами развивал ИИ-направление, но выход ChatGPT в конце 2022 года оставил его компанию далеко позади. Трое бывших и нынешних сотрудников Meta рассказали, что стремясь догнать OpenAI, он день и ночь донимал менеджеров и ведущих инженеров, чтобы те как можно скорее выпустили конкурирующий продукт. Но как и все остальные, Meta упёрлась лбом в стену нехватки данных.

По словам вице-президента по генеративным ИИ Ахмада Аль-Дахле (Ahmad Al-Dahle), его команда использовала почти все доступные англоязычные книги, эссе, поэмы и новостные статьи в интернете для обучения собственной ИИ-модели. В конце концов, Аль-Дахле заявил, что Meta не превзойти ChatGPT без большего количества данных. К марту-апрелю 2023 года руководство Meta обсуждало эту проблему почти ежедневно. В частности, высказывалось предложение платить по $10 за полное лицензирование каждой книги или приобрести издательство Simon & Schuster, сотрудничающее со множеством авторов, среди которых, например, Стивен Кинг. Обсуждалась и возможность использования интернет-материалов без разрешения авторов, несмотря на возможные нарушения законов об авторском праве. Цукерберг требовал решить проблему немедленно, но инженеры компании заявили, что это невозможно.

 Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

На одном из записанных совещаний руководства Meta говорилось, что компания наняла субподрядчиков из Африки для сбора защищённых авторским правом материалов. «Мы не можем не собирать их», — сказали на одном из таких совещаний. Кроме того, подчёркивалось, что OpenAI тоже не стесняется использовать защищённые авторским правом материалы без разрешения их владельцев, и получать эти разрешения «слишком долго».

Сэм Альтман предложил решить проблему с помощью «синтетических данных», то есть обучать языковые модели на материалах других языковых моделей. По его словам, раз уж ИИ научились писать человекоподобные тексты, последние можно использовать для дальнейшего развития LLM, что к тому же позволит снизить зависимость от защищённых законом авторских произведений. «Пока ваши модели достаточно продвинуты, чтобы создавать качественные синтетические данные, всё нормально», — сказал Альтман. Однако обучение на данных других ИИ тоже не панацея — большие языковые модели могут попасть в цикл обработки ошибочных данных и недостатков технологии, которые будут нарастать на каждом его витке.

«Обучать ИИ — всё равно что пробираться через джунгли. Если обучать ИИ на одних лишь синтетических данных, они заблудятся», — сказал по этому поводу бывший исследователь в OpenAI, а ныне преподаватель компьютерных наук в Университете Британской Колумбии Джефф Клун (Jeff Clune).

В Google Books появились книги сомнительного качества, написанные ИИ

Эмануэль Майберг (Emanuel Maiberg) из 404Media провёл нехитрое исследование и обнаружил, что Google Books индексирует сгенерированные ИИ книги, при том довольно плохого качества. Для их поиска он использовал характерную для сгенерированных ИИ ответов фразу «As of my last knowledge update» («По последним данным из моей базы знаний»), и результаты его удивили, хотя ранее он уже находил написанные с использованием ИИ книги на Amazon и Google Play.

 Источник изображения: freepik.com

Источник изображения: freepik.com

Большинство книг с этой фразой на первых восьми страницах выдачи оказались не связаны с темой ИИ, для которой она была бы уместной. В качестве примера Майберг приводит книгу «Медведи, быки и волки: биржевая торговля для 20-летних» (Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old), которую автор позиционирует как «всеобъемлющее руководство для новичков, стремящихся раскрыть тайны финансовых рынков». Своим содержанием она напомнила сгенерированный ChatGPT текст с поверхностным анализом сложных событий, на уровне «Википедии».

В других рассмотренных Майбергом книгах содержались откровенно устаревшие, бесполезные читателю в 2024 году сведения, которые скорее всего были почерпнуты ChatGPT из своей «базы знаний». Он приводит в пример вышедшую в марте 2024 года книгу «Максимум от Twitter: Стратегии успешного продвижения для новичков» (Maximize Your Twitter Presence: 101 Strategies for Marketing Success) Шу Чен Хоу (Shu Chen Hou). Как и в случае со множеством подобных авторов, на его счету числится не один десяток книг. В конце многостраничного раздела о верификации учётной записи в Twitter (ныне X) Майберг обнаружил строки: «Насколько мне известно на сентябрь 2021 года Twitter находилась в процессе переоценки и обновления критериев и процесса верификации, поэтому необходимые шаги могли измениться». В 2022 году Twitter приобрёл Илон Маск и превратил верификацию в торговлю «галочками».

«Не могу поверить, что в компании не знают, что ищут пользователи в Google Books. Они индексируют всё подряд, но мне хотелось бы верить, что они могут распознать сгенерированные ИИ материалы, и они оказали бы себе и пользователям огромную услугу, если их промаркировали», — прокомментировал открытия Майберга библиотекарь, консультант и редактор infoDOCKET.

Отдельное беспокойство Майберга вызывает возможное влияние таких книг на Google Ngram — профессиональный инструмент, оценивающий частоту вхождения фраз и отдельных слов в проиндексированных книгах с 1500 по 2019 годы. Он интересен тем, что учёные и исследователи используют его для оценки культурных тенденций. Соответственно, распространение написанных ИИ книг может заметно исказить результаты анализа с использованием Google Ngram. Однако представитель Google отрицает влияние сгенерированных книг на Google Ngram:

«Наши автоматизированные алгоритмы настроены на поиск релевантных высококачественных книг. Указанные вами книги найдены по необычному и очень специфичному запросу, и не влияют на результаты Ngram. Мы стремимся, чтобы Ngram оставался высококачественным инструментом и продолжим адаптировать его по мере развития индустрии книгоиздания».

«Ngram уже сейчас даёт довольно неточные данные, чтобы на них могли опираться вычислительные социологи и лингвисты, а через несколько лет он, вероятно, и вовсе потеряет значимость, — прокомментировала Алекс Ханна (Alex Hanna), директор по исследованиям Distributed AI Research Institute (DAIR). — Это ещё один пример того, как искусственный интеллект начинает поглощать сам себя. Созданный им контент попадает в Google Books, а затем Google начинает тренировать на его основе собственные модели. Да, они скажут, что тщательно контролируют качество, но детали они, конечно, не раскроют».

Без регистрации и SMS: для работы с ChatGPT больше не нужна учётная запись

Теперь для доступа к бесплатной версии популярного чат-бота с искусственным интеллектом ChatGPT не потребуется заводить учётную запись. Впрочем, это не относится к платным продуктам OpenAI вроде DALL-E 3 или более продвинутой версии ChatGPT Plus.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Учётная запись по-прежнему нужна не только для генератора изображений DALL-E, но и для доступных ограниченному кругу пользователей и партнёров продуктов OpenAI, таких как платформа для генерации видеороликов Sora или недавно анонсированный ИИ VoiceEngine. Также для использования платной версии ChatGPT на базе нейросети GPT-4 потребуется завести аккаунт.

Чат-бот доступен через chatgpt.com и пока работает только в США. OpenAI подчеркнула, что незарегистрированные пользователи также смогут отказаться от использования передаваемых ими чат-боту данных для обучения ИИ. Чтобы обезопасить себя и пользователей от возможных проблем, OpenAI ввела «дополнительные меры защиты », включающие блокировку запросов «на самые разные [запретные] темы », список которых не приводится.

По словам OpenAI, еженедельно ChatGPT пользуются более 100 миллионов человек в 185 странах. Сервис по отслеживанию трафика SimilarWeb сообщает о 1,6 млрд посетителей лишь за февраль 2024 года, что делает ChatGPT популярнейшем чат-ботом в мире. Хотя на пятки ему наступает Gemini от Google, месячное количество уникальных посетителей которого в мае прошлого года предположительно достигало 1,8 млрд.

Для обучения GPT-5 не хватит качественных данных из всего интернета

Разработчики передовых моделей искусственного интеллекта столкнулись с неожиданной проблемой — нехваткой качественного материала для их обучения. Ситуация усугубляется тем, что некоторые ресурсы блокируют доступ ИИ к своим данным. По словам исследователей, попытки обучать ИИ на материалах других моделей и прочем «синтетическом контенте» могут обернуться «большими проблемами».

 Источник изображения: Steve Johnson / unsplash.com

Источник изображения: Steve Johnson / unsplash.com

Учёные и руководители компаний-разработчиков ИИ обеспокоены, что в ближайшие два года качественных текстов может не хватить для дальнейшего обучения больших языковых моделей (LLM), что замедлит развитие отрасли. Разрабатывающая ChatGPT компания OpenAI уже рассматривает возможность обучения GPT-5 на транскрипциях публичных роликов на YouTube.

Языковые модели ИИ собирают тексты из интернета — научные исследования, новости, статьи из «Википедии» — и разбивают их на отдельные слова или их части, используя их, чтобы научиться отвечать как человек. Чем больше входящих данных, тем лучше результат — именно на это уповала OpenAI, что помогло ей стать одним из лидеров отрасли. По словам изучающего искусственный интеллект в Исследовательском институте Epoch Пабло Вильялобоса (Pablo Villalobos), GPT-4 обучался на 12 триллионах токенов данных, а в соответствии с законами масштабирования Шиншиллы, ИИ вроде GPT-5 потребуется 60–100 триллионов токенов. Если собрать все высококачественные текстовые и графические данные в интернете, для обучения GPT-5 не хватит от 10 до 20 триллионов токенов, а может и больше — и пока непонятно, где их взять. Два года назад Вильялобос и другие исследователи уже предупреждали, что к середине 2024 года с вероятностью 50 % ИИ уже не будет хватать данных для обучения, к 2026 — с вероятностью 90 %.

По словам учёных, большинство данных в интернете непригодно для обучения ИИ, поскольку содержит бессвязный текст или не добавляет новой информации к уже имеющейся. Для этой цели подходит лишь малая часть материала — примерно десятая доля собранного некоммерческой организацией Common Crawl, чей веб-архив широко используется разработчиками ИИ. Тем временем, крупные платформы вроде социальных сетей и новостных агентств закрывают доступ к своим данным, а общественность не горит желанием открывать личную переписку для обучения языковых моделей. Марк Цукерберг (Mark Zuckerberg) считает огромным преимуществом в разработке ИИ доступ Meta к данным на своих платформах, среди которых текст, изображения и видео — правда, трудно сказать, какую долю этих материалов можно считать качественной.

 Ари Моркос. Источник изображения: arimorcos.com

Ари Моркос. Источник изображения: arimorcos.com

Стартап DatologyAI пытается бороться с нехваткой контента, используя методику «учебного плана», согласно которой данные «скармливаются» ИИ в определённом порядке, помогающем установить связь между ними. В опубликованной в 2022 году работе бывшего сотрудника Meta Platform и Google DeepMind, а ныне основателя DatologyAI Ари Моркоса (Ari Morcos) подсчитано, что данный подход помогает добиваться сопоставимых успехов в обучении ИИ при сокращении входящих данных вдвое. Впрочем, другие исследования эти данные не подтвердили.

Сэм Альтман (Sam Altman) также рассказал, что OpenAI разрабатывает новые методики обучения ИИ. По слухам, в стенах компании обсуждается возможность создания рынка данных, на котором бы определялась ценность конкретных материалов для каждой модели и справедливая цена, которую можно за них заплатить. Эта же идея обсуждается в Google, однако конкретных подвижек в этом направлении пока нет, поэтому компании-разработчики ИИ стараются дотянутся до всего, что только можно, в том числе видео- и аудиоматериалов — по словам источников в OpenAI, их собираются расшифровывать инструментом распознавания речи Whisper.

 Сэм Альтман. Источник изображения: wikipedia.org

Сэм Альтман. Источник изображения: wikipedia.org

Исследователи из OpenAI и Anthropic экспериментируют с так называемыми «высококачественными синтетическими данными». В недавнем интервью главный научный сотрудник Anthropic Джаред Каплан (Jared Kaplan) сказал, что подобные «сгенерированные внутри компании данные» могут быть полезные и использовались в последних версиях Claude. Пресс-секретарь OpenAI также подтвердил подобные разработки.

Многие исследователи проблемы нехватки данных не верят, что смогут с ней справиться, однако Вильялобос не теряет оптимизма, и верит, что впереди ещё много открытий. «Самая большая неопределённость в том, что мы не знаем, какие революционные открытия ещё предстоят», — сказал он.

По словам Ари Моркоса, нехватка данных — одна из важнейших проблем отрасли. Однако её развитие тормозит не только это — необходимые для работы больших языковых моделей чипы также в дефиците, а лидеры отрасли обеспокоены нехваткой центров обработки данных и электроэнергии.

Американским парламентариям запретили использовать Microsoft Copilot в служебных целях

Существующие системы искусственного интеллекта в большинстве своём используют облачные информационные ресурсы, подгружая в них обрабатываемые пользовательские данные, и это может представлять определённую угрозу для безопасности. Конгресс США, как следует из опубликованных рекомендаций, запрещает своим членам использовать сервис Microsoft Copilot в служебных целях.

 Источник изображения: Unsplash, Louis Velazquez

Источник изображения: Unsplash, Louis Velazquez

Поскольку указанный сервис призван упрощать работу с документами, у американских парламентариев, как предполагают авторы рекомендации, может возникать соблазн оптимизировать свою деятельность с помощью данного инструмента, но облачные ресурсы Microsoft, используемые сервисом Copilot, не одобрены данным органом власти как достаточно безопасные, а потому от подобных действий членам обеих палат парламента США рекомендовано воздержаться.

Все служебные ПК с операционной системой Windows, которые используются американскими парламентариями, подвергнутся настройке, подразумевающей блокировку сервиса Microsoft Copilot или даже его удаление при наличии такой технической возможности. В свою очередь, корпорация Microsoft к лету этого года планирует разработать специальный защищённый сервис для правительственных учреждений, который предоставит им доступ к искусственному интеллекту с более высокой степенью безопасности. Представители профильного комитета Конгресса США дали понять, что после выхода подобной версии Copilot проведут отдельную экспертизу пригодности данного сервиса для работы с данными правительственных структур. Ещё в прошлом году американским законодателям было запрещено использовать бесплатную версию ChatGPT из тех же соображений, но более продвинутый сервис ChatGPT Plus остался им доступен, пусть и только для анализа уже хранящейся в облаке информации.

Магазин чат-ботов ChatGPT провалился, но им пользуются ученики школ и университетов

Генеральный директор OpenAI Сэм Альтман (Sam Altman) рассчитывал, что площадка кастомных чат-ботов на основе ChatGPT поможет компании расширить бизнес, но на практике она привлекла довольно специфический контингент, а некоторые проекты, возможно, нарушают правила использования платформы.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Среди наиболее популярных спецверсий ChatGPT значатся проекты, работающие в образовательных целях, есть и инструменты для поиска и пересказа научных работ, сообщает Financial Times со ссылкой на данные исследования LikeWeb. В этом году отметился рост популярности дизайнерских инструментов с генерацией изображений, переводчики и средства для кадровиков, помогающие обрабатывать резюме и сопроводительные письма. Некоторые из проектов, возможно, нарушают политику OpenAI, которая запрещает создавать чат-боты, предоставляющие финансовые, юридические и медицинские консультации без одобрения квалифицированными специалистами.

Пять из наиболее просматриваемых приложений провозглашаются разработчиками как способные создавать контент, который проходит проверку применяемых в школах и университетах средств обнаружения материалов, созданных ИИ. Эти кастомные чат-боты в общей сложности набрали не менее 3 млн просмотров, хотя OpenAI напрямую запрещает приложения, позволяющие жульничать в академической среде или пропагандирующие такие действия.

 Источник изображения: ft.com

Источник изображения: ft.com

Более 200 тыс. раз люди пользовались приложением Finance Wizard, которое якобы предсказывает будущую динамику акций. Оно составляет прогнозы на основе исторических данных, а его описание включает заявление об отказе от ответственности, предостерегающее от его использования как инструмента финансовых рекомендаций, подчеркнул разработчик.

В прошлом году Сэм Альтман пообещал, что OpenAI позаботится о соответствии чат-ботов её политике — в этом компании должны помогать автоматизированные средства, анализ сотрудников компании и отзывы пользователей. Аудитория оригинальной версии ChatGPT составляет 100 млн пользователей в неделю, и цифровая платформа с кастомизированными версиями чат-бота призвана способствовать развитию бизнеса компании — иногда эта стратегия рассматривается как попытка повторить успех магазина приложений Apple App Store. В этом году ожидается запуск программы монетизации для разработчиков передовых проектов.

На кастомные чат-боты в феврале пришлись лишь 1,5 % посещений сайта ChatGPT с десктопных компьютеров; еженедельный трафик расти перестал. В OpenAI сообщили, что платформу посетили миллионы пользователей — она будет улучшаться, а отзывы от разработчиков для неё очень важны. Собственные проекты здесь запустили и известные разработчики: туристическое приложение AllTrails, некоммерческая образовательная организация Khan Academy и поисковая система для путешествий Kayak. Одной из первых собственный чат-бот запустила австралийская технологическая компания Canva — он генерирует изображения для соцсетей, а число его просмотров превысило 4,4 млн.

В середине года ИИ выйдет на новый уровень — OpenAI выпустит «существенно улучшенную» нейросеть GPT-5

В ближайшие месяцы OpenAI готовится выпустить новую версию своей модели генеративного искусственного интеллекта, лежащей в основе сервиса ChatGPT — этот сервис положил начало теперешнему буму ИИ.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Компания OpenAI планирует выпустить модель GPT-5 где-то в середине 2024 года, вероятно, летом, сообщает Business Insider со ссылкой на собственные источники. Некоторые корпоративные клиенты уже получили демонстрационные версии модели нового поколения и связанных с ней функций ChatGPT. «Она действительно хороша, даже существенно лучше», — прокомментировал один из испробовавших GPT-5 глав компаний. OpenAI показала работу модели со сценариями её использования и уникальными для его компании данными. Разработчик также упомянул о других, ещё не реализованных функциях модели, в том числе о возможности вызывать ИИ-агентов для автономного выполнения задач. Дата выпуска GPT-5 ещё не намечена.

Сейчас OpenAI продолжает обучать GPT-5. Когда обучение завершится, компания проверит модель на безопасность собственными силами, после чего она будет подвергнута стресс-тестированию: сотрудники OpenAI и сторонние специалисты будут различными способами её провоцировать, чтобы обнаружить возможные проблемы, прежде чем GPT-5 станет общедоступной. Конкретных сроков завершения тестирования пока тоже нет, поэтому её выпуск может откладываться.

Модель OpenAI GPT-4, ставшая последним крупным обновлением ChatGPT, вышла уже год назад. Разработчик заявлял, что она предоставляет более точные и оперативные ответы, но со временем в GPT-4 обнаружились такие проблемы как деградация и «лень» — отказ ИИ отвечать на запросы. Попыткой решить последнюю проблему стал выпуск GPT-4 Turbo. Наиболее важные данные обучающего массива ИИ принадлежат правообладателям, и OpenAI выступает против попыток ограничить доступ к этой информации для больших языковых моделей.

В плагинах ChatGPT нашли уязвимости, позволявшие взламывать учётные записи на сторонних платформах

Компания Salt Security обнаружила в некоторых плагинах ChatGPT критические уязвимости, через которые злоумышленники могли получать несанкционированный доступ к учётным записям пользователей на сторонних платформах. Речь идёт о плагинах, позволяющих ChatGPT выполнять такие операции, как, например, правка кода на GitHub или получение данных с «Google Диска».

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

Плагины ChatGPT — это альтернативные версии чат-бота на основе искусственного интеллекта, и публиковать их может любой разработчик. Эксперты Salt Security обнаружили три уязвимости. Первая касается процесса установки плагина — ChatGPT отправляет пользователю код подтверждения установки, но у злоумышленников есть возможность подменять его кодом для установки вредоносного плагина.

Вторая уязвимость обнаружена на платформе PluginLab, которая используется для разработки плагинов ChatGPT, — здесь отсутствовала достаточная защита при аутентификации пользователей, в результате чего хакеры могли перехватывать доступ к их учётным записям. Одним из плагинов, которые затронула эта проблема, был AskTheCode, предусматривающий интеграцию ChatGPT и GitHub.

Третья уязвимость обнаружилась в нескольких плагинах, и в её основу легли манипуляции с перенаправлениями при авторизации через протокол OAuth. Она тоже позволяла перехватывать доступ к учётным записям на сторонних платформах. Плагины не имели механизма проверки URL-адресов при перенаправлении, что позволяло злоумышленникам отправлять пользователям вредоносные ссылки для кражи их аккаунтов.

Salt Security заверила, что следовала стандартной процедуре и уведомила о своих открытиях OpenAI и другие стороны. Ошибки были исправлены оперативно, и свидетельств о наличии эксплойтов обнаружить не удалось.

Microsoft добавила мощнейшую нейросеть GPT-4 Turbo в бесплатную версию Copilot

Microsoft существенно повысила производительность и расширила возможности своего чат-бота Copilot. Теперь все бесплатные пользователи Copilot могут получить доступ к большой языковой модели (LLM) GPT-4 Turbo от OpenAI. Раньше доступ к GPT-4 Turbo можно было получить только при покупке подписки Microsoft Copilot Pro стоимостью $20 в месяц.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Сегодня руководитель отдела рекламы и веб-сервисов Microsoft Михаил Парахин объявил, что «после немалой работы» GPT-4 Turbo теперь доступен для бесплатных пользователей Copilot. Он отметил, что подписчики Copilot Pro, которые предпочитают более старую версию LLM GPT-4 в Copilot, могут переключиться на эту модель, выбрав соответствующую опцию в меню.

Партнёр Microsoft по разработке генеративного ИИ, компания OpenAI, впервые анонсировала GPT-4 Turbo в ноябре 2023 года. «Турбо-версия» предлагает пользователям доступ к гораздо большему контекстному окну размером 128 тыс. символов, что доводит объём текстовой подсказки до 300 страниц. Поддержка ChatGPT-4 Turbo появилась в подписке Copilot Pro в декабре.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Эта неделя была очень важной для команды Copilot. В понедельник Microsoft подтвердила, что все пользователи Copilot Pro теперь могут получить доступ к Copilot GPT Builder. Новый инструмент позволяет без навыков программирования создавать собственных чат-ботов, «заточенных» отвечать на конкретные вопросы по целевым темам. Подписчики Copilot Pro смогут предоставлять неограниченный доступ к своим чат-ботам кому угодно, независимо от устройства и наличия учётной записи Copilot Pro.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Недавняя утечка некоторых рекламных материалов от Samsung указывает на то, что в ближайшее время будет представлено ещё больше новых функций Copilot, включая улучшенную интеграцию с приложением Microsoft Phone Link на смартфонах Samsung Galaxy.

ChatGPT научился читать свои ответы вслух

Компания OpenAI добавила в свой ИИ-бот ChatGPT функцию «Чтение вслух», которая озвучивает ответы на запросы пользователей с помощью одним из пяти голосов. Функция может пригодиться, например, в дороге, когда отвлечься на экран устройства для чтения ответа на запрос может оказаться невозможно. Новая функция «Чтение вслух» уже доступна как в веб-версии ChatGPT, так и в приложениях ChatGPT для iOS и Android.

 Источник изображения: Unsplash, Andrew Neel

Источник изображения: Unsplash, Andrew Neel

Функция «Чтение вслух» поддерживает 37 языков и автоматически определяет язык ответа. Она доступна как для чат-ботов на базе GPT-4, так и для GPT-3.5. Следует добавить, что аналогичные возможности для своих ИИ-моделей ранее добавила компания Anthropic, один из основных конкурентов OpenAI.

В сентябре минувшего года ChatGPT запустил функцию голосового запроса, благодаря которой пользователи могут голосом проговаривать запрос для чат-бота, не печатая его в форме. Новая же функция позволяет настроить чат-бота таким образом, чтобы он всегда устно отвечал на запросы пользователя.

Для работы функции «Чтение вслух» в мобильных приложениях необходимо нажать и удерживать поле введённого запроса. В результате откроется специальный плеер «Чтение вслух», где можно выбрать настройки воспроизведения, приостановки или перемотки аудио-ответа. В веб-версии чат-бота для активации функции «Чтение вслух» под текстом ответа отображается значок динамика.

Поставки ИИ-заменителя смартфонов AI Pin начнутся с задержкой

В конце прошлого года стартап Humane объявил о старте поставок носимого ИИ-устройства AI Pin в марте, футуристический заменитель смартфона поступит к пользователям с небольшой задержкой. Как пишет The Verge со ссылкой на переписку в официальном канале Humane в Discord, первые покупатели получили уведомления о том, что заказы поступят не раньше середины апреля.

 Источник изображений: Humane

Источник изображений: Humane

Humane также сообщила, что доставка AI Pin, позиционируемого в качестве альтернативы смартфону, будет осуществляться бесплатно. Кроме того, покупателям, сделавшим заказ до 31 марта, компания предоставит бесплатно подписку на фирменные сервисы, в том числе на услуги сотовой связи, на три месяца, стоимость которой составляет $24 в месяц.

Стартап Humane, основанный бывшими топ-менеджерами Apple, позиционирует свою разработку как будущее портативных компьютеров. Небольшое носимое устройство весом около 34 г, оснащённое процессором Snapdragon, 13-Мп камерой и проектором, обладает поддержкой сотовой связи с собственным номером и облачных сервисов с доступом к ИИ-чат-боту ChatGPT. Управлять AI Pin, который не имеет экрана, можно с помощью голосовых команд, камеры, жестами, а также используя проектор. Стоимость AI Pin составляет $699 — недёшево с учётом того, что его предлагают в качестве замены смартфонам, средний уровень цен на которые находится гораздо ниже.

Volkswagen представила электрический универсал ID.7 Tourer с запасом хода до 685 км и ChatGPT

Компания Volkswagen представила ID.7 Tourer — электрический универсал по цене от €55 000. Его базовые характеристики идентичны характеристикам седана ID.7, а программная часть опережает предшественника на поколение. В частности, новинка получила интеллектуального помощника, который поддерживает работу с ИИ-ботом ChatGPT.

 Источник изображений: volkswagen-newsroom.com

Источник изображений: volkswagen-newsroom.com

Габариты Volkswagen ID.7 Tourer составляют 4961 × 1862 × 1536 мм (без боковых зеркал), длина колёсной базы — 2971 мм. То есть хэтчбек-седан и универсал имеют одинаковые размеры, зато последний в лучшую сторону отличается доступным пространством для хранения вещей: 605 л против 532 л у седана. При сложенных сиденьях у ID.7 Tourer оказываются доступны 1714 л багажника, а у обычного ID.7 — 1586 л; сложенные сиденья также предлагают «практически плоскую» грузовую площадку длиной 1948 мм.

Характеристики электродвигателей и аккумуляторов Volkswagen ID.7 Tourer напрямую унаследованы от седана. Когда машина выйдет в первом квартале, она будет доступна в версиях ID.7 Tourer Pro и ID.7 Tourer Pro S с задним приводом и мощностью 210 кВт (286 л.с.); ID.7 Tourer Pro получит батарею на 77 кВт·ч, а ID.7 Tourer Pro S — 86 кВт·ч. Старший вариант обеспечит запас хода до 685 км, тогда как седан предлагает от 700 км. Аккумулятор младшей версии поддерживает зарядку мощностью 175 кВт, старшая выдерживает все 200 кВт. От седана ID.7 Tourer также унаследовал систему MIB4 с 15-дюймовым экраном; а программная платформа здесь уже ID.Software 5.0, и она будет поддерживать установку дополнительных приложений.

В частности, сама Volkswagen выпустит приложение Wellness-App, которое поможет водителю улучшить самочувствие. В зависимости от комплектации приложение поможет подстроить под нужды владельца освещение в салоне, режим работы кондиционера, панорамную крышу и массажные функции сидений, предлагая программы Fresh Up («Освежись»), Calm Down («Успокойся») и Power Break («Сделай паузу»). В техническое оснащение также входит проекционный дисплей дополненной реальности, подающий изображение в поле зрения водителя: поддерживается навигация Apple CarPlay или Android Auto, а запуск дисплея сопровождается выводом логотипа VW в качестве приветствия.

На борту Volkswagen ID.7 Tourer присутствует помощник IDA, который позволяет управлять функциями автомобиля при помощи голосовых команд естественным языком и поддерживает ChatGPT. Владельцу машины не нужно создавать новую учётную запись или устанавливать дополнительное приложение: когда штатный голосовой помощник не справляется с поставленной задачей, запрос анонимно адресуется ИИ. Автопроизводитель уверяет, что ChatGPT не имеет доступа к данным машины, а вопросы и ответы немедленно удаляются из системы. Об интеграции ChatGPT автопроизводитель рассказал на выставке CES 2024 в январе.

Система помощи водителю останется на втором уровне, который не позволяет убирать руки с рулевого колеса и заниматься посторонними делами. Доработанная технология Travel Assist стала работать «гармоничнее» — машина может сама менять полосы движения на автомагистрали. Система Park Assist Plus запоминает предыдущий процесс парковки на расстоянии до 50 м от парковочного места и впоследствии выполняет эти операции автономно. Технология Side Assist поможет проконтролировать процесс открытия дверей, проверяя, не приближается ли сзади велосипедист или другая машина — в случае угрозы дверь не откроется.

Volkswagen ID.7 Tourer поступит в продажу по цене от €55 000. В базовой комплектации немецким покупателям предлагаются светодиодные фары и задние фонари; 19-дюймовые легкосплавные диски и рейлинги на крыше; центральный замок и система запуска без ключа Keyless Access; сетка для разделения багажа; 10-цветное освещение салона; проекционный дисплей дополненной реальности; камера заднего вида; двухзонный автоматически климат-контроль; подогрев передних сидений. В качестве опции доступна панорамная крыша с регулируемой электроникой прозрачностью; «светодиодные матричные фары» IQ.LIGHT со светодиодными рейками по обе стороны от переднего логотипа, а также автоматическое освещение Dynamic Light Assist. Можно выбрать 20- или 21-дюймовые диски. Заднюю светодиодную полосу можно заменить фонарями 3D с анимированными стоп-сигналами; доступна и подсветка самого логотипа.

OpenAI разрабатывает ИИ-поисковик, который составит конкуренцию Google

Заняв лидирующие позиции в гонке генеративного ИИ, OpenAI вступает в борьбу с Google «на её поле». Хотя OpenAI официально не подтверждала этого, инсайдеры сообщают, что компания уже более года занимается разработкой продукта для поиска в интернете. Пока неясно, будет ли новый инструмент интегрирован непосредственно в платную или бесплатную версию чат-бота ChatGPT или станет отдельным решением.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

ChatGPT изначально имел ограничение на доступ к самой последней информации в интернете. В марте 2023 года OpenAI объявила о поддержке плагинов, включая разработанный ею плагин для веб-обозревателя. В сентябре OpenAI сообщила, что ChatGPT получил доступ к актуальной информации в Сети и способен просматривать веб-страницы. Эта функциональность предназначалась прежде всего для поисковой системы Microsoft Bing, которая в течение многих лет оставалась аутсайдером интернет-поиска.

Microsoft вложила в OpenAI миллиарды долларов и в значительной степени полагается на технологический стек OpenAI при переосмыслении своих собственных продуктов, включая Bing. Microsoft запустила собственный чат-бот на базе ИИ Bing Chat, затем расширила возможности генеративного ИИ на другие свои продукты, и в конечном итоге в 2024 году распространила ИИ повсюду под отдельным брендом Copilot.

Похоже, что OpenAI, при активной поддержке со стороны Microsoft, готова начать атаку на занимаемые Google позиции в сфере веб-поиска. Microsoft некоторое время назад проиграла Google войну поисковых систем, и искусственный интеллект может стать для неё прекрасной возможностью переманить существенную часть пользователей в свою экосистему.

Пока неизвестно, как именно будет работать секретный продукт веб-поиска OpenAI, но можно сделать некоторые предположения, основываясь на появляющихся продуктах других разработчиков. Например, приложение Arc Search, разработанное The Browser Company, предлагает функцию «Просмотр для меня». Она собирает в сети информацию, соответствующую поисковому запросу, компилирует данные из шести авторитетных источников, а затем представляет результаты в виде специальной веб-страницы, избавляя пользователей от необходимости тратить время на просмотр всей поисковой выдачи.

ИИ-бот ChatGPT научился запоминать факты о пользователях и их предпочтения

Регулярная работа с чат-ботом на базе искусственного интеллекта может начать раздражать, поскольку для улучшения опыта взаимодействия пользователю каждый раз приходится объяснять некоторые факты о себе и своих предпочтениях. Компания OpenAI, являющаяся разработчиком ИИ-бота ChatGPT, намерена исправить это, сделав алгоритм более персонализированным за счёт добавления ему «памяти».

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Такой подход позволит ChatGPT со временем извлекать информацию о пользователе и его предпочтениях из диалогов с ним. Функция памяти работает двумя способами. Пользователь может прямо указать на свои предпочтения или иную информацию, которую ChatGPT должен запомнить. Если этого не делать, то чат-бот будет сам получать нужную информацию в процессе взаимодействия с пользователем. Цель разработчиков состоит в том, чтобы сделать ChatGPT более персонализированным и удобным.

Во многих отношениях память является той функцией, которой действительно не хватает ChatGPT. Однако для её реализации алгоритм будет собирать информацию о пользователях, что может вызвать опасения по поводу конфиденциальности данных. OpenAI выбрала стратегию, которая во многом напоминает принцип работы разных интернет-сервисов. Речь идёт о наблюдении за действиями пользователя для постепенного формирования цифрового профиля. Такой метод работы неоднозначен, поскольку сразу возникают опасения по поводу того, что ChatGPT будет использовать собранные данные для дальнейшего обучения алгоритма и повышения уровня персонализации.

OpenAI заявила, что пользователи будут иметь возможность контроля функции памяти ИИ-бота. Также отмечается, что алгоритм не будет запоминать конфиденциальные данные, например, информацию о здоровье. Можно спросить ChatGPT о том, что именно ему известно о пользователе, после чего эти данные при необходимости без особого труда удаляются из памяти. Если же пользователь не заинтересован в функции памяти, то её попросту можно отключить, но по умолчанию она будет активирована.

На данный момент функция памяти ChatGPT находится на этапе тестирования и доступна ограниченному числу пользователей ИИ-бота. Когда именно она может стать общедоступной, пока неизвестно.

Годовая выручка OpenAI выросла до $2 млрд, но компания тратит больше

Доходы стартапа из Сан-Франциско OpenAI на фоне всплеска популярности разработанного им ИИ-чат-бота ChatGPT стремительно растут. По данным источников Financial Times, в декабре 2023 года годовой оборот OpenAI (показатель выручки за предыдущий месяц, умноженный на 12) достиг отметки в $2 млрд, хотя ещё в октябре годовой доход компании, по данным The Information, составлял $1,3 млрд.

 Источник изображения: Andrew Neel/unsplash.com

Источник изображения: Andrew Neel/unsplash.com

Компания считает возможным удвоить эту сумму в 2025 году на фоне сильного интереса к её решениям со стороны бизнес-клиентов, стремящихся использовать инструменты генеративного ИИ для повышения эффективности своей работы. Благодаря стремительному росту у OpenAI есть все шансы войти в число немногих компаний Кремниевой долины, таких как Google и Meta, которым удалось получить годовой доход в $1 млрд в первые десять лет с момента своего основания.

По словам генерального директора OpenAI Сэма Альтмана (Sam Altman), по состоянию на ноябрь прошлого года 92 % компаний из списка Fortune 500 использовали продукты OpenAI, включая ChatGPT и лежащую в его основе модель искусственного интеллекта GPT-4, в то время как аудитория чат-бота выросла до 100 млн пользователей в неделю.

Интерес потребителей и бизнеса к генеративному ИИ — системам, которые могут генерировать код, текст, изображения, видео и анализировать информацию из подсказок пользователя — резко возрос, отметила Financial Times. Крупные технологические конкуренты OpenAI, такие, как Google и Meta, а также стартапы, включая Anthropic, Mistral и Cohere, тоже начали коммерциализацию своих ИИ-продуктов. Например, на этой неделе Google сделала доступной для широкой публики нейросеть Gemini Ultra, стоимость подписки на которую составляет всего $20 в месяц.

Вместе с тем Альтман отметил, что OpenAI по-прежнему работает с убытками из-за огромных затрат на создание и эксплуатацию её ИИ-моделей. По всей видимости эта тенденция сохранится ещё какое-то время из-за разработки ещё более сложных моделей, и компании, вероятно, придётся дополнительно привлекать значительные суммы, чтобы покрыть растущие расходы. Microsoft инвестировала в OpenAI до $13 млрд, но этого явно недостаточно.

«Расходы на обучение просто огромны, но это вполне ожидаемо», — сообщил Альтман газете Financial Times в ноябре прошлого года.


window-new
Soft
Hard
Тренды 🔥
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference 2 ч.
«Жду эту игру с самого рождения»: новый трейлер фэнтезийного шутера Covenant с элементами Dark Souls и Dishonored впечатлил геймеров 3 ч.
Автор Loretta раскрыл дату выхода новой игры — хоррор-стратегии Anoxia Station про погоню за нефтью в недрах умирающей Земли 4 ч.
Создатели кинематографичного боевика Spine в духе «Джона Уика» заинтриговали игроков тизером хардкорного режима — новый геймплейный трейлер 5 ч.
Цифровой белорусский рубль «полноценно» заработает во второй половине 2026 года 5 ч.
Google вживую продемонстрировала возможности Android XR 6 ч.
Премьера аддона A Pirate’s Fortune, дата выхода на Switch 2 и бесплатное демо: Ubisoft разразилась новостями о Star Wars Outlaws 7 ч.
Взрывной геймплейный трейлер Painkiller порадовал фанатов демонстрацией нового и классического адского оружия 7 ч.
WhatsApp перенял ещё одну «фишку» Telegram — пользовательские наборы стикеров 8 ч.
Повышение цен сработало: квартальная выручка Netflix подскочила до $10,5 млрд 8 ч.
Western Digital запустила в США масштабную программу извлечения редкоземельных элементов из HDD — уже переработано почти 23 т дисков Microsoft 18 мин.
Физики обнаружили аномальный эффект Холла в неожиданном месте 2 ч.
Из-за политики США европейские пользователи задумались об уходе из американских облаков 2 ч.
Продажи российского электромобиля Lada e-Largus выросли до одного экземпляра в первом квартале 2 ч.
Intel расследует падение производительности видеокарт Arc при работе со старыми CPU 3 ч.
Китайская EHang пообещала запустить сервис летающих такси по разумной цене до конца года 3 ч.
$278 млрд налогов недоплатила «Кремниевая шестёрка» IT-гигантов благодаря лазейкам в законе 3 ч.
Tesla урезала производство пикапов Cybertruck, потому что их почти никто не покупает 4 ч.
Curiosity нашёл свидетельства того, что в древности на Марсе могла быть жизнь 4 ч.
В Индии представили ароматизированный смартфон Infinix Note 50s 5G+ 4 ч.