Сегодня 19 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → openai
Быстрый переход

OpenAI отключила генератор изображений DALL-E 2 — его место займёт более продвинутый DALL-E 3

Компания OpenAI продолжает активно развивать свои генеративные алгоритмы, делая их более совершенными и удобными для пользователей. На этом фоне разработчики объявили о закрытии нейросети DALL-E 2, которая дебютировала в апреле 2022 года и позволяла создавать качественные изображения на основе текстовых описаний. Этого следовало ожидать, поскольку OpenAI уже выпустила более совершенный алгоритм DALL-E 3.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Алгоритм DALL-E 3 получил полную интеграцию с ИИ-ботом ChatGPT, что способствовало формированию более простого пользовательского интерфейса и созданию более качественных изображений. Начать взаимодействие с ChatGPT в DALL-E 3 можно буквально в пару кликов. Что же касается DALL-E 2, то очевидно, что нейросеть безвозвратно уходит в прошлое.

«Мы больше не допускаем новых пользователей к DALL-E 2. DALL-E 3 позволяет создавать изображения более высокого качества, лучше обрабатывает запросы, и мы начали внедрять в него функцию редактирования изображений. Он доступен пользователям ChatGPT Plus, Teams и Enterprise, а также через API OpenAI», — говорится в сообщении разработчиков на странице DALL-E 2.

Вместе с появлением сообщения от разработчиков со страницы исчезла форма для ввода текстовых описаний. Доступ к сгенерированным ранее изображениям на данный момент есть, но не исключено, что позднее это изменится. OpenAI предупреждала о предстоящем закрытии доступа к алгоритму ещё в начале года, поэтому для пользователей нейросети этот шаг не должен стать чем-то неожиданным.

OpenAI GPT-4 достигла уровня врачей-офтальмологов в диагностике глазных заболеваний

Большая языковая модель искусственного интеллекта OpenAI GPT-4 достигла тех же результатов, что и врачи-специалисты, в оценке глазных заболеваний и выработке методов их лечения — или превзошла их, пишет Financial Times со ссылкой на материалы исследования. Сильнее ИИ оказались лишь лучшие специалисты.

 Источник изображения: u_9p7tw4noz0 / pixabay.com

Источник изображения: u_9p7tw4noz0 / pixabay.com

Офтальмология оказалась центральным направлением проекта по внедрению ИИ в клиническую практику, а также по устранению препятствий к этому, например, галлюцинаций — склонности моделей выдавать явно не соответствующую действительности информацию. В рамках исследования рассматривались 87 сценариев лечения пациентов, чего хватило, чтобы оценить эффективность GPT-4 по сравнению с непрофильными врачами, стажёрами и опытными офтальмологами. Модель превзошла молодых врачей и добилась результатов на уровне опытных специалистов.

Исследование примечательно тем, что в нём сравнивались способности нейросети с возможностями практикующих врачей, а не результатами обследований. Кроме того, здесь применялись широкие возможности генеративного ИИ, а не узкая специализация, которая рассматривалась в предыдущих проектах, таких как оценка рисков онкологии на основе материалов сканирования пациентов. Модель одинаково хорошо справилась с вопросами как на простое наличие знаний, так и на способность рассуждать: интерполировать, интерпретировать и обрабатывать информацию.

GPT-4 можно усовершенствовать, проведя дополнительное обучение на расширенном наборе данных, включая алгоритмы управления, записи о реальных пациентах (без личной информации) и учебники, пояснил автор исследования в школе клинической медицины при Кембриджском университете Арун Тирунавукарасу (Arun Thirunavukarasu). Для этого требуется соблюсти баланс между увеличением количества и характера источников и высоким качеством данных. На практике такие модели помогут определять приоритет пациентов, когда доступ к специалистам ограничен.

Но и излишне доверяться ИИ тоже преждевременно, предупредил профессор Университетского колледжа Лондона Пирс Кин (Pearse Keane), работающий также в лондонской офтальмологической больнице «Мурфилдс» (Moorfields Eye Hospital). В прошлом году он задал большой языковой модели вопрос о дегенерации жёлтого пятна в глазах и получил не соответствующий действительности ответ.

Еврокомиссия не нашла ничего предосудительного в отношениях Microsoft и OpenAI

Европейская комиссия сообщила, что не станет расследовать инвестиции Microsoft в размере $13 млрд в компанию OpenAI, поскольку последняя не подчиняется Microsoft напрямую и вряд ли будет поглощена редмондской компанией. В январе европейские антимонопольщики заявили, что могут начать расследование отношений Microsoft и OpenAI.

 Источник изображения: efes / pixabay.com

Источник изображения: efes / pixabay.com

Партнёрство Microsoft и OpenAI во многом обусловлено нарастающими потребностями в вычислительной мощности, необходимой для дальнейшего развития и использования генеративных ИИ. Запуск ИИ-моделей вроде ChatGPT и Google Bard привёл к резкому росту спроса на облачные сервисы и вычислительные мощности, а OpenAI стала одним из крупнейших клиентов облачного бизнеса Microsoft.

Кроме того, все мировые поставщики облачных вычислений — Microsoft, Amazon и Google — в последнее время активно инвестируют в ИИ. Так, разрабатывающая семейство чат-ботов Claude компания Anthropic получила $4 млрд инвестиций от Amazon и $2 млрд от Google. Логично, что и Microsoft стремится не отстать от конкурентов — ранее в этом году компания вложила $16 млрд в французскую Mistral AI.

Однако именно инвестиции в OpenAI привлекли внимание антимонопольщиков. И не только в ЕС — интерес к сделке проявили Управление по конкуренции и рынкам Великобритании и Федеральная торговая комиссия США, особенно после скандала с увольнением и повторным наймом Сэма Альтмана (Sam Altman).

Сама Microsoft отказалась от комментариев, процитировав раннее заявление, что партнёрство с OpenAI «способствовало новаторскому развитию в области ИИ с сохранением независимости обеих компаний».

Google потратит не менее $100 млрд на развитие искусственного интеллекта

Инициативами Google в сфере искусственного интеллекта руководит генеральный директор DeepMind Демис Хассабис (Demis Hassabis), который является одним из основателей данного стартапа, купленного Alphabet в 2014 году. В ближайшие годы, по его словам, Google потратит на развитие систем искусственного интеллекта более $100 млрд.

 Источник изображения: DeepMind

Источник изображения: DeepMind

Этот комментарий Хассабис сделал на конференции TED в Ванкувере, как поясняет Bloomberg, когда его спросили о потенциальном создании суперкомпьютера Stargate стоимостью $100 млрд, который якобы готовятся совместно построить Microsoft и OpenAI. Не желая вдаваться в подробности, представитель Google заявил, что корпорация потратит с течением времени более $100 млрд на развитие своих систем искусственного интеллекта. По его словам, Google превосходит Microsoft по своим вычислительным мощностям.

«Это одна из причин, по которым мы скооперировались с Google в 2014 году, поскольку уже тогда знали, что для создания сильного искусственного интеллекта (AGI) нам потребуется много вычислительных мощностей, — подчеркнул сооснователь DeepMind, добавив, — уже тогда это стало очевидным, а Google продолжает обладать самыми производительными компьютерами». По словам Хассабиса, вызванный ChatGPT компании OpenAI интерес публики доказывает, что общественность уже готова принимать системы искусственного интеллекта, даже если они далеки от совершенства и изобилуют ошибками.

OpenAI будет сотрудничать с японскими производителями для устранения дефицита ИИ-чипов

Открытие представительства OpenAI в Японии не было ориентировано исключительно на сближение компании с японскими клиентами в сфере искусственного интеллекта, как можно судить по интервью операционного директора компании Брэда Лайткэпа (Brad Lightcap) агентству Nikkei. Американский разработчик систем искусственного интеллекта всерьёз изучает возможность участия японских производителей в решении проблемы нехватки ускорителей вычислений.

 Источник изображения: Tokyo Electron

Источник изображения: Tokyo Electron

Спрос на подобные решения, по словам Лайткэпа, будет оставаться высоким на протяжении ближайших нескольких лет, поэтому для всей отрасли важно, чтобы не возникало нехватки вычислительных ресурсов. «Наш приоритет — добиться того, чтобы не возникла ситуация, когда в мире существует слишком много спроса на ИИ, но мы не можем его удовлетворить», — пояснил операционный директор OpenAI. Он не стал комментировать слухи об инициативах основателя компании Сэма Альтмана (Sam Altman) по развитию инфраструктуры ИИ на мировом уровне, подразумевающих и строительство десятков новых предприятий по выпуску чипов для ускорителей вычислений. При этом Лайткэп подчеркнул, что OpenAI «всегда думает о том, как участвовать в глобальной дискуссии про расширение мировых мощностей по выпуску чипов».

По неофициальным данным, Лайткэп уже встречался с представителями японской полупроводниковой отрасли для обсуждения подобных вопросов. По его собственным словам, «существуют возможности для обширного взаимодействия с Японией в части обеспечения любого количества дополнительных мощностей, и делать это можно с нескрываемым интересом». По словам Лайткэпа, к услугам OpenAI по предоставлению бизнесу ИИ-сервисов уже подключились тысячи компаний, а общее количество пользователей таких услуг превышает 600 000 человек. Ещё в январе их количество было в четыре раза меньше. Непосредственно численность сотрудников японского представительства OpenAI к концу года будет увеличена в десять раз.

Помимо большого количества поставщиков оборудования и расходных материалов для выпуска чипов, напомним, в Японии собирается развернуть свою деятельность контрактный производитель Rapidus, который с 2027 года намерен предложить клиентам услуги по выпуску 2-нм чипов. Компания делает ставки на стартапы, а OpenAI формально таковым и является, хотя масштабы бизнеса этой компании с прошлого года растут феноменальными темпами.

OpenAI открыла офис в Японии, который стал первым в азиатском регионе

Американский стартап OpenAI, пользующийся технологической, маркетинговой и финансовой поддержкой Microsoft, уже располагает офисами в Лондоне и Дублине, но открытое на этой неделе представительство в Японии стало первым в азиатском регионе. Сэм Альтман (Sam Altman) на правах руководителя OpenAI выразил надежду, что это событие будет лишь первым шагом на долгом пути сотрудничества с местным бизнесом.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Непосредственно генеральный директор OpenAI обратился к потенциальным партнёрам в Японии через видеосообщение. Представительство компании начнёт свою работу в Токио. Создатели популярного чат-бота ChatGPT рассчитывают, что с ними будут сотрудничать не только рядовые пользователи и японский бизнес, но и государственные структуры, а также исследовательские институты. OpenAI расширяет рынки сбыта своих разработок, и первый в Азии офис поможет наладить контакты с региональными клиентами.

В этом месяце, как сообщает Reuters, генеральный директор OpenAI Сэм Альтман и операционный директор компании Брэд Лайткэп (Brad Lightcap) уже провели встречу с сотнями предпринимателей и руководителей компаний на территории США и Великобритании. Открыть офис в Японии компания планировала ещё в прошлом году, соответствующее заявление Альтман сделал после встречи с японским премьер-министром Фумио Кисидой (Fumio Kishida).

Брэд Лайткэп присутствовал на церемонии открытия японского офиса в Токио, он заявил, что спрос на услуги OpenAI значительно превышает возможности компании их предоставлять. Со временем, как надеется операционный директор, OpenAI сможет получать существенную выручку на японском рынке. Возглавлять местный бизнес OpenAI будет Тадао Нагасаки (Tadao Nagasaki), который был президентом местного подразделения Amazon Web Services. По словам Лайткэпа, компания располагает оптимизированной под японский язык большой моделью. OpenAI уже обслуживает корпорации Toyota Motor, Daikin Industries и японские правительственные организации. Microsoft на прошлой неделе пообещала в ближайшие два года вложить $2,9 млрд в развитие облачной инфраструктуры в Японии, а также систем искусственного интеллекта.

Сэм Альтман занялся продвижением ChatGPT среди крупных корпоративных клиентов

В этом месяце глава OpenAI Сэм Альтман (Sam Altman) провёл несколько встреч, в которых приняли участие сотни руководителей компаний из списка Fortune 500. Прошедшие в Сан-Франциско, Нью-Йорке и Лондоне мероприятия были посвящены презентации функций на основе искусственного интеллекта для корпоративного сегмента. Об этом пишет агентство Reuters со ссылкой на собственные осведомлённые источники.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Эти мероприятия наглядно демонстрируют, как OpenAI, с потребительских приложений которой началось бурное развитие генеративных нейросетей, стремится к поиску новых источников дохода. Очевидно, что в видении компании такими источниками должны стать корпоративные клиенты по всему миру, причём некоторые из потенциальных клиентов могут являться партнёрами крупнейшего спонсора OpenAI, которым является Microsoft.

О трёх прошедших недавно в США и Англии встречах не сообщалось публично. По словам осведомлённых источников, в рамках каждой из таких встреч Альтман напрямую обращался более чем к 100 руководителям разных компаний. На каждом мероприятии Альтман и главный операционный директор OpenAI Брэд Лайткэп (Brad Lightcap) демонстрировали собравшимся разные программные продукты, в том числе ChatGPT Enterprise — корпоративную версию популярного ИИ-бота, а также API для подключения клиентских приложений к своим ИИ-сервисам и новые генеративные модели, позволяющие создавать видео по текстовому описанию.

OpenAI обещает клиентам, что их данные, которые станут доступны алгоритму ChatGPT Enterprise, не будут использоваться для обучения больших языковых моделей (LLM). Общаясь с потенциальными клиентами из финансовой, энергетической отраслей, сферы здравоохранения, руководители OpenAI рассказали о нескольких приложениях для разных сфер бизнеса, а также отметили, что потребительскую версию бота ChatGPT уже используют 92 % компаний из списка Fortune 500.

Напомним, Microsoft является крупнейшим инвестором в OpenAI и предлагает доступ к ИИ-технологиям компании через свою облачную платформу Azure. Пользователи сервиса Microsoft 365 также имеют доступ к ИИ-помощнику Copilot, который представляет собой инструмент для повышения продуктивности, в основе которого лежат алгоритмы OpenAI.

Во время встреч руководителей OpenAI с представителями бизнеса некоторые из участников задавали вопрос, почему они должны платить за ChatGPT Enterprise, если они уже являются клиентами Microsoft. Альтман и Лайткэп ответили, что оплата корпоративного ИИ-бота позволит компаниям напрямую взаимодействовать с OpenAI, иметь доступ к новейшим LLM, а также индивидуальным продуктам на основе ИИ. Официальные представители OpenAI и Microsoft отказались от комментариев по данному вопросу.

OpenAI сделала ChatGPT «более чётким и менее многословным», но только для платных пользователей

Компания OpenAI объявила о крупном обновлении ChatGPT, которое затронет пользователей всех платных версий популярного чат-бота — теперь они могут работать со свежей улучшенной версией нейросети GPT-4 Turbo. Напомним, что OpenAI предлагает три платных тарифа: ChatGPT Plus, Team или Enterprise.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Новая модель версии gpt-4-turbo-2024-04-09 улучшила способности в написании текстов и программного кода, решении математических задач и логических рассуждениях, кроме того, она получила более актуальную базу знаний. Нейросеть была обучена на общедоступных данных по состоянию на декабрь 2023 года — предыдущая версия GPT-4 Turbo, на которой работал ChatGPT, была ограничена апрелем 2023 года.

 Источник изображения: twitter.com/OpenAI

Источник изображения: twitter.com/OpenAI

«При написании [текстов] с помощью ChatGPT [с новым GPT-4 Turbo] ответы будут более чёткими, менее многословными и с бо́льшим использованием разговорного языка», — рассказала OpenAI в соцсети X. В минувший вторник компания также сделала доступными через API ряд новых моделей, включая нейросеть GPT-4 Turbo with Vision, которая в качестве запросов принимает не только текст, но и изображения.

 Источник изображения: twitter.com/OpenAI

Источник изображения: twitter.com/OpenAI

В остальном неделя для OpenAI выдалась непростой. Microsoft представила генератор изображений на базе OpenAI DALL-E в качестве инструмента для работы специалистов Вооружённых сил США, выяснило издание The Intercept. Сама же OpenAI уволила двух исследователей, в том числе соратника главного научного сотрудника компании Ильи Суцкевера (Ilya Sutskever), который был одним из инициаторов непродолжительного увольнения гендиректора Сэма Альтмана (Sam Altman), передаёт The Information.

Сэм Альтман формирует мировую коалицию для развития инфраструктуры для ИИ

Масштабы инициатив основателя OpenAI Сэма Альтмана (Sam Altman) уже перестают ограничиваться отдельными компаниями и государствами, он перемещается по миру, чтобы сформировать глобальную коалицию, направленную на развитие необходимой для систем искусственного интеллекта инфраструктуры. Помимо ОАЭ, предприниматель ведёт переговоры с представителями западных стран и непосредственно США.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Какую именно форму обретёт данная инициатива в дальнейшем, сказать сложно, но осведомлённые источники сообщили Bloomberg, что Альтман призывает предпринимателей и политических деятелей в разных частях планеты участвовать в создании дорогой и громоздкой инфраструктуры, способствующей более быстрому развитию систем искусственного интеллекта. Помимо развития производственных мощностей по выпуску компонентов, отрасли нужны новые центры обработки данных и источники электроэнергии. На этой неделе Альтман встретился с инвесторами и чиновниками из ОАЭ, ранее вёл переговоры с представителями ряда западных стран, а до конца недели должен принять участие в переговорах в Вашингтоне.

Ранее сообщалось, что Альтман вынашивает идею строительства десятков современных предприятий по выпуску чипов для ускорителей вычислений, и пытается привлечь к этому проекту средства инвесторов на Ближнем Востоке. Теперь он готов обсуждать и развитие сопутствующей инфраструктуры в виде центров обработки данных и электростанций, способных обеспечить их необходимым количеством энергии. Представители OpenAI ограничились обещанием предоставить более подробную информацию позже.

По мнению Альтмана, решить проблему энергоснабжения профильных центров обработки данных могли бы более дешёвые солнечные электростанции или источники энергии, использующие термоядерный синтез. Намеченная на ближайшие сутки встреча Альтмана с американскими чиновниками в Вашингтоне, как считается, будет посвящена обсуждению вопросов национальной безопасности и развития инфраструктуры, необходимой для сохранения лидерства США в сфере искусственного интеллекта. Американских чиновников также может беспокоить стремление Сэма Альтмана привлечь для решения существующих проблем средства арабских инвесторов.

OpenAI и Meta✴ разрабатывают модели ИИ, способные рассуждать и планировать

OpenAI и Meta приблизились к выпуску новых моделей искусственного интеллекта, которые, по их словам, будут способны рассуждать и планировать — это важные достижения на пути к созданию ИИ со сверхчеловеческим разумом. Об этом пишет Financial Times.

 Источник изображения: Kohji Asakawa / pixabay.com

Источник изображения: Kohji Asakawa / pixabay.com

Руководство компаний OpenAI и Meta доложило, что ведётся подготовка к выпуску больших языковых моделей нового поколения — систем, которые используются в приложениях генеративного ИИ, включая ChatGPT. Meta готовится выпустить Llama 3 в ближайшие недели, а новая модель OpenAI GPT-5 появится «скоро», пообещали в компании. «Мы усердно трудимся над тем, чтобы заставить эти модели не просто говорить, но также рассуждать, планировать, <..> запоминать», — сообщила вице-президент Meta по исследованиям в области ИИ Джоэль Пино (Joelle Pineau). О достижениях в этой области доложил и главный операционный директор OpenAI Брэд Лайткэп (Brad Lightcap): «Мы увидим ИИ, который сможет выполнять более сложные задачи более изощрёнными способами. Думаю, прикоснёмся к способности этих моделей рассуждать».

Проекты Meta и OpenAI последуют за волной больших языковых моделей, выпущенных в этом году Google, Anthropic и Cohere. Способности рассуждать и планировать — важные этапы на пути к созданию сильного ИИ (Artificial General Intelligence — AGI), обладающего сознанием на уровне человека. Выступая на мероприятии в Лондоне накануне, старший научный сотрудник Meta по ИИ Янн ЛеКун (Yann LeCun) сказал, что нынешние системы ИИ «выдают одно слово за другим, по-настоящему не задумываясь и не планируя». Им затруднительно отвечать на сложные вопросы или запоминать информацию надолго, и они всё равно «совершают глупые ошибки». Способность рассуждать будет значить, что модель ИИ «подыскивает возможные ответы», «планирует последовательность действий» и выстраивает «мысленную модель того, каким будет эффект [её] действий».

Для решения этой задачи он, в частности, разрабатывает «агенты» ИИ, способные распланировать путешествие из парижского в нью-йоркский офис с бронированием всех билетов, включая дорогу до аэропорта. В обозримом будущем Meta готовится выпустить линейку моделей Llama 3 в ассортименте версий для различных приложений и устройств — новые модели компания планирует внедрить в мессенджер WhatsApp и умные очки Ray-Ban. В Meta планируют увеличивать объёмы и сложность задач для ИИ, что потребует развития его способности рассуждать. Так, если камера очков Meta Ray-Ban увидит сломанную кофемашину, подключённый к ним ассистент на базе Llama 3 даст рекомендации по её починке. Человек будет всё чаще общаться с ИИ-помощниками, считает Янн ЛеКун.

OpenAI для обучения GPT-4 расшифровала миллионы видео с YouTube — текстов в интернете не хватило. Google тоже так делает

Несколько дней назад сообщалось, что разработчики ИИ столкнулись с нехваткой данных для обучения передовых моделей, в том числе о планах Open AI обучать GPT-5 на видео с YouTube. Согласно материалу The New York Times, в погоне за новыми данными корпорации забывают об этике и морали.

 Источник изображения: freepik.com

Источник изображения: freepik.com

К концу 2021 года OpenAI столкнулась с нехваткой авторитетных англоязычных текстов в интернете для обучения новейшей модели искусственного интеллекта — ей требовалось гораздо больше данных. Тогда разработчики OpenAI создали расшифровывающую аудиозаписи из видеороликов на YouTube систему распознавания речи Whisper, которая выдаёт текст для обучения ИИ. По словам нескольких сотрудников, в компании понимали, что такой шаг может противоречить правилам использования YouTube, запрещающим использовать видеоролики «независимо» от платформы. Это не остановило OpenAI, расшифровавшую более миллиона часов видеороликов с YouTube. Полученный текст использовался для обучения GPT-4 — одной из мощнейших систем искусственного интеллекта в основе последней версии ChatGPT. В исследовании The New York Times говорится, что в гонку за данными включились все передовые разработчики ИИ, включая OpenAI, Google и Meta, причём компании зачастую игнорируют корпоративные политики, а иногда и закон.

Разработчики ИИ всё сильнее упираются в нехватку материала. Передовые чат-боты обучались на массивах цифровых текстов объёмом до трёх триллионов слов, что примерно вдвое больше объёма материалов в Бодлианской библиотеке Оксфордского университета, в том числе датирующихся ещё 1602 годом. Наибольшую ценность для обучения ИИ представляют высококачественные данные из отредактированных профессионалами книг и статей. По данным исследовательского института Epoch, такие тексты могут закончиться уже в 2026 году.

«Единственный практический способ существования таких инструментов — обучение на огромных массивах информации без разрешения её создателей. Объём необходимых данных настолько велик, что не поможет даже коллективное лицензирование», — говорит представляющий интересы венчурной компании Andreessen Horowitz Сай Дамле (Sy Damle).

OpenAI, Google и Meta не скрывают, что их модели ИИ обучаются на открытых данных, однако не все создатели соответствующего контента приветствуют данную инициативу, что уже стало причиной множества судебных разбирательств. В прошлом сама The New York Times подавала в суд на OpenAI и Microsoft за то, что компании обучали чат-ботов на защищённых авторским правом материалах без разрешения владельцев. Тогда Microsoft и OpenAI заявили, что «добросовестно используют» материалы для создания собственных работ, что не запрещено законом об авторском праве.

 Джаред Каплан. Источник: physics-astronomy.jhu.edu

Джаред Каплан. Источник: physics-astronomy.jhu.edu

В январе 2020 года физик-теоретик из Университета Джонса Хопкинса Джаред Каплан (Jared Kaplan) опубликовал работу об ИИ, которая разожгла аппетиты их разработчиков. Он высказался однозначно: чем больше данных используется для обучения языковой модели, тем лучше она работает, подобно тому, как студенты получают всё больше знаний из прочитанных книг. Языковые модели могут устанавливать закономерности и взаимосвязи, что позволяет точнее обрабатывать новую информацию.

«Все сильно удивились, что эти тенденции, или законы масштабирования, как мы их называем, не менее точны, чем физические и астрономические», — говорит ныне работающий в Anthropic Каплан.

Разработчики ИИ уже давно используют огромные массивы публичных цифровых данных, в том числе статьи из «Википедии» и Common Crawl — базы данных из более чем 250 млрд интернет-страниц, собранных с 2007 года. Прежде чем «скормить» эти данные ИИ, их тщательно фильтровали на предмет «нежелательных» материалов. Объёмы необходимых для обучения ИИ в 2020 году данных сейчас кажутся смешными, ведь тогда массив из 30 тысяч картинок с Flickr казался огромным.

Создание вышедшей в ноябре 2020 года GPT-3 ознаменовало начало эры погони за новыми данными — модель обучали на 300 млрд «токенов», представляющих отдельные слова или их фрагменты. Обучившись на этих данных, система генерировала посты в блогах, стихи и даже писала программы. В 2022 году подразделение Google Deepmind протестировало 400 ИИ-моделей, меняя объём данных для обучения и другие факторы. Оказалось, что Каплан прав, и чем больше входящих данных, тем лучше работает ИИ. Гонка продолжается: в 2023 году китайцы представили обученную ни 3,2 триллионах английских и китайских лексем модель Skywork, а PaLM 2 от Google «поглотила» 3,6 триллиона токенов.

 Сэм Альтман. Источник изображения: wikipedia.org

Сэм Альтман. Источник изображения: wikipedia.org

Позднее Сэм Альтман (Sam Altman) из OpenAI заявил, что данные рано или поздно кончатся — он знает, о чём говорит, ведь компания годами собирала данные, обрабатывала и обучали на них ИИ. Среди использованных данных был программный код с GitHub, базы данных шахматных ходов, школьные тесты и домашние задания старшеклассников. К концу 2021 года они закончились. Помимо расшифровки аудио- и видеоматериалов, рассматривалась покупка компаний, имеющих доступ к огромным объёмам цифровых данных.

Некоторые сотрудники Google знали, что OpenAI расшифровывает видео с YouTube, но бездействовали, потому что этим же занималась сама Google, а это потенциально нарушало авторские права создателей видеороликов. Подняв шумиху вокруг OpenAI, Google рискует привлечь общественное внимание и к своим разработкам. Впрочем, представители Google говорят, что правила использования сервиса позволяют использовать данные YouTube для разработки новых функций видеоплатформы. Специализирующийся на интеллектуальной собственности юрист Berger Singerman Джеффри Лоттенберг (Geoffrey Lottenberg) отмечает, что в своих правилах Google использует крайне расплывчатые формулировки. И это сделано намеренно.

Google хотела обучать свои модели на открытых данных Google Docs, Google Sheets и других продуктов. В политике конфиденциальности Google говорилось, что компания может использовать публичные данные для обучения языковых моделей Google и других продуктов вроде Google Translate. Теперь же перечень продуктов помимо Google Translate содержит упоминания Bard и «облачных ИИ». Сотрудников компании специально проинструктировали выпустить новую редакцию политики конфиденциальности перед Днём независимости США, когда мысли людей заняты предстоящими праздниками.

 Марк Цукерберг. Источник изображения: профиль в ***

Марк Цукерберг. Источник изображения: профиль в Facebook

Глава Meta Марк Цукерберг (Mark Zuckerberg) годами развивал ИИ-направление, но выход ChatGPT в конце 2022 года оставил его компанию далеко позади. Трое бывших и нынешних сотрудников Meta рассказали, что стремясь догнать OpenAI, он день и ночь донимал менеджеров и ведущих инженеров, чтобы те как можно скорее выпустили конкурирующий продукт. Но как и все остальные, Meta упёрлась лбом в стену нехватки данных.

По словам вице-президента по генеративным ИИ Ахмада Аль-Дахле (Ahmad Al-Dahle), его команда использовала почти все доступные англоязычные книги, эссе, поэмы и новостные статьи в интернете для обучения собственной ИИ-модели. В конце концов, Аль-Дахле заявил, что Meta не превзойти ChatGPT без большего количества данных. К марту-апрелю 2023 года руководство Meta обсуждало эту проблему почти ежедневно. В частности, высказывалось предложение платить по $10 за полное лицензирование каждой книги или приобрести издательство Simon & Schuster, сотрудничающее со множеством авторов, среди которых, например, Стивен Кинг. Обсуждалась и возможность использования интернет-материалов без разрешения авторов, несмотря на возможные нарушения законов об авторском праве. Цукерберг требовал решить проблему немедленно, но инженеры компании заявили, что это невозможно.

 Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

На одном из записанных совещаний руководства Meta говорилось, что компания наняла субподрядчиков из Африки для сбора защищённых авторским правом материалов. «Мы не можем не собирать их», — сказали на одном из таких совещаний. Кроме того, подчёркивалось, что OpenAI тоже не стесняется использовать защищённые авторским правом материалы без разрешения их владельцев, и получать эти разрешения «слишком долго».

Сэм Альтман предложил решить проблему с помощью «синтетических данных», то есть обучать языковые модели на материалах других языковых моделей. По его словам, раз уж ИИ научились писать человекоподобные тексты, последние можно использовать для дальнейшего развития LLM, что к тому же позволит снизить зависимость от защищённых законом авторских произведений. «Пока ваши модели достаточно продвинуты, чтобы создавать качественные синтетические данные, всё нормально», — сказал Альтман. Однако обучение на данных других ИИ тоже не панацея — большие языковые модели могут попасть в цикл обработки ошибочных данных и недостатков технологии, которые будут нарастать на каждом его витке.

«Обучать ИИ — всё равно что пробираться через джунгли. Если обучать ИИ на одних лишь синтетических данных, они заблудятся», — сказал по этому поводу бывший исследователь в OpenAI, а ныне преподаватель компьютерных наук в Университете Британской Колумбии Джефф Клун (Jeff Clune).

Глава YouTube предостерёг OpenAI от обучения ИИ на видео с платформы

С активным развитием технологий искусственного интеллекта особенно остро встал вопрос о том, на каких материалах можно обучать эти системы, и что делать с авторскими правами на эти материалы. Гендиректор YouTube отметил, что компании OpenAI не следует рассматривать платформу в качестве источника материалов для обучения ИИ.

 Источник изображения: Alexander Shatov / unsplash.com

Источник изображения: Alexander Shatov / unsplash.com

Крупные игроки в своих сферах, включая New York Times и Getty Images, уже инициировали судебные иски в отношении разработчиков ИИ; аналогичные меры приняли некоторые художники и писатели. Масла в огонь подлила в марте технический директор OpenAI Мира Мурати (Mira Murati). В интервью The Wall Street Journal она заявила, что не уверена, используются ли для генератора видео Sora материалы YouTube, Instagram или Facebook.

Это побудило главу YouTube Нила Мохана (Neal Mohan) отреагировать и чётко предупредить, что использование материалов крупнейшего в мире видеосервиса для обучения OpenAI Sora будет «явным нарушением» условий использования платформы. «С точки зрения автора, когда он загружает плоды своей нелёгкой работы на нашу платформу, у него есть определённые ожидания. Одно из таких ожиданий в том, что будут соблюдаться условия обслуживания. Они не позволяют скачивать расшифровки или фрагменты видео, и это явное нарушение условий обслуживания. Это [своего рода] правила дорожного движения на нашей платформе», — заявил гендиректор YouTube в интервью Bloomberg.

Чёткие сведения о том, на каких материалах OpenAI обучает ИИ для своих служб Sora, ChatGPT и DALL-E, отсутствуют до сих пор. Для обучения модели GPT-5 компания намеревается применять расшифровки видео YouTube. Google же, будучи владельцем YouTube и конкурентом OpenAI, уверяет, что соблюдает правила: обучение Gemini требует аналогичных данных, но, как заявил Нил Мохан, использует лишь определённые видео в зависимости от разрешений, предоставленных каждым автором.

OpenAI расширила программу доработки и обучения специализированных ИИ-моделей

Компания OpenAI расширяет программу Custom Model, помогающую корпоративным клиентам разрабатывать специализированные генеративные модели ИИ для использования в конкретных целях.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Суть Custom Model заключается в привлечении специалистов OpenAI к обучению и оптимизации моделей ИИ для определённых задач. С момента запуска программы в прошлом году в ней успели поучаствовать «десятки клиентов», после чего OpenAI решила её расширить. Инженеры компании могут оптимизировать параметры сторонней модели, организовать процесс обучения, выработать системы оценки и создать инфраструктуру для улучшения эффективности работы ИИ в конкретных задачах.

Вторая услуга, «обучение на заказ», подразумевает дообучение и настройку собственных базовых моделей OpenAI (например, GPT-4) для клиентов, которым необходимы ИИ, «заточенные» для определённого применения и обладающие пониманием необходимой специфики.

«Мы считаем, что в будущем подавляющее большинство организаций будут разрабатывать ИИ под специфику собственной отрасли, бизнеса или направления. Благодаря разнообразию методов доработки, организации любого уровня могут получить ИИ-модель, необходимую для максимизации эффекта от её внедрения», — пишет в своём блоге OpenAI.

Cпециализированные модели ИИ зачастую работают быстрее и потребляют меньше ресурсов, чем аналоги общего назначения, поэтому доработка и дообучение собственных и чужих моделей ИИ теоретически поможет снизить нагрузку на собственную инфраструктуру OpenAI.

Tesla повысила зарплаты ИИ-специалистам, чтобы противостоять «браконьерству» со стороны OpenAI

Бум ИИ радикально повысил ценность специалистов в этой сфере. Ярким свидетельством этому является решение Tesla, которая была вынуждена увеличить зарплату своим инженерам по ИИ в попытке «предотвратить браконьерство со стороны таких компаний, как OpenAI», заявил генеральный директор компании Илон Маск (Elon Musk). По его словам, OpenAI «агрессивно набирает инженеров Tesla, предлагая огромные компенсационные предложения».

 Источник изображения: Reuters

Источник изображения: Reuters

К примеру, известный учёный в области машинного обучения Итан Найт (Ethan Knight) собирался покинуть Tesla, чтобы присоединиться к OpenAI, и Маску пришлось приложить немалые усилия, чтобы отговорить Найта от перехода к конкурентам и убедить его перейти на работу в xAI, стартап Маска в области ИИ.

Технологические компании предлагают компенсационные пакеты в миллионы долларов в год, ускоряют графики передачи акций и пытаются переманивать целые команды инженеров для привлечения людей с знаниями и опытом в области генеративного ИИ. Одновременно продолжаются увольнения специалистов в других областях IT, поскольку компании перераспределяют ресурсы в пользу технологий ИИ. Маск назвал происходящее «самой сумасшедшей войной талантов, которую он когда-либо видел».

Комментарии Маска прозвучали на фоне напряжённости в отношениях с генеральным директором OpenAI Сэмом Альтманом (Sam Altman). В феврале Маск подал иск против OpenAI, обвинив компанию в коммерциализации ИИ и погоне за прибылью. Маск, который был одним из учредителей OpenAI в 2015 году, считает, что тесные отношения OpenAI с Microsoft противоречат первоначальной цели компании — общедоступному ИИ с открытым исходным кодом. OpenAI отрицает эти обвинения. В настоящее время компания возглавляет рынок ИИ, в то время как xAI пытается догонять организацию, которую Маск в своё время финансировал.

Усилия Tesla в области ИИ до сих пор были сосредоточены на беспилотных автомобилях и роботах-гуманоидах. В 2022 году Маск продемонстрировал прототип робота-гуманоида на мероприятии Tesla, что стало частью его усилий по формированию имиджа компании как чего-то большего, чем просто производителя электромобилей. Летом 2023 года Tesla сообщила о планах потратить более $1 млрд до конца 2024 года на создание суперкомпьютера Dojo, который будет использоваться при разработке и проектировании беспилотных автомобилей. Подобные инициативы помогли повысить капитализацию Tesla и являются частью долгосрочной стратегии роста компании.

DALL-E 3 научился дорабатывать картинки и менять их части по текстовому запросу

OpenAI рассказала о новых возможностях редактирования картинок, созданных генеративным искусственным интеллектом DALL-E 3, который помимо прочего входит в платную подписку ChatGPT Plus за $20 в месяц.

 Источник изображений: openai.com

Источник изображений: openai.com

Теперь при щелчке по созданной DALL-E 3 картинке открывается специальный редактор, главная особенность которого — выбор и редактирование отдельных частей изображения без необходимости генерировать его заново. Картинку можно изменять глобально, задав уточняющий запрос в диалоговом пространстве в правой части редактора — например, попросить DALL-E 3 сделать её чёрно-белой.

Однако очевидно, что OpenAI куда больше гордится возможностью точечных правок. Для этого необходимо выбрать инструмент выделения, определиться с его размерами, а затем выделить необходимые области и ввести запрос. Как и полная генерация, правки происходят посредством ввода текстовых подсказок. Простейшее, что сразу приходит на ум — удаление и добавление объектов, однако возможности инструмента гораздо шире. В примере с котёнком можно выделить его мордочку и попросить ИИ изобразить определённую эмоцию.

Аналогичным образом происходит редактирование изображений в мобильном приложении ChatGPT, где перечисленные возможности также доступны.


window-new
Soft
Hard
Тренды 🔥
«Настало время двигаться дальше»: CD Projekt Red попрощалась с Cyberpunk 2077 и рассказала о «напряжённой работе» над The Witcher 4 7 мин.
Apple удалила Telegram и WhatsApp из китайского App Store 12 мин.
Paradox перенесла релиз крупного дополнения Sphere of Influence к Victoria 3, чтобы не повторять ошибок прошлого 46 мин.
«Нам не терпится подорвать мир снова»: Amazon продлила сериал Fallout на второй сезон 3 ч.
OpenAI отключила генератор изображений DALL-E 2 — его место займёт более продвинутый DALL-E 3 5 ч.
Создание российского аналога GitHub предложено отменить, а средства направить на поддержку open source 6 ч.
Meta бросила вызов ChatGPT — все сервисы компании получили «самого умного» ИИ-помощника 14 ч.
Meta добавила ИИ-генерацию изображений в реальном времени в WhatsApp — пока в тестовом режиме 15 ч.
Поисковик Brave научился отвечать на вопросы с помощью ИИ 15 ч.
Kingdom Come: Deliverance 2 официально анонсирована — первый трейлер и подробности 15 ч.