Опрос
|
реклама
Быстрый переход
ИИ-генератор Google Imagen 2 научился создавать 4-секундные анимированные изображения
09.04.2024 [18:07],
Павел Котов
Google сообщила, что генератор изображений Imagen 2 получил с очередным обновлением возможность создавать анимированные 4-секундные ролики. Модель также научилась по текстовым запросам редактировать готовые изображения, добавляя на них новые объекты или убирая их; а все новые картинки помечаются невидимыми цифровыми водяными знаками. ![]() Источник изображения: deepmind.google На мероприятии Google Cloud Next разработчик сообщил, что Imagen 2 теперь генерирует 4-секундные анимированные ролики с разрешением 360 × 640 пикселей и частотой 24 кадра в секунду. Google также пообещала в этом направлении «постоянные усовершенствования». «Если взглянуть, вместо картинки объекта, например, статического изображения автомобиля, можно увидеть короткий ролик, например, движущейся машины. Многим организациям, особенно в таких областях как СМИ и реклама, это интересно, потому что это улучшает взаимодействие с пользователем», — пояснил гендиректор Google Cloud Томас Куриан (Thomas Kurian). Генератор Imagen 2 создаёт изображения, используя различные ракурсы и движения камеры, «при этом сохраняя согласованность всей последовательности». Модель предлагает фильтры безопасности, которые предотвращают создание недопустимых материалов, и цифровые водяные знаки SynthID, позволяющие отслеживать созданные ИИ произведения. Imagen 2 также научился редактировать изображения, добавляя или удаляя элементы по текстовому запросу, и расширять границы изображения для увеличения обзора. Все эти возможности доступны на облачной платформе Vertex AI. Нейросеть Google Gemini 1.5 Pro обрела слух
09.04.2024 [16:45],
Павел Котов
С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2. ![]() Источник изображения: blog.google В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы. Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза. Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США. Нейросеть Google Gemini Pro поможет создавать Android-приложения — ИИ встроили в Android Studio
09.04.2024 [15:00],
Дмитрий Федоров
Google обновила интегрированную среду разработки (IDE) Android Studio, добавив в неё новейшего ИИ-помощника для генерации кода на основе ИИ-модели Gemini Pro, что обещает разработчикам более высокую эффективность и новые возможности в процессе создания приложений. ![]() Источник изображений: Google Android Studio выступает не просто как текстовый редактор для написания кода, но и предлагает разработчикам целый набор инструментов, включая эмулятор, позволяющий запускать виртуальные Android-смартфоны на машине с Windows и использовать их для тестирования и отладки приложений. В мае прошлого года Google внедрила в свою IDE-среду генеративный искусственный интеллект Studio Bot, созданный на базе большой языковой модели (LLM) PaLM 2, которую поисковый гигант анонсировал в том же месяце. Через шесть месяцев после дебюта PaLM 2 Google представила линейку флагманских LLM — Gemini, в которую вошли три модели с разным набором функций и аппаратными требованиями. ![]() Обновлённый чат-бот в Android Studio работает на Gemini 1.0 Pro — средней ИИ-модели серии, оптимизированной для сочетания высокого качества ответов и эффективности использования аппаратных ресурсов. Google также анонсировала её обновление до версии Gemini 1.5 Pro, которая, согласно внутренним тестам компании, превосходит свою предшественницу по 87 % бенчмарков, успешно обрабатывая задачи с более чем 100 000 строками кода. Сандхия Мохан (Sandhya Mohan), менеджер по продукту Android Studio, сообщила, что использование Studio Bot в канале Canary уже позволяло ощутить полезность и мощь этой технологии. Теперь же, с переходом чат-бота на Gemini Pro, пользователи увидят существенное улучшение качества ответов. Чат-бот способен отвечать на общие вопросы об Android, например, о том, как интегрировать приложение с функцией отслеживания местоположения в операционной системе. Также он отвечает на вопросы по конкретным проектам. Например, разработчик может попросить совета, как удалить дубликаты записей из набора данных, который приложение использует для работы некоторых функций. Возможности Gemini Pro в Android Studio охватывают даже более сложные задачи. По данным Google, новый ИИ-помощник умеет переписывать код на разных языках программирования, генерировать целые разделы интерфейса приложения и составлять документацию для нового кода, объясняя его функциональность и принципы работы. Чтобы активировать Gemini, необходимо войти в систему и включить функцию в настройках. Большинство возможностей доступны без отправки контекста кода, при этом ответы чат-бота базируются на истории общения, предоставляя пользователям контроль над конфиденциальностью данных. Для обучения нейросети xAI Grok 3 потребуется 100 000 ускорителей Nvidia H100, заявил Илон Маск
09.04.2024 [10:02],
Алексей Разин
Компания Tesla разрабатывает собственные нейронные процессоры для обучения автопилота, но возглавляющий её Илон Маск (Elon Musk) для прочих своих инициатив готов активно использовать ускорители вычислений Nvidia. Например, для обучения большой языковой модели Grok 3, по его словам, стартапу xAI потребуется до 100 000 ускорителей Nvidia H100. ![]() Источник изображения: Nvidia Эти заявления, как поясняет Tweaktown, миллиардер сделал на этой неделе в ходе выступления в сервисе аудиочатов Spaces. Он признался, что для обучения языковой модели Grok 2 потребовались ресурсы 20 000 ускорителей Nvidia H100, добавив, что для языковой модели следующего поколения их потребуется уже 100 000 штук. В январе этого года Маск сравнил уровень быстродействия фирменного суперкомпьютера Dojo стоимостью $500 млн с системой из 10 000 ускорителей Nvidia H100. В текущем году только компания Tesla должна потратить на закупку таких ускорителей гораздо больше денег, а ведь теперь под опекой Маска находится и стартап xAI, основанный в июле прошлого года и остро нуждающийся в масштабировании вычислительных ресурсов. По оценкам главы Tesla, компания должна тратить несколько миллиардов в год на закупку ускорителей, чтобы оставаться на плаву с точки зрения конкуренции. Как Илон Маск уточнил на страницах принадлежащей ему социальной сети X, именно компания Tesla является вторым по величине после Meta✴ Platforms обладателем ускорителей вычислений Nvidia H100, их в его распоряжении находится от 30 000 до 350 000 штук, по оценкам руководителя Tesla. Социальная сеть X и стартап xAI, по словам Маска, сообща располагают третьим по величине объёмом ускорителей Nvidia H100 в мире. По информации Reuters, Маск также предрёк появление превосходящего «умнейших людей» по своим когнитивным способностям так называемого «сильного» искусственного интеллекта (AGI) либо в следующем году, либо ещё через год. Для обучения модели Grok 2, которое должно завершиться к маю этого года, как признался Маск, компании xAI сейчас не хватает именно ускорителей вычислений Nvidia. В ближайшие год или два, по мнению Маска, главным сдерживающим развитие систем ИИ фактором станет нехватка энергоснабжающих ресурсов. OpenAI для обучения GPT-4 расшифровала миллионы видео с YouTube — текстов в интернете не хватило. Google тоже так делает
09.04.2024 [00:00],
Владимир Чижевский
Несколько дней назад сообщалось, что разработчики ИИ столкнулись с нехваткой данных для обучения передовых моделей, в том числе о планах Open AI обучать GPT-5 на видео с YouTube. Согласно материалу The New York Times, в погоне за новыми данными корпорации забывают об этике и морали. ![]() Источник изображения: freepik.com К концу 2021 года OpenAI столкнулась с нехваткой авторитетных англоязычных текстов в интернете для обучения новейшей модели искусственного интеллекта — ей требовалось гораздо больше данных. Тогда разработчики OpenAI создали расшифровывающую аудиозаписи из видеороликов на YouTube систему распознавания речи Whisper, которая выдаёт текст для обучения ИИ. По словам нескольких сотрудников, в компании понимали, что такой шаг может противоречить правилам использования YouTube, запрещающим использовать видеоролики «независимо» от платформы. Это не остановило OpenAI, расшифровавшую более миллиона часов видеороликов с YouTube. Полученный текст использовался для обучения GPT-4 — одной из мощнейших систем искусственного интеллекта в основе последней версии ChatGPT. В исследовании The New York Times говорится, что в гонку за данными включились все передовые разработчики ИИ, включая OpenAI, Google и Meta✴, причём компании зачастую игнорируют корпоративные политики, а иногда и закон. ![]() Джаред Каплан. Источник: physics-astronomy.jhu.edu В январе 2020 года физик-теоретик из Университета Джонса Хопкинса Джаред Каплан (Jared Kaplan) опубликовал работу об ИИ, которая разожгла аппетиты их разработчиков. Он высказался однозначно: чем больше данных используется для обучения языковой модели, тем лучше она работает, подобно тому, как студенты получают всё больше знаний из прочитанных книг. Языковые модели могут устанавливать закономерности и взаимосвязи, что позволяет точнее обрабатывать новую информацию. ![]() Сэм Альтман. Источник изображения: wikipedia.org Позднее Сэм Альтман (Sam Altman) из OpenAI заявил, что данные рано или поздно кончатся — он знает, о чём говорит, ведь компания годами собирала данные, обрабатывала и обучали на них ИИ. Среди использованных данных был программный код с GitHub, базы данных шахматных ходов, школьные тесты и домашние задания старшеклассников. К концу 2021 года они закончились. Помимо расшифровки аудио- и видеоматериалов, рассматривалась покупка компаний, имеющих доступ к огромным объёмам цифровых данных. ![]() Марк Цукерберг. Источник изображения: профиль в Facebook✴ Глава Meta✴ Марк Цукерберг (Mark Zuckerberg) годами развивал ИИ-направление, но выход ChatGPT в конце 2022 года оставил его компанию далеко позади. Трое бывших и нынешних сотрудников Meta✴ рассказали, что стремясь догнать OpenAI, он день и ночь донимал менеджеров и ведущих инженеров, чтобы те как можно скорее выпустили конкурирующий продукт. Но как и все остальные, Meta✴ упёрлась лбом в стену нехватки данных. ![]() Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn На одном из записанных совещаний руководства Meta✴ говорилось, что компания наняла субподрядчиков из Африки для сбора защищённых авторским правом материалов. «Мы не можем не собирать их», — сказали на одном из таких совещаний. Кроме того, подчёркивалось, что OpenAI тоже не стесняется использовать защищённые авторским правом материалы без разрешения их владельцев, и получать эти разрешения «слишком долго». Microsoft откроет центр разработки ИИ в Лондоне под руководством Джордана Хоффмана
08.04.2024 [18:14],
Дмитрий Федоров
Microsoft объявила о создании центра искусственного интеллекта (ИИ) в Лондоне, который возглавит Джордан Хоффман (Jordan Hoffmann), выдающийся учёный в области ИИ из стартапа Inflection AI. Этот шаг стал частью стратегии Microsoft по развитию потребительских ИИ-технологий и укреплению позиций в гонке за доминирование в этой области. ![]() Источник изображения: Placidplace / Pixabay Объявление о создании центра прозвучало спустя три недели после того, как генеральный директор Microsoft Сатья Наделла (Satya Nadella) представил новое подразделение ИИ для потребителей. Оно было создано под руководством основателей Inflection AI, включая Мустафу Сулеймана (Mustafa Suleyman) — сооснователя компании Deepmind, которая стала частью Google в 2014 году. Наделла упомянул, что несколько членов команды Inflection AI присоединились к новому подразделению ИИ в Microsoft. Теперь стало известно, что одним из них стал Хоффман. Он начал свою карьеру в 2020 году в качестве научного сотрудника в Deepmind, а затем перешёл в Inflection AI. Этот стартап привлёк внимание Microsoft в прошлом году, когда корпорация инвестировала в него средства. В своём блоге Сулейман назвал Хоффмана исключительным учёным и инженером в области ИИ. Хоффман возглавит лондонский центр, где будут разрабатываться языковые модели, соответствующая инфраструктура и инструментарий. Сулейман, напрямую подчиняющийся Наделле, подчеркнул значимость этого шага для Microsoft. Компания планирует в ближайшее время объявить о новых вакансиях для привлечения специалистов из ИИ-сферы. Ожидается, что они присоединятся к Хоффману в офисе Microsoft в Паддингтоне. Это усилит позиции компании по разработке инновационных технологий и поддержке ИИ-экосистемы. Великобритания считается одной из ведущих стран мира по объёму инвестиций в исследования в области ИИ, уступая лишь США и Китаю. Microsoft заявила, что в ближайшие три года инвестирует в данный регион $3,15 млрд с целью расширения площади своих центров обработки данных и обучения более миллиона человек для ИИ-экономики. В Spotify появился ИИ для создания плейлистов по текстовым запросам пользователя
08.04.2024 [16:39],
Владимир Мироненко
Стриминговый сервис Spotify представил функцию AI Playlist на основе искусственного интеллекта, которая позволяет пользователю создавать собственные плейлисты с помощью текстовых команд. В настоящее время функция находится на стадии бета-тестирования. Первоначально ею смогут воспользоваться владельцы подписки Premium для платформ Android и iOS, живущие в Австралии и Великобритании, после чего в ближайшие месяцы она будет доступна и в других странах. ![]() Источник изображений: Spotify Помимо стандартных запросов, основанных на жанре или временном интервале, подсказки могут относиться к разным вещам, например, к местам, животным, занятиям, персонажам фильмов, цветам или смайликам. Можно, например, попросить создать плейлист «песни для серенады моего кота» или «биты для борьбы с зомби-апокалипсисом» или же «плейлист, который заставляет меня почувствовать себя главным героем». Однако, как сообщила компания, лучше всего получается плейлист, когда в запросе содержится комбинация жанров, настроений, исполнителей и временного промежутка. ![]() Чтобы понять запрос пользователя, сервис использует большую языковую модель (LLM), после чего задействует свою технологию персонализации — имеющуюся у него информацию об истории и предпочтениях слушателя — для выполнения запроса и создания для него персонализированного плейлиста, сгенерированного искусственным интеллектом. Поэтому, если два разных пользователя подадут идентичный запрос, плейлист у них получится разный. Предложенный ИИ плейлист можно уточнить, самостоятельно удаляя или добавляя музыкальные треки. Также сообщается, что Spotify не будет создавать плейлист с помощью ИИ на основе подсказок, не связанных с музыкой, таких как «текущие события» или «конкретные бренды». Microsoft внедрит игровой ИИ в Xbox следующего поколения, но играть придётся самим
08.04.2024 [13:22],
Дмитрий Федоров
Из утёкшего в Cеть электронного письма Сары Бонд (Sarah Bond), президента Xbox, стало известно, что компания Microsoft готовит новое поколение консоли Xbox, оснащённое передовыми технологиями «Игрового ИИ» (Gaming AI). Это обещает самый значительный технологический скачок для игровой консоли за одно поколение. Как следствие, это не только улучшит игровой опыт пользователей, но и упростит процесс разработки видеоигр. ![]() Источник изображения: Xbox По имеющимся данным, следующее поколение Xbox будет оснащено специализированным аппаратным обеспечением для ИИ, возможно, разработанным в партнерстве с AMD или собственными силами инженеров Microsoft и Xbox. В свою очередь, для ПК это может значить внедрение технологий, аналогичных NVIDIA DLSS и AI-powered Frame Generation, повышающих производительность и качество изображения, что сделает игровой процесс ещё более плавным и реалистичным. Внедрение ИИ ожидается и на программном уровне. Его интеграция в DirectX 12 или DirectX 13 даст разработчикам доступ к продвинутым инструментам для оптимизации и разработки видеоигр, например, через усовершенствованный API Work Graphs. Такие инновации позволят создавать игры нового поколения с невиданным ранее уровнем детализации и интерактивности. Несмотря на то что полный спектр возможностей игрового ИИ до сих пор не раскрыт, возможно, он проникнет и в операционную систему (ОС). Специально для Xbox будет выпущена версия Windows с функцией Copilot. Поскольку релиз консоли Xbox следующего поколения ожидается в 2028 году, возможно, пройдёт некоторое время, прежде чем мы узнаем все подробности, но уже сейчас можно с уверенностью сказать, что ИИ сыграет важную роль в развитии Xbox. Илон Маск рассчитывает привлечь на развитие своего ИИ-стартапа xAI до $3 млрд
07.04.2024 [08:51],
Алексей Разин
Компания xAI была основана Илоном Маском (Elon Musk) только в июле прошлого года, а в январе текущего миллиардер заявил, что не ищет инвесторов для неё и не ведёт ни с кем переговоров на эту тему. Издание The Wall Street Journal утверждает, что теперь Маск собирается привлечь до $3 млрд средств близких к нему инвесторов в капитал xAI, оценивая тем самым бизнес компании в $18 млрд. ![]() Источник изображения: xAI Среди тех, кто может вложить крупную сумму в капитал xAI, источник упоминает венчурный фонд Gigafund, основанный Люком Носеком (Luke Nosek), с которым Маск знаком ещё со времён PayPal, и который сейчас занимает пост в совете директоров аэрокосмической компании SpaceX, также принадлежащей Илону Маску. В совете директоров Tesla Носек также состоял до 2020 года. Второй вероятный инвестор в капитал xAI — Стив Джурветсон (Steve Jurvetson), который также давно знаком с Маском, а сейчас занимает пост в совете директоров SpaceX. Носек и Маск в своё время пытались купить стартап DeepMind, который в итоге достался Google, так что отрицать у Носека наличие интереса к теме искусственного интеллекта сложно. По данным The Wall Street Journal, переговоры с потенциальными инвесторами xAI пока только ведутся, их исход нельзя предугадать. Очевидно, что стартапы в данной сфере привлекают внимание инвесторов. Тот же OpenAI, в становлении которого Илон Маск на определённом этапе тоже принимал участие, привлёк $13 млрд от Microsoft, а конкурирующий Anthropic привлёк более $6 млрд. На этом фоне упоминаемые $3 млрд для нужд xAI не кажутся такой уж большой суммой. Отметим, что Илон Маск пытается интегрировать разработанный xAI чат-бот Grok в сервисы принадлежащей ему социальной сети X, и ранее даже обещал передать инвесторам данной компании до 25 % акций xAI. В декабре прошлого года стало известно, что стартап пытался привлечь $1 млрд и даже заручился поддержкой четырёх инвесторов, готовых в совокупности вложить в компанию $135 млн, но Илон Маск впоследствии опроверг эти слухи. Сейчас, по данным источников, некоторые участники переговоров настаивают на привлечении к финансированию деятельности xAI нескольких специализированных инвестиционных фондов, пытаясь снизить потенциальную зависимость стартапа от небольшой группы венчурных компаний. Гендиректор OpenAI и бывший главный дизайнер Apple ищут инвестиции для создания персонального устройства на базе ИИ
06.04.2024 [08:08],
Владимир Мироненко
Гендиректор OpenAI Сэм Альтман (Sam Altman) и бывший главный дизайнер продуктов Apple Джони Айв (Jony Ive, на фото) решили объединить усилия для разработки персонального устройства на базе искусственного интеллекта (ИИ), и сейчас занимаются поиском финансирования совместного проекта, сообщил ресурс The Information. ![]() Источник изображения: macrumors.com О будущем устройстве с поддержкой ИИ пока мало известно, но оно не будет похоже на смартфон. Альтман является одним из инвесторов стартапа Humane, создавшего носимое устройство без экрана Humane AI pin с поддержкой ИИ, призванное заменить смартфон. Вполне возможно, что он планирует совместно с Айвом создать нечто подобное. Слухи о возможном сотрудничестве Айва и Альтмана в рамках нового проекта появились прошлой осенью. Как выясняется, они действительно тогда вели переговоры по этому поводу, которые находились на ранней стадии, поэтому официального анонса не поступило. По данным The Information, безымянный стартап Айва и Альтмана в настоящее время занят поиском средств для своей деятельности от крупных венчурных капиталистов, причём Айв намерен привлечь инвестиции в размере до $1 млрд. Среди возможных инвесторов упоминается японская корпорация SoftBank, поддерживающий OpenAI фонд Thrive Capital, а также вдова Стива Джобса Лорен Пауэлл. В Google Books появились книги сомнительного качества, написанные ИИ
05.04.2024 [22:33],
Владимир Чижевский
Эмануэль Майберг (Emanuel Maiberg) из 404Media провёл нехитрое исследование и обнаружил, что Google Books индексирует сгенерированные ИИ книги, при том довольно плохого качества. Для их поиска он использовал характерную для сгенерированных ИИ ответов фразу «As of my last knowledge update» («По последним данным из моей базы знаний»), и результаты его удивили, хотя ранее он уже находил написанные с использованием ИИ книги на Amazon и Google Play. ![]() Источник изображения: freepik.com Большинство книг с этой фразой на первых восьми страницах выдачи оказались не связаны с темой ИИ, для которой она была бы уместной. В качестве примера Майберг приводит книгу «Медведи, быки и волки: биржевая торговля для 20-летних» (Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old), которую автор позиционирует как «всеобъемлющее руководство для новичков, стремящихся раскрыть тайны финансовых рынков». Своим содержанием она напомнила сгенерированный ChatGPT текст с поверхностным анализом сложных событий, на уровне «Википедии». В других рассмотренных Майбергом книгах содержались откровенно устаревшие, бесполезные читателю в 2024 году сведения, которые скорее всего были почерпнуты ChatGPT из своей «базы знаний». Он приводит в пример вышедшую в марте 2024 года книгу «Максимум от Twitter: Стратегии успешного продвижения для новичков» (Maximize Your Twitter Presence: 101 Strategies for Marketing Success) Шу Чен Хоу (Shu Chen Hou). Как и в случае со множеством подобных авторов, на его счету числится не один десяток книг. В конце многостраничного раздела о верификации учётной записи в Twitter (ныне X) Майберг обнаружил строки: «Насколько мне известно на сентябрь 2021 года Twitter находилась в процессе переоценки и обновления критериев и процесса верификации, поэтому необходимые шаги могли измениться». В 2022 году Twitter приобрёл Илон Маск и превратил верификацию в торговлю «галочками». «Не могу поверить, что в компании не знают, что ищут пользователи в Google Books. Они индексируют всё подряд, но мне хотелось бы верить, что они могут распознать сгенерированные ИИ материалы, и они оказали бы себе и пользователям огромную услугу, если их промаркировали», — прокомментировал открытия Майберга библиотекарь, консультант и редактор infoDOCKET. Отдельное беспокойство Майберга вызывает возможное влияние таких книг на Google Ngram — профессиональный инструмент, оценивающий частоту вхождения фраз и отдельных слов в проиндексированных книгах с 1500 по 2019 годы. Он интересен тем, что учёные и исследователи используют его для оценки культурных тенденций. Соответственно, распространение написанных ИИ книг может заметно исказить результаты анализа с использованием Google Ngram. Однако представитель Google отрицает влияние сгенерированных книг на Google Ngram: «Наши автоматизированные алгоритмы настроены на поиск релевантных высококачественных книг. Указанные вами книги найдены по необычному и очень специфичному запросу, и не влияют на результаты Ngram. Мы стремимся, чтобы Ngram оставался высококачественным инструментом и продолжим адаптировать его по мере развития индустрии книгоиздания». «Ngram уже сейчас даёт довольно неточные данные, чтобы на них могли опираться вычислительные социологи и лингвисты, а через несколько лет он, вероятно, и вовсе потеряет значимость, — прокомментировала Алекс Ханна (Alex Hanna), директор по исследованиям Distributed AI Research Institute (DAIR). — Это ещё один пример того, как искусственный интеллект начинает поглощать сам себя. Созданный им контент попадает в Google Books, а затем Google начинает тренировать на его основе собственные модели. Да, они скажут, что тщательно контролируют качество, но детали они, конечно, не раскроют». Meta✴ начнёт маркировать сгенерированный ИИ контент
05.04.2024 [20:47],
Владимир Чижевский
С мая 2024 года компания Meta✴ введёт специальную метку для контента, сгенерированного искусственным интеллектом. Эта политика распространится на Instagram✴, Facebook✴ и Threads. ![]() Источник изображения: khunkorn / vecteezy.com По словам Meta✴, пометку «сделано с помощью ИИ» будут ставить как пользователи, так и сама компания, обнаружив «характерные для отрасли признаки ИИ-изображений». До этого правила Meta✴ относились лишь к видеороликам, в которых при помощи ИИ отображались люди, делающие то, чего на самом деле не было — и явно их запрещали. С момента их введения прошло четыре года, и с тех пор появилось множество других видов контента, помимо дипфейков. Опасаясь обвинений в ограничении свободы слова, Meta✴ решила не прибегать к запретительным мерам, а ограничиться маркировкой соответствующего контента. Компания уже автоматически проставляет уведомление «Imagined with AI» на созданных Meta✴ AI фотореалистичных изображениях. В будущем будет помечаться также аудио- и видеоконтент. Языковые модели ИИ сразились друг с другом в импровизированном турнире по Street Fighter III
05.04.2024 [18:24],
Николай Хижняк
На хакатоне Mistral AI, прошедшем в Сан-Франциско на минувшей неделе, разработчики Стэн Жирар (Stan Girard) и Quivr Brain представили тест LLM Colosseum с открытым исходным кодом, основанный на классическом аркадном файтинге Street Fighter III. Тест предназначен для определения самой эффективной языковой модели ИИ в не совсем традиционной, но зрелищной манере. ![]() Источник изображений: YouTube / Matthew Berman ИИ-энтузиаст Мэтью Берман (Matthew Berman) решил провести с помощь теста LLM Colosseum своеобразный турнир между языковыми моделями, о чём он поделился в своём видео. В нём же Берман показал один из поединков между ИИ. Кроме того, он рассказал, как можно установить этот проект с исходным кодом на домашний ПК или Mac и оценить его самостоятельно. Это не совсем типичный тест LLM. Как правило, маленькие языковые модели имеют преимущество в задержке и скорости, что приводит к победе в большинстве виртуальных боёв. В файтингах очень важна скорость реакции игроков на ответные действия своих оппонентов. То же правило работает и в случае противостояния ИИ против ИИ. ![]() Источник изображений: OpenGenerativeAI team Языковая модель в реальном времени принимает решение, как ей сражаться. Поскольку LLM представляют собой текстовые модели, их обучили в игре Street Fighter III с помощью текстовых подсказок. ИИ сначала дали проанализировать контекст игры в целом, а затем подсказали, как реагировать на то или иное игровое действие в той или иной ситуации, не забыв про вариативность ходов. ИИ обучили приближаться или отдаляться от противника, а также использовать различные приёмы вроде огненного шара, мегаудара, урагана и мегаогненного шара. Продемонстрированный на видео бой между ИИ выглядит динамично. Оппоненты действуют стратегически, блокируют удары противника и используют специальные приёмы. Однако к настоящему моменту проект LLM Colosseum позволяет использовать только одного игрового персонажа, Кена. Согласно тестам Жирара, лучшей языковой моделью в турнире Street Fighter III оказалась GPT 3.5 Turbo от OpenAI. Среди восьми участников она достигла самого высокого рейтинга ELO — 1776. В отдельной серии тестов, организованных Банджо Обайоми (Banjo Obayomi), специалистом по продвижению продуктов AWS компании Amazon, спарринги проводились между четырнадцатью языковыми моделями в рамках 314 индивидуальных матчей. Здесь в конечном итоге победила языковая модель claude_3_haiku от Anthropic с рейтингом ELO 1613. Глава YouTube предостерёг OpenAI от обучения ИИ на видео с платформы
05.04.2024 [16:56],
Павел Котов
С активным развитием технологий искусственного интеллекта особенно остро встал вопрос о том, на каких материалах можно обучать эти системы, и что делать с авторскими правами на эти материалы. Гендиректор YouTube отметил, что компании OpenAI не следует рассматривать платформу в качестве источника материалов для обучения ИИ. ![]() Источник изображения: Alexander Shatov / unsplash.com Крупные игроки в своих сферах, включая New York Times и Getty Images, уже инициировали судебные иски в отношении разработчиков ИИ; аналогичные меры приняли некоторые художники и писатели. Масла в огонь подлила в марте технический директор OpenAI Мира Мурати (Mira Murati). В интервью The Wall Street Journal она заявила, что не уверена, используются ли для генератора видео Sora материалы YouTube, Instagram✴ или Facebook✴. Это побудило главу YouTube Нила Мохана (Neal Mohan) отреагировать и чётко предупредить, что использование материалов крупнейшего в мире видеосервиса для обучения OpenAI Sora будет «явным нарушением» условий использования платформы. «С точки зрения автора, когда он загружает плоды своей нелёгкой работы на нашу платформу, у него есть определённые ожидания. Одно из таких ожиданий в том, что будут соблюдаться условия обслуживания. Они не позволяют скачивать расшифровки или фрагменты видео, и это явное нарушение условий обслуживания. Это [своего рода] правила дорожного движения на нашей платформе», — заявил гендиректор YouTube в интервью Bloomberg. Чёткие сведения о том, на каких материалах OpenAI обучает ИИ для своих служб Sora, ChatGPT и DALL-E, отсутствуют до сих пор. Для обучения модели GPT-5 компания намеревается применять расшифровки видео YouTube. Google же, будучи владельцем YouTube и конкурентом OpenAI, уверяет, что соблюдает правила: обучение Gemini требует аналогичных данных, но, как заявил Нил Мохан, использует лишь определённые видео в зависимости от разрешений, предоставленных каждым автором. Nvidia и Alphabet сильнее всех прибавили в стоимости за март, а Tesla пережила большое падение
05.04.2024 [00:49],
Владимир Мироненко
В минувшем месяце был зафиксированный самый большой скачок рыночной капитализации технологических компаний, подстёгиваемый значительным интересом к сфере искусственного интеллекта (ИИ) и ожиданием появления новых продуктов на его базе, а также планами по расширению деятельности в этом направлении. Рыночная стоимость Nvidia выросла к концу марта до $2,25 трлн, что на 14 % больше, чем на конец февраля. У Alphabet этот показатель увеличился на 9 % до $1,8 трлн. ![]() Источник изображения: Nvidia Как пишет Reuters, акции Nvidia показали рост после объявления компанией планов по выпуску нового флагманского ИИ-чипа B200 в конце этого года, а акции Alphabet выросли после того, как появились слухи об интересе Apple интерес к интеграции движка Gemini AI от Google в свои смартфоны. На фоне роста активности инвесторов в сфере ИИ-технологий также выросла рыночная стоимость тайваньского производителя полупроводников TSMC — примерно на 12 % до $632,5 млрд. В это же время производитель электромобилей Tesla столкнулся со значительным падением рыночной капитализации, сократившейся примерно на 13 % до $559,8 млрд на фоне опасений инвесторов по поводу спроса на его продукцию, растущей конкуренции и решения суда, лишившего гендиректора Илона Маска права на компенсационный пакет за руководство компанией в размере $56 млрд. У Apple тоже был отмечен спад: её рыночная капитализация упала на 5,1 % до $2,65 трлн на фоне замедления продаж iPhone и решения европейских регулирующих органов назначить ей штраф в $2 млрд за нарушение антимонопольного законодательства. Если брать в целом, то крупные технологические компании в этом году добились значительных успехов. К настоящему моменту в 2024 году рыночная капитализация Nvidia, Meta✴ Platforms и TSMC выросла на 81,8, 42 и 26 процентов соответственно. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |