Опрос
|
реклама
Быстрый переход
OpenAI расширила программу доработки и обучения специализированных ИИ-моделей
04.04.2024 [23:38],
Владимир Чижевский
Компания OpenAI расширяет программу Custom Model, помогающую корпоративным клиентам разрабатывать специализированные генеративные модели ИИ для использования в конкретных целях. ![]() Источник изображения: Growtika / unsplash.com Суть Custom Model заключается в привлечении специалистов OpenAI к обучению и оптимизации моделей ИИ для определённых задач. С момента запуска программы в прошлом году в ней успели поучаствовать «десятки клиентов», после чего OpenAI решила её расширить. Инженеры компании могут оптимизировать параметры сторонней модели, организовать процесс обучения, выработать системы оценки и создать инфраструктуру для улучшения эффективности работы ИИ в конкретных задачах. Вторая услуга, «обучение на заказ», подразумевает дообучение и настройку собственных базовых моделей OpenAI (например, GPT-4) для клиентов, которым необходимы ИИ, «заточенные» для определённого применения и обладающие пониманием необходимой специфики. «Мы считаем, что в будущем подавляющее большинство организаций будут разрабатывать ИИ под специфику собственной отрасли, бизнеса или направления. Благодаря разнообразию методов доработки, организации любого уровня могут получить ИИ-модель, необходимую для максимизации эффекта от её внедрения», — пишет в своём блоге OpenAI. Cпециализированные модели ИИ зачастую работают быстрее и потребляют меньше ресурсов, чем аналоги общего назначения, поэтому доработка и дообучение собственных и чужих моделей ИИ теоретически поможет снизить нагрузку на собственную инфраструктуру OpenAI. Baidu поселила свой ИИ в робота-гуманоида Walker S — он научился говорить, рассуждать и выполнять команды
04.04.2024 [19:07],
Сергей Сурабекянц
Китайская компания UBTech заключила партнёрское соглашение с Baidu, чтобы наделить робота-гуманоида естественной речи и способностью рассуждать в реальном времени. UBTech успешно интегрировала мультимодальную платформу искусственного интеллекта ERNIE Bot от Baidu в своего нового промышленного человекообразного робота Walker S. Робот выполняет голосовые команды, комментирует свои действия, отвечает на вопросы и даже даёт советы. ![]() Источник изображений: UBTech Компания UBTech была основана в 2012 году в Шэньчжэне и через два года представила своего первого гуманоидного робота размером с детскую игрушку. В 2016 году несколько сотен таких роботов научились совместным танцевальным па, а в 2017 году книга рекордов Гиннеса зафиксировала танец более тысячи роботов, двигающихся в унисон под ритмичную электронную музыку. UBTech впервые продемонстрировала своего полноразмерного сервисного робота Walker на выставке CES 2018. В конце прошлого года модернизированный Walker S поднялся на сцену в Гонконге вместе с руководителями компании, чтобы ударить в гонг, отметив тем самым выход компании IPO. Теперь робот готов бросить вызов свои собратьям Figure 01, Eve и Phoenix, демонстрируя навыки общения, логики и координации движений. ![]() Встроенные датчики глубины и видеокамеры помогают роботу получать представление об окружающем мире и ориентироваться в нём, избегать препятствий и распознавать трёхмерные объекты. Интеграция ИИ позволила роботу общаться на естественном человеческом языке, творчески подходить к выполнению команд и даже давать людям советы относительно одежды и внешнего вида. В прошлом году UBTech начала поставки Walker S для промышленного применения, заключив партнёрские отношения с несколькими автопроизводителями, включая NIO, «чтобы стратегически планировать поэтапное внедрение гуманоидных роботов в производственные сценарии». Tesla повысила зарплаты ИИ-специалистам, чтобы противостоять «браконьерству» со стороны OpenAI
04.04.2024 [18:37],
Сергей Сурабекянц
Бум ИИ радикально повысил ценность специалистов в этой сфере. Ярким свидетельством этому является решение Tesla, которая была вынуждена увеличить зарплату своим инженерам по ИИ в попытке «предотвратить браконьерство со стороны таких компаний, как OpenAI», заявил генеральный директор компании Илон Маск (Elon Musk). По его словам, OpenAI «агрессивно набирает инженеров Tesla, предлагая огромные компенсационные предложения». ![]() Источник изображения: Reuters К примеру, известный учёный в области машинного обучения Итан Найт (Ethan Knight) собирался покинуть Tesla, чтобы присоединиться к OpenAI, и Маску пришлось приложить немалые усилия, чтобы отговорить Найта от перехода к конкурентам и убедить его перейти на работу в xAI, стартап Маска в области ИИ. Технологические компании предлагают компенсационные пакеты в миллионы долларов в год, ускоряют графики передачи акций и пытаются переманивать целые команды инженеров для привлечения людей с знаниями и опытом в области генеративного ИИ. Одновременно продолжаются увольнения специалистов в других областях IT, поскольку компании перераспределяют ресурсы в пользу технологий ИИ. Маск назвал происходящее «самой сумасшедшей войной талантов, которую он когда-либо видел». Комментарии Маска прозвучали на фоне напряжённости в отношениях с генеральным директором OpenAI Сэмом Альтманом (Sam Altman). В феврале Маск подал иск против OpenAI, обвинив компанию в коммерциализации ИИ и погоне за прибылью. Маск, который был одним из учредителей OpenAI в 2015 году, считает, что тесные отношения OpenAI с Microsoft противоречат первоначальной цели компании — общедоступному ИИ с открытым исходным кодом. OpenAI отрицает эти обвинения. В настоящее время компания возглавляет рынок ИИ, в то время как xAI пытается догонять организацию, которую Маск в своё время финансировал. Усилия Tesla в области ИИ до сих пор были сосредоточены на беспилотных автомобилях и роботах-гуманоидах. В 2022 году Маск продемонстрировал прототип робота-гуманоида на мероприятии Tesla, что стало частью его усилий по формированию имиджа компании как чего-то большего, чем просто производителя электромобилей. Летом 2023 года Tesla сообщила о планах потратить более $1 млрд до конца 2024 года на создание суперкомпьютера Dojo, который будет использоваться при разработке и проектировании беспилотных автомобилей. Подобные инициативы помогли повысить капитализацию Tesla и являются частью долгосрочной стратегии роста компании. ИИ Meta✴ оказался неспособен рисовать азиатов вместе с представителями других рас
04.04.2024 [18:28],
Павел Котов
Разработанный Meta✴ генератор изображений на основе искусственного интеллекта вслед за Google Gemini продемонстрировал неожиданное отношение к расовому вопросу. Созданная гигантом соцсетей система оказалась почти неспособной изображать азиатов совместно с представителями других рас, обратила внимание журналистка The Verge Миа Сато (Mia Sato), которая сама является азиаткой. ![]() Источник изображений: Meta✴ Она несколько десятков раз обращалась к созданному Meta✴ ИИ-генератору изображений, используя такие запросы как «мужчина-азиат и друг-европеец», «муж-азиат и жена с европейскими чертами лица», «азиатская женщина и муж-европеец». И лишь однажды система смогла точно изобразить предложенных ей представителей рас. Вариации запросов ситуацию не спасли. Команда «азиатский мужчина и белая женщина, улыбающиеся с собакой» привела к появлению трёх подряд изображений двух людей азиатской расы. Замена слова «белая» на «европейка» дала тот же результат. По запросу «мужчина-азиат и женщина-европейка в день свадьбы» ИИ предложил изображение мужчины-азиата в костюме и женщины-азиатки в традиционной одежде — причём это было нечто среднее между китайским платьем ципао и японским кимоно. ![]() Перемены не наступили и с переходом в плоскость платонических отношений. По запросам «азиатский мужчина с европейским другом» и «азиатская женщина и белая подруга» генератор изображений Meta✴ снова предложил одних азиатов. Двух азиатских женщин система предложила и по запросу «азиатская женщина с темнокожей подругой». Адекватный ответ появился лишь по запросу «женщина-азиатка с подругой-афроамериканкой». Не очень помогла и смена региона. По запросу «мужчина из Южной Азии с женой-европейкой» ИИ сначала представил корректное изображение, но за ним по тому же запросу последовала картинка с двумя представителями Южной Азии. Причём система обращался к стереотипам, украшая южноазиатских женщин бинди (красными точками на лбу) и сари (традиционной в Индии женской одеждой). ![]() Только одна попытка изобразить азиатку с подругой-афроамериканкой увенчалась успехом Стоит отметить, что под «азиатскими женщинами» ИИ Meta✴ понимает образы светлокожих женщин из Восточной Азии, хотя самой густонаселённой страной в Азии является Индия. Причём азиатские мужчины, принадлежащие, по мнению генератора изображений, к той же этнической группе, иногда оказываются пожилыми, зато женщины всегда изображаются молодыми. Meta✴ комментариев по данному вопросу пока не предоставила. К слову, жена главы компании Марка Цукерберга (Mark Zuckerberg), представителя европейской расы, — Присцила Чан (Priscilla Chan), по происхождению является китаянкой. Google захотела брать деньги за поиск с ИИ
04.04.2024 [11:35],
Павел Котов
Компания Google изучает возможность ввести плату за службу веб-поиска с помощью искусственного интеллекта. Если инициатива будет реализована, это станет первым случаем, когда один из основных продуктов компании начнёт предоставляться за деньги. ![]() Источник изображений: blog.google Google рассматривает варианты добавления некоторых функций на основе ИИ в доступные по платной подписке премиальные сервисы, которые уже включают доступ к новому помощнику Gemini в Gmail и «Документах», сообщает Financial Times со ссылкой на три источника. Разработка необходимых для развёртывания сервиса технологий ещё ведётся, и руководство ещё не приняло окончательного решения, стоит ли его запускать и когда это следует делать, утверждает один из источников. Традиционная поисковая система Google останется бесплатной, а реклама продолжит появляться рядом с результатами поиска даже для платных подписчиков. Пользовательские сервисы Google в течение многих лет оставались преимущественно бесплатными — они полностью финансировались за счёт рекламы. По итогам прошлого года выручка Google от поисковой и сопутствующей рекламы составила $175 млрд. Это более половины от общего объёма продаж, и в связи с этим компании необходимо ответить на вопрос: как внедрить инновационные решения в области ИИ, сохранив при этом большой источник прибыли. С ноября 2022 года, когда OpenAI запустила ChatGPT, Google отчаянно стремится отреагировать на конкурентную угрозу со стороны популярного чат-бота — он оперативно даёт полные ответы на многие вопросы, угрожая сделать ненужным традиционный механизм работы поисковых служб, а значит, и рекламу, которая появляется в поиске. ![]() В мае прошлого года Google начала тестировать экспериментальную поисковую систему на базе ИИ — она предлагает подробные ответы на вопросы, выводит ссылки на дополнительную информацию и показывает рекламу. Но компания не спешила добавлять функции сервиса SGE (Search Generative Experience) в основную поисковую систему. Результаты поиска с ИИ обходятся Google дороже традиционной выдачи, поскольку генеративный ИИ потребляет гораздо больше вычислительных ресурсов. Компания предложила доступ к SGE лишь немногим избранным пользователям, включая подписчиков Google One, которым за дополнительную плату предлагаются некоторые преимущества, например, дополнительное место в облачном хранилище. Microsoft в партнёрстве с OpenAI уже более года назад запустила чат-бот, который теперь называется Copilot, в своей поисковой системе Bing, но новые функции ИИ мало что сделали для увеличения рыночной доли Bing, и она по-прежнему сильно уступает Google. Аналитики предупреждают, что если поисковая система Google начнёт предоставлять более полные ответы с генеративным ИИ, её рекламный бизнес пострадает, потому что пользователям больше не будет нужно переходить на сайты рекламодателей. Зависящие от трафика Google интернет-издатели тоже опасаются, что ИИ начнёт извлекать данные с их ресурсов, и посещаемость последних упадёт. В этом году Google уже добавила передовую версию чат-бота Gemini в новый тариф Google One. Пока неясно, когда компания намеревается запустить поиск на основе ИИ, и в каком формате он будет доступен подписчикам, но знакомые с работой Google источники утверждают, что всё ещё не исключается возможность добавить некоторые функции SGE к основной поисковой системе. В самой Google заявили Financial Times, что «не разрабатывают и не рассматривают» развёртывание поиска без рекламы, но компания «продолжит создавать новые премиальные функции для развития сервисов по подписке в Google». Браузер Brave для iPhone и iPad обзавёлся ИИ-помощником, для которого можно выбрать нейросеть
04.04.2024 [00:02],
Владимир Чижевский
Компания Brave объявила, что в мобильной версии её одноимённого браузера для iPhone и iPad появился ИИ-помощник Leo, который умеет отвечать на вопросы, кратко пересказывать и переводить контент страницы, а также многое другое. ![]() Источник изображения: Rubaitul Azad / unsplash.com ИИ-помощник Leo уже был в Brave для Android и ПК, однако у подзадержавшейся версии для iOS есть преимущество — он умеет преобразовывать голос в текст, что избавляет от необходимости набирать запросы с виртуальной клавиатуры. Помимо краткого пересказа видео и текста, Leo умеет отвечать на вопросы о содержимом страницы и транскрибировать аудио- и видеоматериалы. По умолчанию Leo использует большую языковую модель (LLM) Mixtral 8x7B, но пользователям доступны также Claude Instant от Anthropic и Llama 2 13B от Meta✴. Для получения расширенных возможностей придётся оформить подписку Leo Premium за $14,99 в месяц. Для работы Leo необходима iOS 16.3 или новее. DALL-E 3 научился дорабатывать картинки и менять их части по текстовому запросу
03.04.2024 [18:58],
Владимир Чижевский
OpenAI рассказала о новых возможностях редактирования картинок, созданных генеративным искусственным интеллектом DALL-E 3, который помимо прочего входит в платную подписку ChatGPT Plus за $20 в месяц. Теперь при щелчке по созданной DALL-E 3 картинке открывается специальный редактор, главная особенность которого — выбор и редактирование отдельных частей изображения без необходимости генерировать его заново. Картинку можно изменять глобально, задав уточняющий запрос в диалоговом пространстве в правой части редактора — например, попросить DALL-E 3 сделать её чёрно-белой. Однако очевидно, что OpenAI куда больше гордится возможностью точечных правок. Для этого необходимо выбрать инструмент выделения, определиться с его размерами, а затем выделить необходимые области и ввести запрос. Как и полная генерация, правки происходят посредством ввода текстовых подсказок. Простейшее, что сразу приходит на ум — удаление и добавление объектов, однако возможности инструмента гораздо шире. В примере с котёнком можно выделить его мордочку и попросить ИИ изобразить определённую эмоцию. Аналогичным образом происходит редактирование изображений в мобильном приложении ChatGPT, где перечисленные возможности также доступны. Представлена нейросеть Stable Audio 2.0 для генерации полноценных трёхминутных музыкальных треков с вокалом
03.04.2024 [18:37],
Сергей Сурабекянц
Модель ИИ для генерации аудио Stable Audio 2.0 от Stability AI позволяет пользователям загружать свои собственные аудиозаписи, на основе которых ИИ генерирует трёхминутные треки в соответствии с подсказками. По утверждению Stability AI, главное отличие новой версии Stable Audio состоит в создании песен с классической музыкальной структурой: вступлением, развитием и финалом. Тем не менее, эксперты уверены, что на «Грэмми» этим трекам пока рассчитывать не приходится. ![]() Источник изображения: Pixabay Первая версия Stable Audio была выпущена в сентябре 2023 года и предлагала платным пользователям генерацию треков длительностью до 90 секунд, пригодных только для экспериментов. Stable Audio 2.0 генерирует полноценный трёхминутный аудиофайл, что соответствует продолжительности песен для радиовещания. Новая версия Stable Audio полностью бесплатна и доступна как на официальном сайте, так и через API. Stability AI сообщила, что модель обучалась на данных музыкальной библиотеки AudioSparx из более чем 800 000 композиций, причём артистам была предоставлена возможность запретить использование своего материала для обучения модели. Stable Audio 2.0 позволяет пользователям настраивать проект в широком диапазоне, регулируя степень влияния подсказки и то, какую часть загруженного аудио она будет изменять. Доступно добавление звуковых эффектов. Исследователи, успевшие поэкспериментировать со Stable Audio 2.0, довольно сдержаны в своих оценках. По мнению одного из них, добавленный генератором вокал похож на звуки, издаваемые китами, другому показалось, что он «случайно вызвал в свой дом потустороннее существо». Эксперты назвали сгенерированные треки «бездушными и странными». Все загруженные пользователем аудиозаписи не должны нарушать авторских прав. Проблемы с последними стали одной из причин, по которой бывший вице-президент Stability AI Эд Ньютон-Рекс (Ed Newton-Rex) покинул компанию вскоре после запуска Stable Audio. Теперь Stability AI заключила партнёрское соглашение с Audible Magic, чтобы использовать технологию распознавания контента, разработанную компанией, для отслеживания и блокировки попадания на платформу материалов, защищённых авторским правом. Браузер Opera One теперь может локально запускать большие языковые модели
03.04.2024 [17:44],
Владимир Фетисов
В прошлом году компания Opera представила новый браузер Opera One, который ориентирован на использование технологий на основе искусственного интеллекта. Теперь же разработчики объявили, что пользователи приложения смогут скачивать и локально использовать на своих компьютерах большие языковые модели (LLM). ![]() Источник изображения: Opera На данный момент пользователи Opera One могут выбирать между более чем 150 языковыми моделями из более чем 50 семейств. Среди доступных LLM можно выделить алгоритмы LLaMA от Meta✴ Platforms, Gemma (открытая версия модели Gemini) от Google и Vicuna. Нововведение будет доступно в рамках программы Opera AI Feature Drops, позволяющей пользователям получить ранний доступ к некоторым ИИ-функциям. По данным Opera, для запуска LLM на локальных компьютерах пользователей используется фреймворк с открытым исходным кодом Ollama. В настоящее время все доступные LLM представляют собой части библиотеки Ollama, но в будущем разработчики планируют реализовать возможность доступа к моделям из разных источников. При скачивании какой-либо LLM потребуется более 2 Гбайт свободного места на локальном носителе. «Opera впервые предоставляет доступ к большому количеству локальных LLM сторонних разработчиков непосредственно в браузере. Ожидается, что их размер будет уменьшаться по мере того, как они будут становиться более специализированными и ориентированными на решение определённых задач», — прокомментировал данный вопрос Ян Стендаль (Jan Standal), вице-президент Opera. ИИ-помощник Copilot обновился до GPT-4 Turbo, но только для бизнес-пользователей Microsoft 365
03.04.2024 [17:14],
Дмитрий Федоров
Microsoft расширила функциональность своего ИИ-помощника Copilot для бизнес-подписчиков Microsoft 365, предоставив им доступ к инновационной модели GPT-4 Turbo и улучшенным возможностям генерации изображений. Это обновление не только снимает ограничение на количество ежедневных сессий общения с ИИ, но и значительно расширяет креативные и аналитические возможности сотрудников компаний в рамках единой подписки. ![]() Источник изображения: Microsoft За фиксированную стоимость в размере $30 на одного пользователя в месяц подписчики теперь способны вести неограниченное количество диалогов с ИИ-помощником Copilot и получать от него мгновенные ответы на сложные запросы, обрабатывая данные из широкого спектра источников, включая документы, электронные письма и планировщики встреч — всё это благодаря интеграции сервиса с GPT-4 Turbo. GPT-4 Turbo, отличающийся способностью анализировать до 300 страниц текста за один запрос, предоставляет бизнес-пользователям максимальную точность в обработке информации. Это существенно повышает эффективность принятия решений и ускоряет выполнение рабочих задач. Кроме того, для пользователей Copilot Microsoft значительно расширила возможности генерации изображений в пакете Designer, увеличив дневной лимит до 100 изображений. Подобный шаг отражает стремление Microsoft форсировать применение ИИ в бизнес-процессах своих клиентов, предоставляя подписчикам инструменты для повышения продуктивности и креативности. Благодаря обновлениям, компании теперь могут эффективнее использовать ИИ для анализа данных, создания контента и управления информацией в корпоративной среде. Билли Айлиш и сотни музыкантов попросили защиты от неправомерного применения ИИ в музыке
03.04.2024 [17:08],
Дмитрий Федоров
Более 200 известных музыкантов и владельцев авторских прав подписали открытое письмо, которое было опубликовано правозащитной группой Artist Rights Alliance. В нём они выразили серьёзную обеспокоенность неправомерным использованием искусственного интеллекта в музыке, призывая к немедленному регулированию этой области с целью предотвращения потенциального ущерба их творчеству и культурному наследию. ![]() Источник изображения: artistrightsnow.medium.com В числе подписавшихся — звёзды мировой музыки и наследники прав на творения легендарных исполнителей: Стиви Уандер (Stevie Wonder), Смоки Робинсон (Smokey Robinson), Билли Айлиш (Billie Eilish), Джон Бон Джови (Jon Bon Jovi), Кэти Перри (Katy Perry), группы REM и Pearl Jam, а также представители наследия Боба Марли (Bob Marley) и Фрэнка Синатры (Frank Sinatra). Такое многообразие жанров и поколений иллюстрирует общую обеспокоенность влиянием ИИ на музыкальное искусство. Открытое письмо поднимает вопрос о двойственной природе ИИ: с одной стороны, его потенциал для расширения границ творчества в музыкальной индустрии неоспорим, с другой — существует риск его неправомерного использования, когда технологии подрывают уникальность и ценность авторского труда. Проблема касается инструментов, разработанных технологическими гигантами. Эти инновации вызывают волну споров о нарушении авторских прав и риски судебных разбирательств. Письмо акцентирует внимание на том, что неконтролируемое применение ИИ ставит под угрозу не только авторское право, но и личную идентичность артистов, их творческую уникальность и финансовую независимость. Авторы призывают к ответственному использованию технологий, подчёркивая безразличие крупных компаний к их правам. Губернатор штата Теннесси Билл Ли (Bill Lee) выступил в поддержку музыкантов, приняв законопроект, направленный на защиту авторов от неправомерного использования их творчества компаниями, занимающимися разработкой ИИ. Закон, получивший название «Закон Элвиса» (Elvis Act), призван защитить уникальность и интеллектуальную собственность артистов. Особое внимание уделяется инструментам, способным генерировать тексты песен, имитируя стили различных авторов. Примером служит реакция австралийского исполнителя Ника Кейва (Nick Cave) на сборник его собственных текстов, созданных с помощью ChatGPT, который назвал «гротескной карикатурой на человечность». Не все воспринимают подобные инновации негативно. Люсиан Грейндж (Lucian Grainge), глава Universal Music Group, высказал мнение о необходимости поиска компромиссов, совместной работы ИИ и музыкантов над созданием будущего, где технологии и творчество будут дополнять друг друга. У ИИ-бота Grok Илона Маска оказалось очень легко выпытать рекомендации по совершению преступлений
03.04.2024 [16:41],
Павел Котов
Модель генеративного искусственного интеллекта Grok, разработанная под руководством Илона Маска (Elon Musk), оказалась наиболее уязвимой к атакам, направленным на нарушение запретов — в отдельных случаях она без лишних ухищрений рассказывает, как совершать преступления, например, вскрыть чужую машину или создать запрещённые вещества. ![]() Источник изображения: x.ai Открытие сделали специалисты Adversa AI. Они провели серию тестов на наиболее популярных чат-ботах с ИИ. В их число вошло семейство OpenAI ChatGPT, Mistral Le Chat, Meta✴ LLaMA, Google Gemini, Microsoft Bing и Grok. Применив к ним наиболее известные методики атак, исследователи сделали вывод, что наиболее слабая защита у чат-бота Grok, который работает в соцсети X. Атаки производятся посредством ввода в качестве запросов специальных запросов, провоцирующих ИИ игнорировать защитные механизмы и выдавать ответы, которые нарушают общепризнанные этические нормы. В частности, применялись методы лингвистических логических манипуляций UCAR (подражание аморальному компьютеру); манипуляции с логикой программирования (просьба к ИИ переводить запросы в формат SQL); логические манипуляции; а также метод «Тома и Джерри», маскирующий недопустимые запросы к ИИ под диалог. Когда доступ к ИИ осуществляется через API или интерфейс чат-бота, создатели сервисов накладывают на них ограничения, блокирующие вывод нежелательного контента. Эти средства в той или иной мере работают эффективно на большинстве платформ, но Grok оказался готовым выдавать сомнительную информацию по прямым запросам: так, он рассказал, как изготовить бомбу, взломать автомобиль или самостоятельно получить запрещённый во многих странах сильнодействующий галлюциноген. От других чат-ботов авторам исследования не удалось добиться вразумительных ответов о жестоком обращении с детьми — не работал ни один из методов атаки. Grok поделился и этой информацией, поддавшись на две атаки из четырёх. Условия использования Grok требуют, чтобы его пользователи были совершеннолетними и не использовали чат-бот для нарушения или попыток нарушить закон. Предоставляемая им порой информация в той или иной мере доступна в поисковых системах, но бум современных систем ИИ поставил перед обществом другой вопрос: хотим ли мы, чтобы потенциально опасную информацию распространяли ещё и чат-боты. Найден новый способ заставить ИИ говорить на запрещённые темы — нужно просто измотать его вопросами
03.04.2024 [11:16],
Павел Котов
Разработчики современных систем искусственного интеллекта накладывают на них ограничения, запрещая давать ответы на отступающие от традиционных этических норм вопросы. Существует множество способов обойти эти ограничения, и очередной такой способ открыли исследователи из компании Anthropic — измотать ИИ вопросами. ![]() Источник изображения: Gerd Altmann / pixabay.com Учёные назвали новый тип атаки «многоимпульсным взломом» (many-shot jailbreaking) — они подробно описали его в статье и предупредили коллег о выявленной уязвимости, чтобы последствия атаки можно было смягчить. Уязвимость возникла из-за того, что у больших языковых моделей последнего поколения увеличилось контекстное окно — объём данных, который они могут хранить в том, что заменяет им кратковременную память. Раньше этот объём данных ограничивался несколькими предложениями, а сейчас он вмещает тысячи слов и даже целые книги. Исследователи Anthropic обнаружили, что модели с большими контекстными окнами, как правило, лучше справляются с задачами, если в запросе содержатся несколько примеров решения подобных задач. Другими словами, чем больше в запросе простых вопросов, тем выше качество ответа. И если первый вопрос ИИ понимает неправильно, то с сотым ошибки уже не будет. Но в результате такого «контекстного обучения» большая языковая модель начинает «лучше» отвечать на недопустимые вопросы. Так, если просто спросить её, как собрать бомбу, она откажется отвечать. Но если перед этим задать модели 99 менее опасных вопросов, а затем снова спросить, как собрать бомбу, вероятность получить недопустимый ответ вырастет. ![]() Источник изображения: anthropic.com Трудно сказать наверняка, почему эта атака срабатывает. В действительности никто не знает, что творится в сложной системе весов, которую представляет собой большая языковая модель, но, видимо, существует некий механизм, который помогает ей сосредоточиться на том, что нужно пользователю — понять это помогает содержимое контекстного окна. И когда он говорит о том, что можно принять за мелочи, после упоминания в нескольких десятках вопросов они перестают быть мелочами. Авторы работы из Anthropic проинформировали коллег и конкурентов о результатах исследования — они считают, что раскрытие информации подобного рода должно войти в отраслевую практику, и в результате «сформируется культура, в которой эксплойты вроде этого будут открыто распространяться среди разработчиков больших языковых моделей и исследователей». Наиболее очевидный способ смягчить последствия атаки — сократить контекстное окно модели, но это снизит качество её работы. США со дня на день могут запретить поставки антисанкционных GeForce RTX 4090D и Nvidia H20 в Китай
02.04.2024 [21:52],
Николай Хижняк
На прошлой неделе американское правительство объявило о пересмотре ограничений на поставку в Китай ИИ-чипов и оборудования для их производства, чтобы ещё больше усложнить для Поднебесной доступ к новейшим технологиям. Как выяснилось, антисанкционная игровая видеокарта GeForce RTX 4090D, а также специализированный ИИ-ускоритель Nvidia H20 могут попасть под действие новых рестрикций. ![]() Источник изображения: Nvidia China Игровая видеокарта GeForce RTX 4090D и ИИ-ускорители Nvidia H20 были разработаны компанией Nvidia специально для Китая на замену обычной видеокарте GeForce RTX 4090 и ИИ-ускорителю Nvidia H100 в ответ на предыдущие санкции США в отношении Поднебесной. Они не подпадают под актуальные правила экспортного контроля, поскольку их производительность меньше, чем у решений, которые они заменяют. Однако новая редакция 166-страничного документа об экспортном контроле Министерства торговли США указывает на то, что поставки GeForce RTX 4090D и Nvidia H20 в Китай в итоге тоже могут быть запрещены. На это обратило внимание китайское издание Icedeal. В частности, обновленные правила теперь требуют лицензирования компонентов, а также компьютеров, вычислительная производительность которых превышает 70 Тфлопс (терафлопс). «Для всех направлений, за исключением стран, входящих в группу стран E:1 или E:2 Дополнения № 1 к части 740 EAR, лицензия (NLR) не требуется для компьютеров с "скорректированной пиковой производительностью" (APP) не более 70 Тфлопс, а также для "электронных сборок", описанных в пункте 4A003.c, которые не способны превышать "скорректированную пиковую производительность" 70 Тфлопс…», — ссылается издание Icedeal на документ, доступный в PDF-версии на сайте Министерства торговли США. Игровая видеокарта GeForce RTX 4090D обеспечивает вычислительную производительность в операциях одинарной точности на уровне 73,5 Тфлопс, а специализированной ИИ-ускоритель Nvidia H20 на архитектуре Hopper для дата-центров обладает производительностью 74 Тфлопс. В новых правилах также указано, что каждый случай экспорта ИИ-чипов в Китай будет рассматриваться американским правительством в отдельности. По сообщению издания South China Morning Post, Пекин выразил своё несогласие с пересмотренными мерами экспортного контроля, объявленными в прошлую пятницу, раскритиковав правительство США за одностороннее изменение правил и ущемление прав как китайских, так и американских компаний. Представитель Министерства торговли Китая заявил, что этот шаг не только создаёт дополнительные препятствия для нормального экономического и торгового сотрудничества между китайскими и американскими фирмами, увеличивая бремя соблюдения требований, но и отрицательно влияет на мировую полупроводниковую промышленность. Новые экспортные правила США вступят в силу 4 апреля. Apple разработала ИИ, который понимает человека лучше GPT-4
02.04.2024 [17:38],
Павел Котов
Научные сотрудники Apple разработали систему искусственного интеллекта ReALM (Reference Resolution as Language Modeling), способную существенно улучшить понимание человека голосовыми помощниками и повысить эффективность их реакции на запросы. ![]() В Apple описали систему как способ решить проблему разрешения ссылок большими языковыми моделями — она поможет ИИ интерпретировать описание пользователем объектов на экране и лучше понимать контекст разговора. В результате ReALM приведёт к более интуитивному и естественному взаимодействию с устройствами. Разрешение ссылок помогает системам лучше понимать естественную речь, позволяя пользователям в разговоре с ИИ пользоваться местоимениями и другими косвенными отсылками. Для голосовых помощников этот аспект взаимодействия с человеком традиционно представлял значительную проблему, и система ReALM сводит её к задаче, решаемой на уровне языковой модели. ИИ начинает адекватно воспринимать отсылки к визуальным элементам на экране и интегрирует эти понятия в поток разговора. ReALM восстанавливает визуальный макет экрана при помощи текстовых представлений. Этот процесс включает в себя анализ экранных объектов и их местоположений с его переводом в текстовый формат, отражающий содержимое и структуру элементов на экране. Исследователи Apple обнаружили, что этот способ в сочетании с тонкой настройкой языковых моделей значительно превосходит традиционные методы, включая возможности нейросети OpenAI GPT-4. ReALM поможет пользователям предельно просто описывать элементы экрана, а ИИ-помощникам — понимать такие описания. Эти возможности окажутся полезными, например, при управлении информационно-развлекательными системами автомобилей с помощью голосовых команд и повысят эффективность голосового интерфейса для людей с ограниченными возможностями. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |