Опрос
|
реклама
Быстрый переход
Веб-поиск ChatGPT оказался беззащитен перед манипуляциями и обманом
25.12.2024 [16:41],
Павел Котов
Поисковая служба OpenAI ChatGPT оказалась открытой для манипуляций с использованием скрытого содержимого, а в качестве ответов на запросы она может возвращать вредоносный код с сайтов, по которым производится поиск. Об этом пишет Guardian со ссылкой на результаты собственного расследования. ![]() Источник изображения: Growtika / unsplash.com Надёжность функции веб-поиска ChatGPT вызывает сомнения. Издание Guardian решило проверить, как искусственный интеллект реагирует на просьбу составить сводку содержимого веб-страницы, на которой есть скрытый текст. В нём могут находиться дополнительные инструкции, способные изменить ответы ChatGPT — недобросовестные владельцы ресурсов могут пользоваться этим методом злонамеренно, например, заставить систему дать положительный отзыв о продукте вопреки размещённым на той же странице отрицательным отзывам. Чат-бот также может выдавать в ответах вредоносный код с сайтов в поиске. В ходе тестирования ChatGPT предложили адрес поддельного ресурса, который выглядел как страница с описанием камеры, после чего ИИ задали вопрос, стоит ли покупать это устройство. Система вернула положительную, но сбалансированную оценку с указанием моментов, которые могли не нравиться людям. Когда же в скрытый текст включили прямую инструкцию ChatGPT дать положительный отзыв, чат-бот так и поступил. Положительную оценку может обеспечить и скрытый текст без инструкций — достаточно внести в него поддельные положительные отзывы о товаре. Не меньшую опасность представляет и размещённый в скрытом тексте страницы вредоносный код. Эксперт в области кибербезопасности Microsoft Томас Роччиа (Thomas Roccia) рассказал об инциденте, когда энтузиаст в области криптовалют запросил у ChatGPT помощь в программировании, и часть предоставленного чат-ботом кода оказалась вредоносной, в результате чего учётные данные программиста были похищены, и он потерял $2500. Современные большие языковые модели, на которых строятся чат-боты, чрезвычайно доверчивы; обладая большими объёмами информации, они «очень ограничены в плане способности принимать решения», отмечают специалисты. Важно ответить на вопрос, как эти уязвимости могут изменить ландшафт веб-ресурсов, и как может преобразиться спектр угроз для пользователей, если общедоступные большие языковые модели начнут работать с поиском. Традиционные поисковые системы, включая Google, понижают в выдаче сайты, на которых используется скрытый текст, поэтому рассчитывающие на высокие позиции в результатах ресурсы едва ли будут активно пользоваться этим приёмом. С другой стороны, есть такое явление как «SEO-отравление» — мощная поисковая оптимизация сайтов с вредоносным кодом. В OpenAI достаточно сильные специалисты по безопасности в области ИИ, поэтому есть вероятность, что в перспективе вероятность подобных инцидентов снизится. OpenAI рассматривает возможность выпуска человекоподобных роботов
25.12.2024 [14:54],
Владимир Фетисов
OpenAI рассматривает возможность производства человекоподобных роботов, программной основой которых могут стать разработанные компанией алгоритмы на базе искусственного интеллекта. По данным источника, в настоящее время возможность создания роботов-гуманоидов обсуждается внутри компании. ![]() Источник изображения: Levart_Photographer / Unsplash О намерениях OpenAI заняться робототехникой написало издание The Information ссылкой на двух неназванных людей, непосредственно знакомых с этим вопросом. Издание утверждает, что OpenAI рассматривает возможность разработки именно гуманоидных роботов, похожих на людей. Однако в заметке не уточняется, идёт ли речь о первоначальных обсуждениях или же у производителя ChatGPT уже есть готовый план действий. Интерес OpenAI к робототехнике не является чем-то новым, поскольку раньше в компании было занимающееся разработкой роботов подразделение, но оно перестало функционировать ещё до выхода алгоритма GPT-3. Основной причиной закрытия подразделения стало отсутствие необходимого количества данных для обучения машин. Кроме того, OpenAI продолжает инвестировать в несколько робототехнических стартапов через своё венчурное подразделение. По данным осведомлённых источников, недавно OpenAI вернулась к рассмотрению идеи создания человекоподобных роботов. Однако не уточняется, на какой стадии находится это обсуждение, и есть ли у компании готовый план по развитию данного направления. Ранее в этом году СМИ писали, что OpenAI открыла несколько вакансий на должность инженеров-исследователей, которые должны были присоединиться к робототехническому подразделению. В описании вакансий упоминалось создание мультимодальных больших языковых моделей с целью «открыть новые возможности для роботов наших партнёров». В числе этих «партнёров» могут быть несколько стартапов, в которые OpenAI инвестирует значительные средства, включая Figure AI и 1X Technologies. В прошлом месяце OpenAI также вложила средства в стартап Physical Intelligence, который разрабатывает программное обеспечение на базе ИИ, предназначенное для использования в роботах. xAI Илона Маска с помощью AMD и Nvidia попытается догнать OpenAI и Anthropic
25.12.2024 [13:46],
Алексей Разин
За рассуждениями об энергетических потребностях суперкомпьютера Colossus чуть не затерялся тот факт, что стартапу xAI удалось привлечь ещё $6 млрд финансирования от группы институциональных и стратегических инвесторов. Среди последних компания Илона Маска (Elon Musk) открыто упоминает AMD и Nvidia, которые помогают ей развивать вычислительную инфраструктуру. ![]() Источник изображения: xAI Среди институциональных инвесторов, вложившихся в капитал xAI в рамках третьего раунда привлечения средств, есть представители не только американской финансовой сферы, но и компании из Саудовской Аравии и Катара. Предыдущий раунд финансирования xAI пришёлся на май текущего года. До недавних пор считалось, что в ходе третьего раунда xAI удастся привлечь около $5 млрд и оценить тем самым собственную капитализацию в $50 млрд. Получается, что на практике оба значения были превышены. AMD и Nvidia, по словам представителей xAI, продолжают содействовать быстрому расширению вычислительной инфраструктуры компании. Как отмечается на страницах корпоративного блога, xAI рассчитывает удвоить количество установленных в суперкомпьютере Colossus ускорителей Nvidia с архитектурой Hopper до 200 000 штук в сжатые сроки. Самая современная языковая модель компании — Grok 3, по данным руководства xAI, сейчас используется для подготовки инновационных продуктов как для частных, так и для корпоративных клиентов компании. Участие в финансировании деятельности xAI компаний AMD и Nvidia может говорить об их заинтересованности в поддержке разработчиков систем искусственного интеллекта, которые пока целиком полагаются на их компонентную базу. Облачные гиганты типа Microsoft, Amazon, Google и Meta✴, например, заинтересованы в создании собственных процессоров и ускорителей вычислений. Впрочем, недавно опубликованные сведения позволяют говорить, что Microsoft в этом отношении сильнее прочих зависит от Nvidia. Суперкомпьютеру Илона Маска выделили 150 МВт — теперь он заработает почти во всю мощь
24.12.2024 [16:18],
Павел Котов
Американская федеральная корпорация TVA (Tennessee Valley Authority) одобрила выделение суперкомпьютеру Colossus компании xAI Илона Маска (Elon Musk) мощности в 150 МВт, что позволит запустить объект почти в полную силу. ![]() Источник изображения: x.com/xai Вычислительный кластер для систем искусственного интеллекта xAI Colossus сможет запустить почти все свои 100 000 ускорителей Nvidia — ранее число работающих компонентов ограничивалось доступной для предприятия мощностью. Огромный запрос объекта на электричество вызывал обеспокоенность у местных заинтересованных сторон относительно воздействия на энергосистему всего региона. Компания Илона Маска xAI впервые запустила суперкомпьютер в июле 2024 года, и уже тогда ему требовалось значительно больше энергии, чем было доступно — первоначально было выделено лишь 8 МВт. Команда Маска попыталась восполнить пробел, используя собственные источники питания, и ещё до конца лета местная ресурсоснабжающая компания Memphis Light, Gas & Water (MLGW) модернизировала действующую подстанцию, чтобы обеспечить объекту 50 МВт, но и этого было мало. Для одновременного запуска всех 100 000 ИИ-ускорителей требуется примерно 155 МВт мощности, то есть с выделенной властями квотой его потребности будут почти удовлетворены. MLGW и TVA провели работу с местными жителями и заверили их, что возросший уровень энергопотребления со стороны объекта xAI не окажет отрицательного влияния на надёжность электроснабжения в районе Мемфиса. Гендиректор MLGW Дуг Макгоуэн (Doug McGowen) отметил, что при новой квоте мощность остаётся в пределах прогнозируемой пиковой нагрузки компании, и в случае необходимости у TVA будет закуплена дополнительная мощность. Чтобы удовлетворить возросшие с развитием отрасли ИИ потребности в электроэнергии, крупные технологические компании, включая Amazon, Google, Microsoft и Oracle, начали вкладываться в альтернативные источники, в том числе в ядерную энергетику. Однако последняя сможет быть развернута не менее чем через пять лет. До этого времени потребителям придётся использовать для питания центров обработки данных существующую инфраструктуру, что вызывает опасения по поводу её способности справляться с растущим спросом. Microsoft перестала полагаться только на ИИ-разработки OpenAI
24.12.2024 [14:56],
Владимир Мироненко
Microsoft планирует задействовать для ИИ-помощника Copilot в составе пакета офисных приложений Microsoft 365 собственные ИИ-модели и продукты других разработчиков. Это решение отражает намерения компании диверсифицировать базовую ИИ-технологию от OpenAI и сократить расходы, пишет Reuters со ссылкой на информированные источники. ![]() Источник изображения: Microsoft Намерение Microsoft, главного инвестора OpenAI, снизить свою зависимость от ИИ-стартапа является отходом от её прежней политики, когда одним из главных преимуществ своих предложений компания называла ранний доступ к ИИ-моделям OpenAI. Например, представляя в марте 2023 года Microsoft 365 Copilot, компания указала в числе основных преимуществ ИИ-помощника поддержку модели GPT-4 от OpenAI. По словам источников, стремление Microsoft уменьшить зависимость 365 Copilot от технологий OpenAI вызвано опасениями по поводу высокой стоимости и скоростных качеств продукта для корпоративных пользователей. Представитель Microsoft заявил, что OpenAI продолжает оставаться партнёром компании по развёртыванию моделей Frontier AI — самых передовых моделей ИИ. Согласно соглашению о партнёрстве, софтверная компания может настраивать модели OpenAI. «Мы включаем различные модели OpenAI и Microsoft в зависимости от продукта и опыта», — указано в заявлении Microsoft. Помимо обучения собственных моделей, включая новейшую Phi-4, Microsoft также работает над настройкой других моделей с открытым весом (open weight), чтобы сделать 365 Copilot быстрее и эффективнее, добавили источники. Цель состоит в том, чтобы сделать запуск Microsoft 365 Copilot для компании менее затратным, что потенциально может позитивно отразиться на расходах конечного потребителя. Другие бизнес-подразделения Microsoft тоже стремятся диверсифицировать использование ИИ-моделей OpenAI. Например, веб-сервис GitHub добавил модели от Anthropic и Google в качестве альтернативы OpenAI GPT-4o. Обновлённый в октябре чат-бот Microsoft Copilot теперь использует для работы собственные ИИ-модели компании в дополнение к моделям OpenAI. На данный момент неясно, в какой мере окупаются вложения компании в Microsoft 365 Copilot. Согласно опросу, проведённому фирмой Gartner среди 152 компаний в сфере информационных технологий, подавляющее большинство из них не продвинулось в использовании 365 Copilot дальше пилотной стадии. Тем не менее аналитики BNP Paribas Exane отметили ускорение внедрения 365 Copilot, прогнозируя, что Microsoft продаст его более чем 10 млн платных подписчиков в этом году. Microsoft также указала в ноябре в своём блоге, что 70 % компаний из списка Fortune 500 используют 365 Copilot. ИИ за три недели с нуля спроектировал клиновоздушный ракетный двигатель и он работает
24.12.2024 [12:15],
Геннадий Детинич
Искусственный интеллект взял новую высоту — за три недели с нуля спроектировал работающий клиновоздушный ракетный двигатель, вокруг которого ракетостроители ходят кругами уже более 70 лет. Отпечатанная затем на 3D-принтере модель жидкостного ракетного двигателя проработала 11 секунд в огневом тесте, развив тягу 5 кН. ![]() Источник изображений: LEAP 71 За проектирование двигателя отвечает компания LEAP 71, зарегистрированная в Дубае (ОАЭ). Изготовлением его частей из медного сплава CuCrZr методом аддитивной печати и лазерного плавления занимается немецкая компания AMCM. Испытания проводятся на полигоне Airborne Engineering в Уэскотте, Великобритания. Ранее в этом году LEAP 71 показала прототип обычного жидкостного ракетного двигателя, также разработанного ИИ и изготовленного на 3D-принтере. Над клиновоздушным ракетным двигателем ИИ пришлось попотеть. Если обычный двигатель он проектировал за две недели, то на проект клиновоздушного ушло целых три. Клиновоздушные ракетные двигатели (aerospike) были предложены в 50-х годах прошлого века. Они интересны частично открытым соплом, что даёт возможность обтекающего ракеты потоку встречного воздуха служить виртуальной второй половинкой сопла. Это означает, что кривизна сопла будет изменяться по мере подъёма ракеты из-за постепенного разрежения воздуха. Из этого следует, что клиновоздушный ракетный двигатель будет одинаково эффективен на всех высотах, тогда как двигатели с обычным соплом эффективны лишь на отдельных участках полёта, поэтому у ракеты несколько ступеней с разными двигателями. ![]() Интерес к двигателям типа aerospike вернулся на фоне проектирования многоразовых ракет и космических самолётов. По-хорошему, самолёт не должен быть многоступенчатым. Наконец, клиновоздушные ракетные двигатели в целом должны потреблять меньше топлива на доставку грузов в космос. В свете борьбы с потеплением и позиций экономии в космосе — это тоже важно. ![]() Компания LEAP 71 создала нейронную сеть Noyron, которая научена проектировать механизмы и любые конструкторские решения без использования программ CAD. Компания успешно показала работу ИИ в сфере проектирования ракетных двигателей, но также утверждает, что Noyron способна проектировать не только ракетные двигатели, но и игрушки, а также тяжёлую технику. Программе задаются входные параметры, а на выходе получается готовое устройство. Похоже, под давлением ИИ ещё одну профессию ждёт трансформация. На этот раз это работа инженера-конструктора, хотя люди пока сами неплохо справляются даже с проектированием клиновоздушных двигателей, если это нужно. Низкопробный софт AMD не даёт раскрыть потенциал ИИ-ускорителей Instinct MI300X и обойти Nvidia, выяснили эксперты
23.12.2024 [23:11],
Николай Хижняк
Пятимесячное расследование компании SemiAnalysis показало, что специализированные ИИ-ускорители серии AMD MI300X не раскрывают свой потенциал из-за серьёзных проблем в работе программного обеспечения. Этот факт делает все усилия компании по навязыванию жёсткой конкуренции Nvidia, доминирующей на рынке аппаратного обеспечения для ИИ, бессмысленными. ![]() Источник изображения: The Decoder Исследование показало, что программное обеспечение AMD изобилует ошибками, которые делают обучение моделей ИИ практически невозможным без значительной отладки. Таким образом, пока AMD работает над обеспечением качества и простоты использования своих ускорителей, Nvidia продолжает увеличивать разрыв, развёртывая новые функции, библиотеки и повышая производительность своих решений. По итогам обширных тестов, включая тесты GEMM и одноузловое обучение, исследователи пришли к выводу, что AMD не в состоянии преодолеть то, что они называют «неприступным рвом CUDA» — сильное преимущество в виде программного обеспечения, которым обладают ускорители Nvidia. ![]() Источник изображения: SemiAnalysis AMD MI300X «на бумаге» выглядят впечатляюще: 1307 Тфлопс в вычислениях FP16 и 192 Гбайт памяти HBM3. Для сравнения, ускорители Nvidia H100 обладают производительностью 989 Тфлопс и имеют только 80 Гбайт памяти. Однако новое поколение ИИ-ускорителей Nvidia H200 с конфигурациями до 141 Гбайт памяти сокращает разрыв в объёме доступного буфера памяти. Кроме того, системы на базе ускорителей AMD также предлагают более низкую общую стоимость владения благодаря более низким ценам на такие системы и более доступной поддержке сетевой инфраструктуры. ![]() Источник изображения: SemiAnalysis Однако эти преимущества мало что значат на практике. По данным SemiAnalysis, сравнение «голых» спецификаций похоже на «сравнение камер, когда просто проверяешь количество мегапикселей у одной и другой». AMD, отмечают аналитики, таким образом «просто играет с цифрами», но её решения не обеспечивают достаточный уровень производительности в реальных задачах. Исследователи отмечают, что им пришлось напрямую работать с инженерами AMD, чтобы исправить многочисленные ошибки в ПО для получения пригодных для оценки результатов тестов. В то же время системы на базе ускорителей Nvidia работали гладко и без каких-либо дополнительных настроек. «С OOBE от AMD (опыт, который пользователь получает при получении продукта после распаковки или при запуске установщика и подготовке к первому использованию, так называемый "опыт из коробки" — прим. ред.) очень сложно работать. И для перехода к пригодному к использованию состоянию [оборудования] может потребоваться немало терпения и усилий», — пишут эксперты. Особенно показательным для SemiAnalysis оказался случай, когда компания TensorWave, крупнейший поставщик облачных решений на базе графических процессоров AMD, была вынуждена предоставить команде инженеров AMD бесплатный доступ к своим графическим процессорам — тому же оборудованию, которое TensorWave приобрела у AMD — только для устранения проблем с программным обеспечением. Для решения проблем эксперты SemiAnalysis рекомендуют генеральному директору AMD Лизе Су (Lisa Su) более активно инвестировать в разработку и тестирование программного обеспечения. В частности, они предлагают выделить тысячи чипов MI300X для автоматизированного тестирования (аналогичному подходу следует Nvidia для своих ускорителей), упростить сложные переменные среды, одновременно внедрив более эффективные настройки для ускорителей по умолчанию. «Сделайте готовый опыт пригодным к использованию!» — призывают специалисты. Представители SemiAnalysis в своём отчёте признаются, что желают успеха компании AMD в конкуренции с Nvidia, но отмечают, что «к сожалению, для этого ещё многое предстоит сделать». Без существенных улучшений программного обеспечения AMD рискует ещё больше отстать, поскольку Nvidia готовится к массовому выпуску ускорителей нового поколения Blackwell. Хотя, по сообщениям, этот процесс у Nvidia также проходит не совсем гладко. OpenAI подарила неограниченный доступ к ИИ-генератору видео Sora, но не всем и не навсегда
22.12.2024 [15:03],
Анжелла Марина
В ходе своего 12-дневного мероприятия OpenAI Shipmas, на котором был также представлен генератор видео на базе искусственного интеллекта Sora, генеральный директор компании Сэм Альтман (Sam Altman) порадовал пользователей ChatGPT Plus, объявив о предоставлении неограниченного доступа к Sora на время праздников. ![]() Источник изображения: OpenAI, aitoolsclub.com Как пишет AI Tools Club, Альтман объяснил это решение на своей странице в X/Twitter, отметив, что в конце декабря мощности графических процессоров (GPU) OpenAI используются меньше, поскольку люди уходят в отпуск. Это позволяет снизить очередь и предоставить пользователям неограниченные возможности для создания видеороликов. «Наши GPU в конце декабря немного освобождаются, поскольку люди делают перерыв в работе, поэтому мы предоставляем всем пользователям Plus неограниченный доступ к Sora на праздники. Наслаждайтесь творчеством!» — сказал Альтман. Напомним, ИИ-генератор видео по текстовым запросам Sora был запущен около 10 дней назад и стал ещё одним успешным проектом OpenAI, дополнив линейку таких инструментов, как ChatGPT и DALL-E. Модель доступна на сайте Sora.com для платных пользователей ChatGPT в США и некоторых других стран, и пользуется огромной популярностью. Позднее представитель OpenAI Рохан Сахаи (Rohan Sahai) поделился ещё одной новостью. Доступ к Sora теперь получат не только обычные пользователи, но и команды, использующие корпоративные аккаунты. Кроме того, Сахаи сообщил, что в генераторе улучшена функция «смешивания» (blend feature), и появилась возможность поделиться сгенерированными видео с друзьями — даже с теми, у кого нет в OpenAI аккаунта. Captcha стала бесполезной: ИИ-боты научились проходить тесты на человечность быстрее, чем люди
22.12.2024 [14:37],
Анжелла Марина
Современные технологии искусственного интеллекта (ИИ) поставили под сомнение эффективность привычных инструментов защиты от ботов в интернете. Прохождение тестов капчи (Captcha), созданные для того, чтобы отличать людей от машин, больше не справляются с этой задачей, утверждает издание The Conversation. Сегодня боты способны решать эти головоломки быстрее и точнее, чем люди. ![]() Источник изображения: Google Капча, появившаяся в начале 2000-х годов, была изобретена учёными из Университета Карнеги-Меллон. Изначально она была разработана для защиты сайтов от автоматизированных программ — ботов, которые создавали фальшивые аккаунты или, например, скупали билеты и распространяли спам. Принцип работы был очень прост: человек должен был выполнить задание, которое легко для людей, но сложно для машин. Первая версия капчи предлагала пользователям вводить буквы и цифры. Позже, в 2007 году, появилась ReCaptcha, где к задачам добавились слова. В 2014 году Google выпустила ReCaptcha v2, которая до сих пор остаётся самой популярной. Она предлагает либо отметить галочку «Я не робот», либо выбрать верные изображения, например, с велосипедами или светофорами. Однако ИИ-системы научились капчу обходить. Технологии компьютерного зрения и обработки языка позволяют машинам с лёгкостью «читать» искажённый текст и распознавать объекты на изображениях. Например, ИИ-инструменты, такие как Google Vision и OpenAI Clip, решают подобные задачи за доли секунды, тогда как человеку требуется гораздо больше времени. И это уже становится проблемой в реальной жизни. Боты используются для скупки билетов на спортивные матчи или массового бронирования мест, лишая тем самым доступа к покупке билетов обычных пользователей. Например, в Великобритании автоматизированные программы массово резервируют места на экзамены по вождению, чтобы затем их перепродавать с большой наценкой. Тем не менее, разработчики пытаются адаптироваться к новым вызовам. Так, в 2018 году Google представила ReCaptcha v3, которая больше не требует от пользователей решать головоломки. Вместо этого система анализирует поведение на сайте — движение курсора, скорость набора текста и другие детали, характерные только для человека. Однако выяснилось, что и такие методы не идеальны. Во-первых, они вызывают вопросы о конфиденциальности данных, так как требуют сбора информации о пользователях. Например, некоторые сайты уже начали использовать биометрические данные для проверки пользователей, такие как отпечатки пальцев, голосовые команды или идентификацию по лицу. Во-вторых, даже эти системы уже могут обходиться продвинутыми ИИ, а с появлением ИИ-агентов — программ, которые будут выполнять задачи от имени пользователей, ситуация может усложниться ещё больше. В будущем сайтам потребуется различать «хороших» ботов, работающих на благо пользователей, и «плохих», которые нарушают правила. Одним из возможных решений может стать введение цифровых сертификатов для аутентификации, но пока они находятся на стадии разработки. То есть, борьба между ботами и системами защиты продолжается. Captcha, которая когда-то была надёжным инструментом, теряет свою эффективность, а разработчикам предстоит найти новые способы защиты, которые будут одновременно удобными для пользователей и недоступными для злоумышленников. Прорывы в науке, сделанные ИИ в 2024 году: археологические находки, разговоры с кашалотами и сворачивание белков
21.12.2024 [22:55],
Геннадий Детинич
Искусственный интеллект или машинное обучение стали центральной темой множества новостей в этом году. И заслуженно, хотя во всём этом присутствует известная доля рекламы. Поскольку впереди недели, подводящие итог года, журналисты CNN выступили со статьёй-разминкой, рассказавшей о четырёх неожиданных прорывах в науке в 2024 году, совершённых благодаря использованию искусственного интеллекта. ![]() Внешний вид обугленного свитка, который был прочитан с помощью ИИ. Источник изображения: scrollprize.org Первой рассказана история об археологическом открытии. Машинное обучение помогло прочитать ряд фрагментов спёкшегося и окаменевшего древнеримского свитка из Геркуланума, погребённого во время извержения Везувия в 79 году н.э. Найдено несколько таких свитков, во всех смыслах представляющих собой головешку, а не документ. Физически развернуть их и прочесть нет никакой возможности. Помогла рентгеновская томография и машинное обучение, которое выявило закономерности в химической структуре образца и помогло не только разделить слои свитка, но также отследить следы сгоревших чернил и начать читать текст. Вторая история о том, что благодаря ИИ становится яснее фонетическая база «языка» животных. В перспективе машинное обучение может помочь людям научиться понимать «речь» животных. Учёные начали с кашалотов, которые известны своей достаточно сложной и структурированной системой звукового общения. ИИ проанализировал около 9000 записей обмена сообщениями 60 кашалотов в Карибском море. Нейросеть обнаружила 18 типов ритма, пять типов темпа, три типа вариаций продолжительности и два типа дополнительных щелчков, добавляемых в конце кода в группе более коротких кодов. Этого более чем достаточно для общения любой сложности, но расшифровки всего этого пока нет. Но благодаря найденным «словам» и примерам «построения фраз» учёные намерены начать говорить с китами и посмотреть на их реакцию. Та же практика может быть применена к любым животным. Третья история продолжает тему археологии. В перуанской пустыне Наска остались огромные рисунки на земле — геоглифы. С уровня земли их не разглядеть. Геоглифы были обнаружены случайно с самолётов в воздухе. Обычно это стилизованные изображения животных, людей или орнаменты. До недавнего времени были открыты 430 изображений. Обученный на этих примерах ИИ смог открыть ещё 303 рисунка, неизвестных ранее, предложив 47 000 кандидатов, которые он посчитал нужным выделить в рельефе пустыни. Как видим, очень много ошибок, что говорит о несовершенстве алгоритма. Но почти удвоение найденных археологических памятников — это определённо удача. Четвёртая история, пожалуй, может оставить самый значимый след в истории человечества. Это история о предсказании сворачивания белков. Белки состоят из двух десятков аминокислот, но комбинаций и следующих из этого пространственных форм белков сотни миллионов. Чтобы белок реагировал с живой клеткой организма человека, он должен принимать ту или иную 3D-форму — это как подобрать ключ к замку, один его откроет, а второй просто кусок ненужного железа. Искусственный интеллект в виде пакета AlphaFold компании Google DeepMind научился анализировать все известные учёным белки и может предсказывать новые, ещё не открытые. Это лекарства и многое другое для улучшения здоровья людей. И, наконец, самым ясным фактом признания ИИ в земной науке стало присуждение Нобелевских премий по физике и химии в этом году учёным, разработавшим соответствующие нейронные сети для открытий в области этих наук. Новый инструмент оказался к месту и ко времени, предопределив развитие науки на многие годы вперёд. OpenAI не удаётся доделать GPT-5 Orion — обучение обходится дорого, а данных не хватает
21.12.2024 [18:05],
Павел Котов
OpenAI отстаёт от графика разработки флагманской модели искусственного интеллекта последней версии — она получит название GPT-5, а пока проходит под кодовым именем Orion. Компания занимается этим уже 18 месяцев, пытаясь выйти на желаемый результат, но терпит неудачи — во всём мире не хватает данных, чтобы сделать модель достаточно умной, пишет Wall Street Journal. ![]() Источник изображения: Mariia Shalabaieva / unsplash.com OpenAI провела как минимум два больших учебных запуска, каждый из которых предполагает несколько месяцев обработки данных с целью доделать Orion. Всякий раз возникали новые проблемы, и система не давала результатов, на которые надеялись исследователи. В теперешнем виде Orion работает лучше существующих систем OpenAI, но, по версии разработчиков, она недостаточно продвинулась, чтобы оправдать огромные затраты на поддержание новой модели в рабочем состоянии. Обучение продолжительностью шесть месяцев может обойтись примерно в $500 млн только на вычислительные затраты. Два года назад OpenAI и её гендиректор Сэм Альтман (Sam Altman) произвели фурор с выпуском ChatGPT. Тогда казалось, что ИИ проникнет во все аспекты жизни современного человека и существенно её улучшит. Аналитики предсказали, что в ближайшие годы затраты технологических гигантов на ИИ составят до $1 трлн. Самая большая ответственность возлагается на OpenAI, которая и породила бум ИИ. Октябрьский раунд финансирования компании проводился при оценке $157 млрд — не в последнюю очередь из-за того, что Альтман пообещал «значительный скачок вперёд» по всех областях и задачах с GPT-5. Модель, как ожидается, будет совершать научные открытия и с лёгкостью выполнять повседневные человеческие задачи, такие как запись на приём и бронирование билетов на самолёт. Исследователи также надеются, что она научится сомневаться в собственной правоте и станет реже «галлюцинировать» — прекратит уверенно давать не соответствующие действительности ответы. Если принять, что GPT-4 действует на уровне умного старшеклассника, то от GPT-5 в отдельных задачах ждут уровня доктора наук. Чётких критериев определить, достойна ли модель нового поколения называться GPT-5, не существует: системы тестируются на задачах по математике и программированию, но окончательный вердикт исследователи выносят на интуитивном уровне, и этого до сих пор не произошло. Про разработку больших языковых моделей говорят, что это не только наука, но и искусство. ![]() Источник изображения: Growtika / unsplash.com Тестирование моделей производится во время тренировочных запусков — продолжительных периодов, в которые им отправляются триллионы токенов, то есть фрагментов слов. Крупный тренировочный запуск может потребовать нескольких месяцев работы дата-центров и десятков тысяч ИИ-ускорителей Nvidia. Обучение GPT-4, по словам Альтмана, обошлось в $100 млн; как ожидается, обучение будущих моделей будет стоить дороже $1 млрд. Неудачный тренировочный запуск в чём-то схож с неудачным испытанием ракеты. Исследователи стараются снижать вероятность таких неудач, проводя эксперименты в меньших масштабах — пробные запуски перед полномасштабными. В середине 2023 года OpenAI провела пробный учебный запуск, который стал тестом для вероятной архитектуры Orion — особых результатов эксперимент не принёс: стало ясно, что полномасштабный учебный запуск займёт слишком много времени и обойдётся очень дорого. Результаты проекта Arrakis показали, что создание GPT-5 пойдёт не так гладко, как надеялись исследователи. Они начали вносить некоторые технические изменения, чтобы усилить Orion, и пришли к выводу, что потребуется большой объём разнообразных высококачественных данных, и информации из общедоступного интернета может не хватить. Модели ИИ, как правило, становятся умнее по мере того, как поглощают большие объёмы данных — обычно книг, академических публикаций и других заслуживающих доверия источников, которые помогают ИИ выражаться более чётко и справляться с широким спектром задач. При обучении предыдущих моделей OpenAI не пренебрегала и другими источниками, такими как новостные статьи и даже сообщения в соцсетях. Но чтобы сделать Orion умнее, необходимы дополнительные источники данных, и их недостаточно. Тогда в компании решили создавать эти данные самостоятельно: наняли людей для написания кода и решения математических задач, которые давали пошаговые объяснения своих действий. OpenAI привлекла специалистов по теоретической физике, которые подготовили объяснения, какой подход они бы применили к решению сложнейших проблем в своей области. Процесс идёт чрезвычайно медленно. GPT-4 была обучена на 13 трлн токенов — для сравнения, тысяча человек, которые пишут по пять тысяч знаков в день, сгенерировала бы миллиард токенов за несколько месяцев. Поэтому в OpenAI начали разрабатывать синтетические данные — заставлять другие системы ИИ генерировать данные для обучения нового ИИ. Но исследования показали, что циклы обратной связи между генерацией данных с помощью ИИ для ИИ грозят сбоями или бессмысленными ответами. Для устранения этой проблемы генерацию данных доверили другой модели — o1. ![]() Источник изображения: Mariia Shalabaieva / unsplash.com К началу 2024 года руководство OpenAI стало понимать, что сроки поджимают. GPT-4 исполнился год, конкуренты стали догонять, а новая модель Anthropic, по некоторым оценкам, её превзошла. Проект Orion застопорился, и OpenAI пришлось переключиться на другие проекты и приложения: вышли облегчённый вариант GPT-4 и генератор видео Sora. В результате возникла внутренняя конкуренция — за ограниченные вычислительные ресурсы состязались разработчики Orion и прочих продуктов. Конкуренция же среди разработчиков ИИ ожесточилась до такой степени, что крупные технологические компании стали публиковать меньше статей о последних открытиях или прорывах, чем это принято в научном сообществе. На рынок хлынул поток денег, и корпорации стали рассматривать результаты исследований как коммерческую тайну, которую следует охранять. Дошло до того, что исследователи перестали работать в самолётах, кофейнях и других общественных местах, где кто-то мог заглянуть через плечо. В начале 2024 года OpenAI подготовилась к очередной попытке запуска Orion, вооружившись более качественным набором данных. В течение нескольких первых месяцев года исследователи провели несколько небольших обучающих запусков, чтобы знать, в каком направлении работать дальше. К маю они решили, что готовы провести крупномасштабный запуск Orion, который должен был продлиться до ноября. Но уже на начальном этапе вскрылась связанная с данными проблема: они оказались менее диверсифицированными, чем ожидалось, что ограничило потенциальное качество обучения ИИ. Проблема не проявлялась в пробных проектах и стала очевидной только после того, как начался большой запуск — но к тому времени OpenAI потратила слишком много времени и денег, чтобы начинать всё заново. Исследователи попытались найти более широкий диапазон данных для передачи модели в процессе обучения, но до сих пор неясно, оказалась ли эта стратегия плодотворной. Трудности с Orion указали OpenAI на новый подход к тому, как сделать большие языковые модели умнее — рассуждения. Способность к рассуждениям помогает ИИ решать сложные проблемы, которым он не обучался. Так устроена модель OpenAI o1 — она генерирует несколько ответов на каждый вопрос и анализирует их в поисках лучшего. Но и в этом уверенности пока нет: по мнению исследователей Apple, «рассуждающие» модели, вероятно, лишь интерпретируют полученные при обучении данные, но новых задач в действительности не решают. К примеру, если внести в условиях исходной задачи незначительные изменения, которые не имеют отношения к её решению, качество ответа ИИ резко падает. Эти дополнительные интеллектуальные способности обходятся дорого: OpenAI приходится оплачивать генерацию нескольких ответов вместо одного. «Оказалось, что если бот думает всего 20 секунд в партии в покер, затраты возрастают так же, как если бы модель разрасталась в 100 000 раз и обучалась в 100 000 раз дольше», — рассказал научный сотрудник OpenAI Ноам Браун (Noam Brown). В основу Orion может лечь более продвинутая и эффективная модель, способная к рассуждениям. Исследователи компании придерживаются этого подхода и надеются объединить его с большими объёмами данных, часть из которых может поступать из других моделей ИИ, созданных OpenAI. Затем результаты её работы будут уточняться на материале, созданном людьми. В Google Chrome появится ИИ-инструмент для выявления мошеннических сайтов
21.12.2024 [13:20],
Владимир Фетисов
Разработчики из Google продолжают добавлять в свой браузер Chrome функции на основе искусственного интеллекта. На этот раз обозреватель получил инструмент для анализа веб-страниц, который задействует нейросеть для выявления мошеннических сайтов. ![]() Источник изображений: Google Нововведение будет доступно пользователям Chrome для операционных систем Windows, macOS и Linux. Важная его особенность состоит в том, что алгоритм работает полностью локально на пользовательском устройстве и не передаёт данные на серверы Google. Такой подход позволит интернет-гиганту избежать потенциальных проблем и обвинений в нарушении конфиденциальности пользовательских данных. По данным источника, в настоящее время функция обнаружения мошеннических сайтов появилась в одной из недавних бета-версий Chrome на канале Canary. Разработчики добавили в настройки обозревателя соответствующую опцию для активации этого ИИ-инструмента. Отмечается, что новая функция Google имеет определённое сходство с «блокировщиком вредоносных приложений», который Microsoft недавно анонсировала для своего браузера Edge. Этот алгоритм задействует нейросеть для выявления случаев кибермошенничества и разных вредоносных сайтов. Однако опция Microsoft не активирована по умолчанию, поэтому пользователям требуется включать её самостоятельно в настройках Edge. В отличие от этого, ИИ-алгоритм для борьбы с мошенничеством в Chrome будет активирован по умолчанию, когда появится в стабильных версиях браузера. GitHub запустил бесплатную версию Copilot для автодополнения кода
21.12.2024 [13:06],
Владимир Мироненко
Принадлежащий Microsoft сервис для разработчиков программного обеспечения GitHub объявил о выходе бесплатной версии ИИ-инструмента автодополнения кода Copilot, который теперь также будет предоставляться по умолчанию с редактором Microsoft VS Code. ![]() Источник изображения: Microsoft Также GitHub сообщил, что число его пользователей достигло 150 млн, тогда как в начале 2023 года платформу использовало 100 млн разработчиков. Ранее ежемесячная плата за использование Copilot для большинства разработчиков составляла от $10 и лишь ограниченное число программистов, включая студентов, преподавателей и разработчиков Open Source, могло использовать его бесплатно. Бесплатная версия Copilot ориентирована на эпизодических пользователей, а не на тех, кто занят в больших проектах, поскольку имеет ряд ограничений. Её пользователи получат доступ лишь к 2000 автозавершений кода в месяц, и этот лимит учитывает каждое предложение кода со стороны Copilot, а не только принятые варианты. Также бесплатные пользователи смогут задействовать только модели Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI, в то время как платный доступ также включает возможность использования Gemini 1.5 Pro от Google и o1-preview и o1-mini от OpenAI. Кроме того, число сообщений в чате с Copilot ограничено 50 в месяц. В остальном разработчики получат доступ ко всем расширениям и навыкам Copilot. Как сообщил ресурсу TechCrunch генеральный директор GitHub Томас Домке (Thomas Dohmke), чтобы определить порог между случайными пользователями и профессиональными разработчиками для установки ограничений бесплатной версии, команда сервиса изучила данные об использовании Copilot за последние несколько лет. Google добавит в поисковик ИИ-режим в ответ на запуск ChatGPT Search
21.12.2024 [11:03],
Павел Котов
Google намеревается добавить на поисковую страницу новую опцию — режим искусственного интеллекта, который вместо традиционной выдачи предлагает диалог с чат-ботом, способным отвечать на вопросы. Схожим образом работает ИИ-помощник Gemini. ![]() Источник изображения: sarah b / unsplash.com Режим ИИ будет включаться в меню верхней части страницы — там, где расположены привычные пункты «Все», «Картинки», «Новости», «Видео», «Покупки» и т. д., сообщило издание The Information со ссылкой на собственный источник. Как и чат-бот Gemini, поиск с ИИ будет сопровождать ответы ссылками на сайты и вторым полем ввода, где можно будет задавать дополнительные вопросы. «Сейчас наши современные модели продолжают развиваться, и есть грандиозная возможность внедрить эти новые функции в поиск, помогая людям находить в интернете ещё больше», — рассказали в Google. В октябре российский «Яндекс» представила аналогичную функцию «Поиск с Нейро». Perplexity AI, которая специализируется на технологиях поиска с ИИ, сообщила, что её система сегодня обрабатывает 100 млн запросов в неделю — компания намеревается повысить этот показатель до 100 млн запросов в день. Поиск с ИИ появился на платформе Reddit — отвечая на запросы, система Reddit Answers предлагает ссылки на посты и сообщества. Доступ к веб-поиску есть у OpenAI ChatGPT. ИИ-революция на ПК и смартфонах пока отменяется — заоблачных продаж не случилось
20.12.2024 [17:45],
Павел Котов
Micron не смогла добиться ожидаемых показателей по итогам минувшего квартала и была вынуждена снизить прогноз на текущий — авторитетный аналитик Дэниел Ньюман (Daniel Newman) считает, что это проблема не одного производителя, а всей технологической отрасли: революции ПК и смартфонов с искусственным интеллектом не случилось, и ждать её пока не приходится. ![]() Источник изображений: microsoft.com Значительная часть проблем Micron оказалась вызвана более слабым, чем ожидалось, рынком компонентов памяти для ПК и смартфонов. Выручка Micron по итогам квартала составила $8,709 млрд против ожиданий аналитиков в $8,721 млрд; в текущем квартале компания рассчитывает заработать $7,9 млрд против предсказанных аналитиками Уолл-стрит $8,98 млрд — из-за столь сильного расхождения акции производителя рухнули более чем на 16 %. На эти показатели следует обратить внимание, но и трагедии они пока не предвещают, считает господин Ньюман — это не «начало конца для отрасли ИИ» и не крах Nvidia. Micron в значительной степени рассчитывает на рынок памяти HBM, который в этом году обещает вырасти до $16 млрд, а к 2030 году достичь $100 млрд, но основным источником дохода для неё остаётся производство чипов памяти для ПК и смартфонов. «Однако основной бизнес сокращается, поскольку поставки ПК и смартфонов отстают [от прогнозов], и Micron приходится справляться с запасами у клиентов, которые распродаются медленно, что приведёт к ещё более низким заказам/продажам в этом и следующих кварталах. <..> Плохая новость в том что „суперцикл“ ПК с ИИ и смартфонов с ИИ в той или иной мере провалился», — пишет Ньюман. ![]() В 2023 и 2024 гг. считалось, что новые функции ИИ спровоцируют высокий спрос на ПК с их поддержкой, но этого не случилось. Спрос на ПК с ИИ определяет не ИИ, а более быстрые центральные и графические процессоры, показал сентябрьский доклад IDC Research. Потребность заменить ПК под Windows 10 на модели с Windows 11 в новом году окажет более сильное влияние на рост продаж ПК, чем ИИ, считают в Trendforce. Qualcomm испытывает очевидные трудности со своими новыми чипами Snapdragon X для ноутбуков класса Copilot Plus: в III квартале компании удалось занять лишь 0,8 % рынка ПК, продав 720 000 единиц. ВРИО гендиректора Intel Мишель Джонстон Холтхаус (Michelle Johnston Holthaus) заявила, что процент возврата ноутбуков на Snapdragon X слишком высок, но в Qualcomm с её оценкой не согласились. Сегодня производитель Arm-процессоров ожидает выхода новых моделей на Snapdragon X, которые при той же производительности ИИ-ускорителя предложат цены в $700 — присутствующие сегодня в продаже модели имеют ценники в $1000, и снижение на $300 представляется существенным. Если бы спрос на теперешние ПК с ИИ был достаточно большим, для Qualcomm не было бы смысла переключаться на более скромный ценовой диапазон — смысл есть, когда в более высоком ценовом сегменте спрос слабый. У ПК с ИИ образуется серьёзная проблема: от локального запуска ИИ на ПК сегодня не так много пользы. Существующее ПО с ИИ скорее относится к сфере интересов энтузиастов, а популярные службы, такие как ChatGPT, запускаются в облаке и работают без ИИ-ускорителей. ПК с ИИ на глазах превращается просто в ПК, потому что ИИ-ускорители становятся отраслевым стандартом, а ИИ так и не стал аргументом в пользу покупки новой продукции — аналогичным образом стандартом для ПК стали многоядерные процессоры, интегрированная графика и SSD. У потребителей отсутствует стимул прицельно покупать ПК с ИИ, но и ПК без ИИ они тоже покупать не станут, ведь это будет подразумевать устаревший процессор. Признаков краха отрасли ИИ тоже нет: спрос на память HBM остаётся высоким, она продаётся хорошо, но остаётся востребованной лишь в серверных продуктах Nvidia, Broadcom, AMD и Marvell. Отсутствие восторга у потребителей при локальном запуске ИИ на ПК и смартфонах, конечно, не красит технологическую отрасль, но и не указывает на трагедию — гораздо хуже был бы низкий спрос на HBM. Хотя если отрасль ИИ в итоге окажется пузырём и лопнет, станет очевиден первый предвестник краха — отсутствие взрывного потребительского спроса на локальный запуск ИИ. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |