Опрос
|
реклама
Быстрый переход
Captcha стала бесполезной: ИИ-боты научились проходить тесты на человечность быстрее, чем люди
22.12.2024 [14:37],
Анжелла Марина
Современные технологии искусственного интеллекта (ИИ) поставили под сомнение эффективность привычных инструментов защиты от ботов в интернете. Прохождение тестов капчи (Captcha), созданные для того, чтобы отличать людей от машин, больше не справляются с этой задачей, утверждает издание The Conversation. Сегодня боты способны решать эти головоломки быстрее и точнее, чем люди. Капча, появившаяся в начале 2000-х годов, была изобретена учёными из Университета Карнеги-Меллон. Изначально она была разработана для защиты сайтов от автоматизированных программ — ботов, которые создавали фальшивые аккаунты или, например, скупали билеты и распространяли спам. Принцип работы был очень прост: человек должен был выполнить задание, которое легко для людей, но сложно для машин. Первая версия капчи предлагала пользователям вводить буквы и цифры. Позже, в 2007 году, появилась ReCaptcha, где к задачам добавились слова. В 2014 году Google выпустила ReCaptcha v2, которая до сих пор остаётся самой популярной. Она предлагает либо отметить галочку «Я не робот», либо выбрать верные изображения, например, с велосипедами или светофорами. Однако ИИ-системы научились капчу обходить. Технологии компьютерного зрения и обработки языка позволяют машинам с лёгкостью «читать» искажённый текст и распознавать объекты на изображениях. Например, ИИ-инструменты, такие как Google Vision и OpenAI Clip, решают подобные задачи за доли секунды, тогда как человеку требуется гораздо больше времени. И это уже становится проблемой в реальной жизни. Боты используются для скупки билетов на спортивные матчи или массового бронирования мест, лишая тем самым доступа к покупке билетов обычных пользователей. Например, в Великобритании автоматизированные программы массово резервируют места на экзамены по вождению, чтобы затем их перепродавать с большой наценкой. Тем не менее, разработчики пытаются адаптироваться к новым вызовам. Так, в 2018 году Google представила ReCaptcha v3, которая больше не требует от пользователей решать головоломки. Вместо этого система анализирует поведение на сайте — движение курсора, скорость набора текста и другие детали, характерные только для человека. Однако выяснилось, что и такие методы не идеальны. Во-первых, они вызывают вопросы о конфиденциальности данных, так как требуют сбора информации о пользователях. Например, некоторые сайты уже начали использовать биометрические данные для проверки пользователей, такие как отпечатки пальцев, голосовые команды или идентификацию по лицу. Во-вторых, даже эти системы уже могут обходиться продвинутыми ИИ, а с появлением ИИ-агентов — программ, которые будут выполнять задачи от имени пользователей, ситуация может усложниться ещё больше. В будущем сайтам потребуется различать «хороших» ботов, работающих на благо пользователей, и «плохих», которые нарушают правила. Одним из возможных решений может стать введение цифровых сертификатов для аутентификации, но пока они находятся на стадии разработки. То есть, борьба между ботами и системами защиты продолжается. Captcha, которая когда-то была надёжным инструментом, теряет свою эффективность, а разработчикам предстоит найти новые способы защиты, которые будут одновременно удобными для пользователей и недоступными для злоумышленников. OpenAI не удаётся доделать GPT-5 Orion — обучение обходится дорого, а данных не хватает
21.12.2024 [18:05],
Павел Котов
OpenAI отстаёт от графика разработки флагманской модели искусственного интеллекта последней версии — она получит название GPT-5, а пока проходит под кодовым именем Orion. Компания занимается этим уже 18 месяцев, пытаясь выйти на желаемый результат, но терпит неудачи — во всём мире не хватает данных, чтобы сделать модель достаточно умной, пишет Wall Street Journal. OpenAI провела как минимум два больших учебных запуска, каждый из которых предполагает несколько месяцев обработки данных с целью доделать Orion. Всякий раз возникали новые проблемы, и система не давала результатов, на которые надеялись исследователи. В теперешнем виде Orion работает лучше существующих систем OpenAI, но, по версии разработчиков, она недостаточно продвинулась, чтобы оправдать огромные затраты на поддержание новой модели в рабочем состоянии. Обучение продолжительностью шесть месяцев может обойтись примерно в $500 млн только на вычислительные затраты. Два года назад OpenAI и её гендиректор Сэм Альтман (Sam Altman) произвели фурор с выпуском ChatGPT. Тогда казалось, что ИИ проникнет во все аспекты жизни современного человека и существенно её улучшит. Аналитики предсказали, что в ближайшие годы затраты технологических гигантов на ИИ составят до $1 трлн. Самая большая ответственность возлагается на OpenAI, которая и породила бум ИИ. Октябрьский раунд финансирования компании проводился при оценке $157 млрд — не в последнюю очередь из-за того, что Альтман пообещал «значительный скачок вперёд» по всех областях и задачах с GPT-5. Модель, как ожидается, будет совершать научные открытия и с лёгкостью выполнять повседневные человеческие задачи, такие как запись на приём и бронирование билетов на самолёт. Исследователи также надеются, что она научится сомневаться в собственной правоте и станет реже «галлюцинировать» — прекратит уверенно давать не соответствующие действительности ответы. Если принять, что GPT-4 действует на уровне умного старшеклассника, то от GPT-5 в отдельных задачах ждут уровня доктора наук. Чётких критериев определить, достойна ли модель нового поколения называться GPT-5, не существует: системы тестируются на задачах по математике и программированию, но окончательный вердикт исследователи выносят на интуитивном уровне, и этого до сих пор не произошло. Про разработку больших языковых моделей говорят, что это не только наука, но и искусство. Тестирование моделей производится во время тренировочных запусков — продолжительных периодов, в которые им отправляются триллионы токенов, то есть фрагментов слов. Крупный тренировочный запуск может потребовать нескольких месяцев работы дата-центров и десятков тысяч ИИ-ускорителей Nvidia. Обучение GPT-4, по словам Альтмана, обошлось в $100 млн; как ожидается, обучение будущих моделей будет стоить дороже $1 млрд. Неудачный тренировочный запуск в чём-то схож с неудачным испытанием ракеты. Исследователи стараются снижать вероятность таких неудач, проводя эксперименты в меньших масштабах — пробные запуски перед полномасштабными. В середине 2023 года OpenAI провела пробный учебный запуск, который стал тестом для вероятной архитектуры Orion — особых результатов эксперимент не принёс: стало ясно, что полномасштабный учебный запуск займёт слишком много времени и обойдётся очень дорого. Результаты проекта Arrakis показали, что создание GPT-5 пойдёт не так гладко, как надеялись исследователи. Они начали вносить некоторые технические изменения, чтобы усилить Orion, и пришли к выводу, что потребуется большой объём разнообразных высококачественных данных, и информации из общедоступного интернета может не хватить. Модели ИИ, как правило, становятся умнее по мере того, как поглощают большие объёмы данных — обычно книг, академических публикаций и других заслуживающих доверия источников, которые помогают ИИ выражаться более чётко и справляться с широким спектром задач. При обучении предыдущих моделей OpenAI не пренебрегала и другими источниками, такими как новостные статьи и даже сообщения в соцсетях. Но чтобы сделать Orion умнее, необходимы дополнительные источники данных, и их недостаточно. Тогда в компании решили создавать эти данные самостоятельно: наняли людей для написания кода и решения математических задач, которые давали пошаговые объяснения своих действий. OpenAI привлекла специалистов по теоретической физике, которые подготовили объяснения, какой подход они бы применили к решению сложнейших проблем в своей области. Процесс идёт чрезвычайно медленно. GPT-4 была обучена на 13 трлн токенов — для сравнения, тысяча человек, которые пишут по пять тысяч знаков в день, сгенерировала бы миллиард токенов за несколько месяцев. Поэтому в OpenAI начали разрабатывать синтетические данные — заставлять другие системы ИИ генерировать данные для обучения нового ИИ. Но исследования показали, что циклы обратной связи между генерацией данных с помощью ИИ для ИИ грозят сбоями или бессмысленными ответами. Для устранения этой проблемы генерацию данных доверили другой модели — o1. К началу 2024 года руководство OpenAI стало понимать, что сроки поджимают. GPT-4 исполнился год, конкуренты стали догонять, а новая модель Anthropic, по некоторым оценкам, её превзошла. Проект Orion застопорился, и OpenAI пришлось переключиться на другие проекты и приложения: вышли облегчённый вариант GPT-4 и генератор видео Sora. В результате возникла внутренняя конкуренция — за ограниченные вычислительные ресурсы состязались разработчики Orion и прочих продуктов. Конкуренция же среди разработчиков ИИ ожесточилась до такой степени, что крупные технологические компании стали публиковать меньше статей о последних открытиях или прорывах, чем это принято в научном сообществе. На рынок хлынул поток денег, и корпорации стали рассматривать результаты исследований как коммерческую тайну, которую следует охранять. Дошло до того, что исследователи перестали работать в самолётах, кофейнях и других общественных местах, где кто-то мог заглянуть через плечо. В начале 2024 года OpenAI подготовилась к очередной попытке запуска Orion, вооружившись более качественным набором данных. В течение нескольких первых месяцев года исследователи провели несколько небольших обучающих запусков, чтобы знать, в каком направлении работать дальше. К маю они решили, что готовы провести крупномасштабный запуск Orion, который должен был продлиться до ноября. Но уже на начальном этапе вскрылась связанная с данными проблема: они оказались менее диверсифицированными, чем ожидалось, что ограничило потенциальное качество обучения ИИ. Проблема не проявлялась в пробных проектах и стала очевидной только после того, как начался большой запуск — но к тому времени OpenAI потратила слишком много времени и денег, чтобы начинать всё заново. Исследователи попытались найти более широкий диапазон данных для передачи модели в процессе обучения, но до сих пор неясно, оказалась ли эта стратегия плодотворной. Трудности с Orion указали OpenAI на новый подход к тому, как сделать большие языковые модели умнее — рассуждения. Способность к рассуждениям помогает ИИ решать сложные проблемы, которым он не обучался. Так устроена модель OpenAI o1 — она генерирует несколько ответов на каждый вопрос и анализирует их в поисках лучшего. Но и в этом уверенности пока нет: по мнению исследователей Apple, «рассуждающие» модели, вероятно, лишь интерпретируют полученные при обучении данные, но новых задач в действительности не решают. К примеру, если внести в условиях исходной задачи незначительные изменения, которые не имеют отношения к её решению, качество ответа ИИ резко падает. Эти дополнительные интеллектуальные способности обходятся дорого: OpenAI приходится оплачивать генерацию нескольких ответов вместо одного. «Оказалось, что если бот думает всего 20 секунд в партии в покер, затраты возрастают так же, как если бы модель разрасталась в 100 000 раз и обучалась в 100 000 раз дольше», — рассказал научный сотрудник OpenAI Ноам Браун (Noam Brown). В основу Orion может лечь более продвинутая и эффективная модель, способная к рассуждениям. Исследователи компании придерживаются этого подхода и надеются объединить его с большими объёмами данных, часть из которых может поступать из других моделей ИИ, созданных OpenAI. Затем результаты её работы будут уточняться на материале, созданном людьми. Google добавит в поисковик ИИ-режим в ответ на запуск ChatGPT Search
21.12.2024 [11:03],
Павел Котов
Google намеревается добавить на поисковую страницу новую опцию — режим искусственного интеллекта, который вместо традиционной выдачи предлагает диалог с чат-ботом, способным отвечать на вопросы. Схожим образом работает ИИ-помощник Gemini. Режим ИИ будет включаться в меню верхней части страницы — там, где расположены привычные пункты «Все», «Картинки», «Новости», «Видео», «Покупки» и т. д., сообщило издание The Information со ссылкой на собственный источник. Как и чат-бот Gemini, поиск с ИИ будет сопровождать ответы ссылками на сайты и вторым полем ввода, где можно будет задавать дополнительные вопросы. «Сейчас наши современные модели продолжают развиваться, и есть грандиозная возможность внедрить эти новые функции в поиск, помогая людям находить в интернете ещё больше», — рассказали в Google. В октябре российский «Яндекс» представила аналогичную функцию «Поиск с Нейро». Perplexity AI, которая специализируется на технологиях поиска с ИИ, сообщила, что её система сегодня обрабатывает 100 млн запросов в неделю — компания намеревается повысить этот показатель до 100 млн запросов в день. Поиск с ИИ появился на платформе Reddit — отвечая на запросы, система Reddit Answers предлагает ссылки на посты и сообщества. Доступ к веб-поиску есть у OpenAI ChatGPT. ИИ-революция на ПК и смартфонах пока отменяется — заоблачных продаж не случилось
20.12.2024 [17:45],
Павел Котов
Micron не смогла добиться ожидаемых показателей по итогам минувшего квартала и была вынуждена снизить прогноз на текущий — авторитетный аналитик Дэниел Ньюман (Daniel Newman) считает, что это проблема не одного производителя, а всей технологической отрасли: революции ПК и смартфонов с искусственным интеллектом не случилось, и ждать её пока не приходится. Значительная часть проблем Micron оказалась вызвана более слабым, чем ожидалось, рынком компонентов памяти для ПК и смартфонов. Выручка Micron по итогам квартала составила $8,709 млрд против ожиданий аналитиков в $8,721 млрд; в текущем квартале компания рассчитывает заработать $7,9 млрд против предсказанных аналитиками Уолл-стрит $8,98 млрд — из-за столь сильного расхождения акции производителя рухнули более чем на 16 %. На эти показатели следует обратить внимание, но и трагедии они пока не предвещают, считает господин Ньюман — это не «начало конца для отрасли ИИ» и не крах Nvidia. Micron в значительной степени рассчитывает на рынок памяти HBM, который в этом году обещает вырасти до $16 млрд, а к 2030 году достичь $100 млрд, но основным источником дохода для неё остаётся производство чипов памяти для ПК и смартфонов. «Однако основной бизнес сокращается, поскольку поставки ПК и смартфонов отстают [от прогнозов], и Micron приходится справляться с запасами у клиентов, которые распродаются медленно, что приведёт к ещё более низким заказам/продажам в этом и следующих кварталах. <..> Плохая новость в том что „суперцикл“ ПК с ИИ и смартфонов с ИИ в той или иной мере провалился», — пишет Ньюман. В 2023 и 2024 гг. считалось, что новые функции ИИ спровоцируют высокий спрос на ПК с их поддержкой, но этого не случилось. Спрос на ПК с ИИ определяет не ИИ, а более быстрые центральные и графические процессоры, показал сентябрьский доклад IDC Research. Потребность заменить ПК под Windows 10 на модели с Windows 11 в новом году окажет более сильное влияние на рост продаж ПК, чем ИИ, считают в Trendforce. Qualcomm испытывает очевидные трудности со своими новыми чипами Snapdragon X для ноутбуков класса Copilot Plus: в III квартале компании удалось занять лишь 0,8 % рынка ПК, продав 720 000 единиц. ВРИО гендиректора Intel Мишель Джонстон Холтхаус (Michelle Johnston Holthaus) заявила, что процент возврата ноутбуков на Snapdragon X слишком высок, но в Qualcomm с её оценкой не согласились. Сегодня производитель Arm-процессоров ожидает выхода новых моделей на Snapdragon X, которые при той же производительности ИИ-ускорителя предложат цены в $700 — присутствующие сегодня в продаже модели имеют ценники в $1000, и снижение на $300 представляется существенным. Если бы спрос на теперешние ПК с ИИ был достаточно большим, для Qualcomm не было бы смысла переключаться на более скромный ценовой диапазон — смысл есть, когда в более высоком ценовом сегменте спрос слабый. У ПК с ИИ образуется серьёзная проблема: от локального запуска ИИ на ПК сегодня не так много пользы. Существующее ПО с ИИ скорее относится к сфере интересов энтузиастов, а популярные службы, такие как ChatGPT, запускаются в облаке и работают без ИИ-ускорителей. ПК с ИИ на глазах превращается просто в ПК, потому что ИИ-ускорители становятся отраслевым стандартом, а ИИ так и не стал аргументом в пользу покупки новой продукции — аналогичным образом стандартом для ПК стали многоядерные процессоры, интегрированная графика и SSD. У потребителей отсутствует стимул прицельно покупать ПК с ИИ, но и ПК без ИИ они тоже покупать не станут, ведь это будет подразумевать устаревший процессор. Признаков краха отрасли ИИ тоже нет: спрос на память HBM остаётся высоким, она продаётся хорошо, но остаётся востребованной лишь в серверных продуктах Nvidia, Broadcom, AMD и Marvell. Отсутствие восторга у потребителей при локальном запуске ИИ на ПК и смартфонах, конечно, не красит технологическую отрасль, но и не указывает на трагедию — гораздо хуже был бы низкий спрос на HBM. Хотя если отрасль ИИ в итоге окажется пузырём и лопнет, станет очевиден первый предвестник краха — отсутствие взрывного потребительского спроса на локальный запуск ИИ. Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ
19.12.2024 [14:14],
Павел Котов
Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта. В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia. Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple. «Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple. Вместе с Apple Intelligence на старые iPhone пришёл перегрев
18.12.2024 [15:51],
Павел Котов
На минувшей неделе Apple начала развёртывать на iPhone обновление iOS 18.2 — оно знаменует выход компании в области искусственного интеллекта, поскольку сопровождается пакетом Apple Intelligence. Но некоторые владельцы iPhone стали сообщать о перегреве устройств при работе с некоторыми функциями пакета. С момента выхода iOS 18.2 прошли уже несколько дней, и владельцы iPhone начали делиться впечатлениями об обновлении — в некоторых случаях ситуация оказалась не вполне радостной. При запуске ряда функций генеративного ИИ стали отмечаться перегрев устройств и сокращение времени их автономной работы. В качестве примера пользователи Reddit привели Image Playground — функцию, которая преобразует картинки из галереи в соответствии с выбранным стилем. Она может переработать портрет человека и выполнить его в виде трёхмерной модели или рисунка; можно также добавить в кадр какой-либо предмет. Но при использовании Image Playground устройства, как сообщается, стали быстро нагреваться. Некоторые проблемы проявляются при запуске функции Genmoji — генератор смайликов вызывает проблемы с производительностью и подтормаживания в работе пользовательского интерфейса. Стоит, однако, отметить, что об этом эффекте сообщают лишь владельцы iPhone 15 Pro и Pro Max, тогда как на iPhone 16 функция работает нормально. Зато перегрев устройства при запуске приложения «Фото» наблюдается уже и на iPhone 16; сообщается также, что с выходом обновления iOS 18.2 стало сокращаться время автономной работы устройств. Официальных комментариев от представителей Apple пока не последовало, но причина проблем представляется очевидной. Аналогичные функции на устройствах под Android чаще запускаются из облака, а Apple, сохраняющая свою приверженность конфиденциальности, решила перенести их локально на свои устройства, что может вызвать и дополнительный нагрев, и сокращение времени автономной работы гаджетов. Возможно, для Apple пришла пора задуматься об установке систем охлаждения на iPhone — в лагере Android они уже не редкость. OpenAI бросила вызов Google: поиск в интернете через ChatGPT открылся для всех пользователей
16.12.2024 [22:31],
Андрей Созинов
Компания OpenAI сегодня открыла поиск в интернете через чат-бота с искусственным интеллектом ChatGPT для всех пользователей. Таким образом разработчики бросили прямой вызов Google, которая тотально доминирует на мировом рынке поисковых систем. Решение с незамысловатым названием ChatGPT Search, то есть «ChatGPT Поиск», будет доступно любому пользователю, вошедшему в свой аккаунт в мобильных приложениях чат-бота или веб-версии сервиса, объявили в OpenAI в понедельник 16 декабря. Ранее поиск в интернете через ChatGPT был доступен только для платных подписчиков. Как отмечает компания, поиск через ChatGPT позволяет «получать быстрые и актуальные ответы со ссылками на соответствующие веб-источники». Запрос к ChatGPT вводится как обычно и чат-бот сам решит, нужно ли по данному вопросу искать что-либо в интернете. А если пользователь нажмёт кнопку «Поиск», то бот напрямую выполнит поиск в интернете. Также можно попросить чат-бота уточнить условия поиска или подготовить более детальную сводку по результатам. Отдельно стоит отметить, что ChatGPT Search можно будет назначить поисковой системой по умолчанию для своего веб-браузера. У Google, возможно, появится действительно серьёзный соперник, ведь людям будет куда проще спросить о чём-то у ИИ и увидеть в ответ сводку информации, а не формулировать запрос и искать нужную информацию по разным сайтом из выдачи. OpenAI также продемонстрировала новую опцию, которая позволит пользователям задавать вопросы чат-боту — например, о том, чем заняться в Цюрихе перед Рождеством — и получать устные ответы. Расширение фирменной поисковой системы стало частью 12-дневного марафона анонсов от OpenAI. Ранее разработчик представил новую более дорогую подписку ChatGPT Pro за $200 в месяц и открыл для широкой публики инструмент для создания видео с помощью искусственного интеллекта под названием Sora. В ближайшие дни нас ожидает по меньшей мере ещё один анонс от OpenAI, ведь сегодня лишь восьмой день марафона. TSMC к 2026 году утроит мощности по упаковке чипов методом CoWoS, чтобы лучше обслуживать Nvidia
15.12.2024 [08:19],
Алексей Разин
Бурный рост выручки Nvidia на фоне высокого спроса на её ускорители вычислений в действительности сдерживается возможностями её производственных партнёров, главным из которых является TSMC. Последняя не только выпускает чипы для Nvidia, но и упаковывает их передовым методом CoWoS, и возможности подрядчика в этой сфере являются для Nvidia узким местом, которое он готов активно расширять. По информации Commercial Times, компания TSMC интенсивно расширяет на территории Тайваня свои производственные мощности по тестированию и упаковке чипов методом CoWoS. Купленное у Innolux предприятие по производству ЖК-панелей в Тайнане будет переоборудовано под тестирование и упаковку чипов к концу следующего года, и совокупные возможности TSMC в этой сфере к концу 2026 года утроятся до 90 000 кремниевых пластин в месяц, по данным тайваньских источников. Профильное предприятие TSMC в Тайчжуне будет введено в строй в первой половине следующего года, компания также строит два предприятия в других районах острова. В текущем году, по оценкам аналитиков, TSMC была способна упаковывать и тестировать чипы с использованием метода CoWoS в количестве, эквивалентном 35 000 кремниевых пластин в месяц. Выручка от данного вида услуг достигла 7–9 % от совокупной. К концу следующего года мощности удвоятся до 70 000 пластин в месяц, а доля выручки перевалит за 10 %. Наконец, к концу 2026 года TSMC сможет ежемесячно упаковывать по методу CoWoS количество чипов, эквивалентное 90 000 кремниевых пластин. Итого, с 2022 по 2026 годы производительность компании в этой сфере будет увеличиваться ежегодно в среднем на 50 %, причём процесс продолжится и после 2026 года. Одно только предприятие в Тайнане теоретически могло бы ежемесячно обрабатывать по 50 000 кремниевых пластин в месяц. Скорее всего, профильными заказами оно в итоге будет загружено только частично, а остальные мощности выделят под работу с методами упаковки CPO и FoPLP. Акции Broadcom подорожали на 24 %, капитализация компании впервые превысила $1 трлн
14.12.2024 [08:29],
Алексей Разин
В давно устоявшемся списке компаний с величиной капитализации более $1 трлн вчера появился новичок в лице Broadcom, курс акций которой вчера подскочил на 24 % после публикации квартальной отчётности и невзирая на слухи о намерениях Apple отказаться от использования её компонентов в своей продукции. По сути, как отмечает CNBC, минувшая пятница стала для акций Broadcom самым успешным днём на фондовом рынке за всю историю существования компании, поскольку курс акций вырос более чем на 24 % по итогам вчерашней сессии. Итоги квартала превзошли ожидания аналитиков, продемонстрировав сильное увеличение выручки в сегменте компонентов для систем искусственного интеллекта. Совокупная выручка компании увеличилась на 51 % год к году до $14,05 млрд и даже немного недотянула до прогнозируемой величины, но в целом на направлении ИИ выручка компании по итогам фискального года выросла на 220 % до $12,2 млрд, по словам руководства. Квартальная выручка в сегменте полупроводниковых решений в годовом сравнении увеличилась только на 12 % до $8,23 млрд. Положительной динамики акциям Broadcom добавило заявление главы компании Хока Тана (Hock Tan) о разработке чипа для систем ИИ по индивидуальному заказу крупных облачных клиентов. Чистая прибыль компании в четвёртом сегменте выросла на 23 % до $4,32 млрд. Аналитики рекомендовали акции Broadcom к покупке, объяснив такую рекомендацию способностью компании увеличить свои доходы в сфере компонентов для систем ИИ. Впрочем, конкуренция со стороны Nvidia представляет определённую угрозу для экспансии бизнеса Broadcom в этой сфере. Потенциал последней в сегменте ИИ, по мнению представителей Morgan Stanley, будет наиболее активно развиваться в ближайшие два или три года. Власти США готовят новые ограничения в сфере ИИ для Китая, которые коснутся третьих стран
14.12.2024 [06:44],
Алексей Разин
Издание The Wall Street Journal к концу недели определилось со спецификой новых ограничений, которые власти США готовят в сфере поставок компонентов и систем искусственного интеллекта в КНР через третьи страны. Усиление экспортных ограничений США в таком ключе грозит ухудшить взаимоотношения с рядом стран Юго-Восточной Азии и Ближнего Востока. Ближайшим геополитическим союзникам США, как уточняет источник, новые ограничения не грозят, а вот страны, которые в этом смысле стараются быть равноудалёнными от Китая и США, могут попасть под ограничения на закупку компонентов для систем искусственного интеллекта, которые через данные страны могут попадать в Китай, по мнению американских чиновников. Помимо запрета на поставки ускорителей вычислений на базе GPU, власти США готовят и более широкие формулировки, которые позволяют подогнать под ограничения поставок самые разные вычислительные компоненты. Площадь кристалла, количество и плотность размещения транзисторов на нём и некоторые косвенные признаки, указывающие на возможность использования чипа в системах ИИ, станут критериями при формулировании экспортных ограничений. Как сообщается, TSMC и Samsung уже получили письма от американских регуляторов, рекомендующие не принимать заказы от китайских клиентов, касающиеся изготовления высокопроизводительных чипов по передовым техпроцессам. Власти США также стремятся ограничить доступ китайских компаний к вычислительным мощностям, расположенным в других странах. Экспорт программного обеспечения из США также будет подвержен дополнительному контролю, если планируемые меры удастся реализовать. Американские чиновники уже вмешались в процесс сотрудничества Microsoft и компании G42 из ОАЭ, которая была вынуждена отказаться от взаимодействия с китайскими партнёрами и инвесторами в обмен на доступ к ускорителям вычислений Nvidia и американским инвестициям. Малайзия может стать следующей мишенью санкций США, поскольку страна одновременно поддерживает дружественные отношения с Китаем, пытаясь развивать собственную инфраструктуру центров обработки данных и систем искусственного интеллекта. Все описываемые меры только обсуждаются и в конечном итоге могут быть реализованы в модифицированном виде, если дело вообще дойдёт до их внедрения, ведь срок полномочий действующего правительства США истекает в январе. Adobe Photoshop научился удалять отражения в окнах и витринах
13.12.2024 [19:05],
Павел Котов
Adobe представила новый экспериментальный инструмент, который удаляет с фотографий отражения в окнах. Первоначально функцию продемонстрировали на мероприятии Adobe Max 2023, и тогда она называлась Project See Through — теперь с ней могут работать пользователи Adobe Photoshop или Adobe Bridge с подпиской Creative Cloud, скоро она появится в Adobe Lightroom. Фотолюбители, которым доводилось делать снимки через витрину магазина, вероятно, сталкивались с собственным отражением в кадре или световыми бликами, которые портят картинку. Инструмент под названием «Удаление отражения» (Reflection Removal) позволяет удалять их с минимальными усилиями. При помощи искусственного интеллекта он разделяет два изображения: отражение в окне и то, что находится по ту сторону этого окна. Для реализации этой функции Adobe обучила ИИ на нескольких тысячах пар фотографий в исходном виде и с искусственно наложенными на них отражениями. Модели поручили определить, какое из двух изображений является исходным, а какое — составным. Эффективнее всего инструмент справляется с отражениями, которые занимают всё поле зрения на картинке, и он почти неспособен удалять «отражения в окнах, которые имеют небольшой размер или находятся далеко», а также отражения «в винных бокалах, на кузовах автомобилей или отражённые в озере облака». Функция «Удаление отражения» включается отдельно через настройки плагина Camera RAW. Зонд NASA «Юнона» рассказал о «внутренностях» самого вулканически активного объекта Солнечной системы
13.12.2024 [18:56],
Геннадий Детинич
Учёные разгадали одну из главных загадок вулканической активности спутника Юпитера Ио. Они определили глобальную суть вулканических процессов на этой луне, извержения на которой были впервые замечены 44 года назад зондом NASA «Вояджер-1». В основном ожидалось, что в недрах Ио имеется глобальный океан раскалённой магмы. Свежие данные показывают, что это ошибочное мнение — каждый вулкан на Ио имеет свой персональный «ад». О содержании недр небесного тела можно судить по его гравитационному полю. В этом плане Земля и Луна имеют подробнейшие карты гравитационных возмущений, что помогает нам рассчитывать орбиты космических миссий. Карты гравитационных полей Земли и Луны созданы с помощью спутников и измерений их скоростей и ускорений под действием гравитационных сил. Аналогичным образом учёные поступили в случае картирования гравитационного поля Ио. Пробным телом для этого выступил зонд NASA «Юнона» (Juno). Во время двух близких пролётов мимо Ио в декабре 2023 года и феврале 2024 года зонд сближался со спутником до 1500 км. В это время он поддерживал связь с Землёй. Это означает, что радиоканал работал на двух частотах. По изменениям в длинах волн из-за эффекта Доплера можно рассчитать изменения в скорости зонда (ускорение или замедление). Тем самым гравитация Ио, в зависимости от содержимого его недр, повлияла бы на зонд либо так, либо иначе. Как именно, учёные смогли рассчитать и понять, что это означает. Расчёты и моделирование показали, что мантия Ио на небольшой глубине (около 50 км) скорее упруго-вязкая, чем жидкая. Если бы на спутнике был глобальный океан жидкой магмы, отклик был бы совсем другой. Жидкая магма сильнее бы реагировала на приливные силы Юпитера, и это создавало бы более сильные возмущения гравитации, что нашло бы отражение в ускорении «Юноны» во время близкого пролёта этой луны. В случае Ио сотни одновременно действующих вулканов питаются из собственных карманов магмы, а не черпают расплав из общего источника. Проделанная работа помогла понять, что приливные силы не обязательно настолько сильны, как у Юпитера, чтобы расшевелить недра ближайшей луны до состояния расплавленного океана магмы. Очевидно, что это поможет давать оценку экзопланетам и их геологии, а также эволюции. Кроме того, планетологи, похоже, должны пересмотреть возможное строение других близких спутников Юпитера и Сатурна, что со временем непосредственно скажется на наших космических программах. ИИ-бот GigaChat от «Сбера» научился писать музыку по текстовым запросам
13.12.2024 [17:57],
Павел Котов
«Сбер» анонсировал на международной конференции AI Journey новую функцию модели искусственного интеллекта GigaChat — написание музыкальных композиций по текстовому запросу. Простые средства управления GigaChat позволяют создавать музыку всем желающим, «включая представителей далёких от музыкальной индустрии профессий, ценящих уникальность и креативный подход», рассказали в «Сбере». ИИ ориентируется в различных жанрах и стилях — при создании композиций он применяет широкий набор инструментов и генерирует голоса; пользователь же при подготовке запроса может пользоваться заготовками, которые предлагает разработчик. Есть также возможность в свободной форме в текстовом поле подготовить описание желаемой композиции: указать стиль, уточнить аранжировку и выбрать вокал — ограничений нет. У GigaChat отсутствует какая-либо библиотека звуков или вокальных партий — всё генерируется в соответствии с запросом; вокал может быть мужским, женским или хоровым. По желанию пользователя ИИ может даже написать текст песни, которую исполнит созданный им голос. Пока воспользоваться новой функцией GigaChat можно только в мини-приложении во «ВКонтакте»; в будущем она появится в веб-версии GigaChat, а также в Telegram и «Одноклассниках». Microsoft выпустила компактную, но высококачественную ИИ-модель Phi-4
13.12.2024 [16:16],
Павел Котов
Компания Microsoft представила Phi-4 — свою новейшую большую языковую модель генеративного искусственного интеллекта. Новинка отличается относительно компактными размерами и высокой производительностью. Она доступна в режиме предварительного просмотра для исследовательских целей. Microsoft Phi-4 работает более качественно по сравнению с предшественником по ряду критериев, в том числе в решении математических задач, уверяет разработчик — отчасти это результат более высокого качества данных для обучения. Phi-4 пока присутствует в очень ограниченном доступе на платформе для разработки Azure AI Foundry — в соответствии с лицензионным соглашением пользоваться ей можно только в исследовательских целях. Малая языковая модель нового поколения имеет 14 млрд параметров — она позиционируется как конкурент таким проектам как GPT-4o mini, Gemini 2.0 Flash и Claude 3.5 Haiku. Эти небольшие модели ИИ работают быстрее, их обслуживание обходится дешевле, а качество их работы в последнее время резко подскочило. Microsoft объясняет успехи Phi-4 тем, что при её обучении использовался созданный человеком высококачественный контент совместно с «синтетическими массивами данных высокого качества», а также тем, что после обучения производилась некоторая доработка модели. Примечательно, что Phi-4 стала первой моделью этой серии, выпущенной после ухода Себастьена Бубека (Sebastien Bubeck). Он занимал пост вице-президента по исследованиям в области искусственного интеллекта в Microsoft и был ключевой фигурой в разработке моделей Phi, а в октябре он ушёл из компании в OpenAI. Meta✴ показала ИИ для метавселенной и создала альтернативу традиционным большим языковым моделям
13.12.2024 [13:40],
Павел Котов
Meta✴ доложила о результатах последних исследований в области искусственного интеллекта в рамках проектов FAIR (Fundamental AI Research). Специалисты компании разработали модель ИИ, которая отвечает за правдоподобные движения у виртуальных персонажей; модель, которая оперирует не токенами — языковыми единицами, — а понятиями; и многое другое. Модель Meta✴ Motivo управляет движениями виртуальных человекоподобных персонажей при выполнении сложных задач. Она была обучена с подкреплением на неразмеченном массиве с данными о движениях человеческого тела — эта система сможет использоваться в качестве вспомогательной при проектировании движений и положений тела персонажей. «Meta Motivo способна решать широкий спектр задач управления всем телом, в том числе отслеживание движения, принятие целевой позы <..> без какой-либо дополнительной подготовки или планирования», — рассказали в компании. Важным достижением стало создание большой понятийной модели (Large Concept Model или LCM) — альтернативы традиционным большим языковым моделям. Исследователи Meta✴ обратили внимание, что современные передовые системы ИИ работают на уровне токенов — языковых единиц, обычно представляющих фрагмент слова, но не демонстрируют явных иерархических рассуждений. В LCM механизм рассуждения отделён от языкового представления — схожим образом человек сначала формирует последовательность понятий, после чего облекает её в словесную форму. Так, при проведении серии презентаций на одну тему у докладчика уже есть сформированная серия понятий, но формулировки в речи могут меняться от одного мероприятия к другому. При формировании ответа за запрос LCM предсказывает последовательность не токенов, а представленных полными предложениями понятий в мультимодальном и многоязычном пространстве. По мере увеличения контекста на вводе архитектура LCM, по мнению разработчиков, представляется более эффективной на вычислительном уровне. На практике эта работа поможет повысить качество работы языковых моделей с любой модальностью, то есть форматом данных, или при выводе ответов на любом языке. Механизм Meta✴ Dynamic Byte Latent Transformer также предлагает альтернативу языковым токенам, но не посредством их расширения до понятий, а, напротив, путём формирования иерархической модели на уровне байтов. Это, по словам разработчиков, повышает эффективность при работе с длинными последовательностями при обучении и запуске моделей. Вспомогательный инструмент Meta✴ Explore Theory-of-Mind предназначается для привития навыков социального интеллекта моделям ИИ при их обучении, для оценки эффективности моделей в этих задачах и для тонкой настройки уже обученных систем ИИ. Meta✴ Explore Theory-of-Mind не ограничивается заданным диапазоном взаимодействий, а генерирует собственные сценарии. Технология Meta✴ Memory Layers at Scale направлена на оптимизацию механизмов фактической памяти у больших языковых моделей. По мере увеличения числа параметров у моделей работа с фактической памятью требует всё больших ресурсов, и новый механизм направлен на их экономию. Проект Meta✴ Image Diversity Modeling, который реализуется с привлечением сторонних экспертов, направлен на повышение приоритета генерируемых ИИ изображений, которые более точно соответствуют объектам реального мира; он также способствует повышению безопасности и ответственности разработчиков при создании картинок с помощью ИИ. Модель Meta✴ CLIP 1.2 — новый вариант системы, предназначенной для установки связи между текстовыми и визуальными данными. Она используется в том числе и для обучения других моделей ИИ. Инструмент Meta✴ Video Seal предназначен для создания водяных знаков на видеороликах, генерируемых при помощи ИИ — эта маркировка незаметна при просмотре видео невооружённым глазом, но может обнаруживаться, чтобы определить происхождение видео. Водяной знак сохраняется при редактировании, включая наложение эффекта размытия, и при кодировании с использованием различных алгоритмов сжатия. Наконец, в Meta✴ напомнили о парадигме Flow Matching, которая может использоваться при генерации изображений, видео, звука и даже трёхмерных структуры, в том числе белковых молекул — это решение помогает использовать информацию о движении между различным частями изображения и выступает альтернативой механизму диффузии. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |