|
Опрос
|
реклама
Быстрый переход
Молодые компании серьёзно настроены потягаться с Nvidia на рынке систем для запуска ИИ-моделей
28.08.2024 [16:52],
Павел Котов
В попытке ослабить мёртвую хватку Nvidia на рынке чипов для систем искусственного интеллекта сейчас мобилизуется множество конкурентов компании — они привлекают сотни миллионов долларов инвестиций, стремясь воспользоваться волной бума ИИ. Среди наиболее перспективных конкурентов значатся такие компании, как Cerebras, d-Matrix и Groq.
Источник изображения: Mariia Shalabaieva / unsplash.com Мелкие компании решили воспользоваться тем, что спрос на оборудование для инференса ИИ будет расти экспоненциальными темпами. Эти системы необходимы для запуска уже обученных систем вроде OpenAI ChatGPT и Google Gemini — популярность подобных приложений продолжает расти. Сейчас самыми популярными в этом сегменте являются графические процессоры Nvidia, принадлежащие к семейству Hopper. Компании Cerebras, d-Matrix и Groq заняты разработкой более дешёвых, но и более узконаправленных чипов, которые предназначаются для запуска моделей ИИ. Cerebras накануне представила платформу Cerebras Inference, которая работает на чипе CS-3, который занимает целую 300-мм кремниевую пластину. Этот чип, утверждает производитель, в 20 раз быстрее в задачах вывода ИИ, чем ускорители Nvidia Hopper, но стоит дешевле — это подтверждают тесты Artificial Analysis. Чип Cerebras CS-3 отличает другая архитектура, предусматривающая интеграцию компонентов памяти непосредственно в кремниевую пластину процессора. Ограничения, которые налагает пропускная способность памяти, значительно снижают производительность ИИ-ускорителей, утверждают в Cerebras — объединение логики и памяти на одном большом чипе даёт результаты «на порядки быстрее». В конце этого года ещё одна компания, d-Matrix, намеревается выпустить собственную аппаратную платформу Corsair, предназначенную для работы с Triton — открытой программной средой, которая выступает альтернативой Nvidia Cuda. В прошлом году компания привлекла $110 млн вложений, и в этом также проводит раунд финансирования, на котором намеревается привлечь от инвесторов ещё $200 млн или более. Бывший основатель команды, выступающей разработчиком тензорных процессоров Google, теперь возглавляет ещё одну компанию — Groq, которая в этом месяце привлекла $640 млн при оценке $2,8 млрд. Стартапам в области полупроводников, даже несмотря на шумиху в сегменте ИИ-оборудования, непросто выйти на рынок, предупреждают аналитики. Японский финансовый конгломерат SoftBank в июле поглотил чипмейкера Graphcore, заплатив $600 млн — при том, что с момента своего основания в 2016 году компания привлекла у около $700 млн. Но инвесторы не отчаиваются найти и поддержать «новую Nvidia», и этот процесс способствует развитию многих стартапов. Realme намерена отгрузить 100 млн смартфонов с ИИ за три года и войти в тройку крупнейших поставщиков в Европе
28.08.2024 [13:58],
Алексей Разин
Зародившаяся в 2018 году под крылом Oppo марка Realme с 2019 года выступает как самостоятельный игрок, и к ноябрю прошлого года ей удалось поставить на мировой рынок 200 млн смартфонов. В последующие три года она рассчитывает отгрузить 100 млн смартфонов с поддержкой ИИ, а на европейском рынке войти в тройку крупнейших игроков. Она уже сейчас занимает четвёртое место, так что это будет не так сложно.
Источник изображения: Realme Как признался в интервью South China Morning Post генеральный директор Realme Скай Ли (Sky Li), за ближайшие три года компания рассчитывает поставить на рынок 100 млн смартфонов с функциями искусственного интеллекта, стремясь повысить популярность таких устройств среди молодой аудитории. Одновременно Realme рассчитывает сделать такие смартфоны более доступными. Постепенно функции ИИ перестанут быть атрибутами только самых дорогих смартфонов и появятся в устройствах более демократичных ценовых категорий. «2024 год служит пунктом отправления для ИИ-смартфонов, сам по себе ИИ является возможностью для отрасли по выпуску смартфонов, которая позволит переопределить будущее и непрерывно продвигать инновации», — заявил Скай Ли, добавив, что для Realme ИИ является шансом, который нельзя упускать, поскольку эта сфера «станет новым полем битвы, полным вызовов». Среди региональных рынков, помимо китайского, для Realme особое значение имеет европейский. В первом квартале компания уже заняла на нём четвёртое место по количеству проданных смартфонов, за последующие три года она рассчитывает попасть в тройку лидеров. В первом квартале текущего года Realme контролировала 4 % европейского рынка смартфонов. На рынке Китая компания рассчитывает при помощи функций ИИ удвоить объёмы продаж смартфонов к 2026 году. Если на мировом рынке доля смартфонов с поддержкой ИИ, по прогнозам Canalys, по итогам текущего года достигнет 9 %, то в Китае она вырастет до 12 %. Продажи смартфонов растут активнее, чем ожидалось — поставки по итогам года вырастут на 5,8 %
28.08.2024 [11:11],
Алексей Разин
Специалисты IDC разглядели в текущей динамике рынка смартфонов предпосылки для его более активного роста по итогам 2024 года. Теперь они ожидают, что объёмы поставок смартфонов в этом году вырастут на 5,8 % до 1,23 млрд штук, вместо прогнозируемых прежде 4 % прироста. Улучшению прогноза способствовали позитивные итоги первого полугодия.
Источник изображения: Apple По данным аналитиков IDC, в первом квартале текущего года объёмы поставок смартфонов выросли на 12 %, а во втором — на 9 %. В странах с растущей экономикой пользуются высокой популярностью смартфоны под управлением Android начального ценового уровня. На рынках с сильной экономикой больше интереса у потребителей вызывают дорогие модели смартфонов, предлагающие функции искусственного интеллекта. Китайский рынок смартфонов также демонстрирует положительную динамику спроса. Если смартфоны под управлением Android в этом году нарастят объёмы продаж на 7,1 %, то конкурирующие Apple iPhone в штучном выражении прибавят только 0,8 %, как считают аналитики IDC. Продукции Apple в этом случае мешают не только конкуренты на китайском рынке, но и эффект высокой базы, сформированный годом ранее. Не исключено, что успешный дебют функций генеративного искусственного интеллекта Apple Intelligence вместе с выходом семейства iPhone 16 обеспечит продукции Apple более высокую динамику спроса в текущем полугодии. В 2025 году данный фактор уже обеспечит смартфонам Apple возможность нарастить объёмы поставок на 4 %. В целом, смартфоны с функциями генеративного ИИ в текущем году нарастят объёмы продаж сразу на 344 % и захватят 18 % рынка, как считают аналитики IDC. С другой стороны, распространение таких устройств будет сдерживаться их высокой стоимостью, поскольку флагманские модели в этом случае могут оказаться в два раза более простых предшественников. Ранее IDC прогнозировала достижение смартфонами с функциями ИИ доли в 19 % по итогам текущего года. Соответственно, в этом отношении прогноз сменился на более пессимистичный. Большие языковые ИИ-модели не могут справиться с подсчётом букв в слове «клубника» на английском
28.08.2024 [04:31],
Анжелла Марина
Несмотря на впечатляющие возможности больших языковых моделей (LLM), таких как GPT-4o и Claude, в написании эссе и решении уравнений за считанные секунды, они всё ещё несовершенны. Последний пример, ставший вирусным мемом, демонстрирует, что эти, казалось бы, всезнающие ИИ, не могут правильно посчитать количество букв «r» в английском слове «strawberry» (клубника).
Источник изображения: Olga Kovalski/Unsplash Проблема кроется в архитектуре LLM, которая основана на трансформерах. Они разбивают текст на токены, которые могут быть полными словами, слогами или буквами, в зависимости от модели. «LLM основаны на этой архитектуре трансформеров, которая, по сути, не читает текст. Когда вы вводите запрос, он преобразуется в кодировку», — объясняет Мэтью Гуздиал (Matthew Guzdial), исследователь искусственного интеллекта и доцент Университета Альберты, в интервью TechCrunch. То есть, когда модель видит артикль «the», у неё есть только одно кодирование значения «the», но она ничего не знает о каждой из этих трёх букв по отдельности. Трансформеры не могут эффективно обрабатывать и выводить фактический текст. Вместо этого текст преобразуется в числовые представления, которые затем контекстуализируются, чтобы помочь ИИ создать логичный ответ. Другими словами, ИИ может знать, что токены «straw» и «berry» составляют «strawberry», но не понимает порядок букв в этом слове и не может посчитать их количество. Если задать ChatGPT вопрос, «сколько раз встречается буква R в слове strawberry», бот выдаст ответ «дважды». «Сложно определить, что именно должно считаться словом для языковой модели, и даже если бы мы собрали экспертов, чтобы согласовать идеальный словарь токенов, модели, вероятно, всё равно считали бы полезным разбивать слова на ещё более мелкие части, — объясняет Шеридан Фойхт (Sheridan Feucht), аспирант Северо-восточного университета (Массачусетс, США), изучающий интерпретируемость LLM. — Я думаю, что идеального токенизатора не существует из-за этой нечёткости». Фойхт считает, что лучше позволить моделям напрямую анализировать символы без навязывания токенизации, однако отмечает, что сейчас это просто невыполнимо для трансформеров в вычислительном плане. Всё становится ещё более сложным, когда LLM изучает несколько языков. Например, некоторые методы токенизации могут предполагать, что пробел в предложении всегда предшествует новому слову, но многие языки, такие как китайский, японский, тайский, лаосский, корейский, кхмерский и другие, не используют пробелы для разделения слов. Разработчик из Google DeepMind Йенни Джун (Yennie Jun) обнаружил в исследовании 2023 года, что некоторым языкам требуется в 10 раз больше токенов, чем английскому, чтобы передать то же значение. В то время как в интернете распространяются мемы о том, что многие модели ИИ не могут правильно написать или посчитать количество «r» в английском слове strawberry, компания OpenAI работает над новым ИИ-продуктом под кодовым названием Strawberry, который, как предполагается, окажется ещё более умелым в рассуждениях и сможет решать кроссворды The New York Times, которые требуют творческого мышления, а также решать сверхсложные математические уравнения. IBM анонсировала 5-нм процессор Telum II и ускоритель Spyre для задач ИИ
27.08.2024 [05:45],
Анжелла Марина
Компания IBM анонсировала новое поколение вычислительных систем для искусственного интеллекта — процессор Telum II и ускоритель IBM Spyre. Оба продукта предназначены для ускорения ИИ и улучшения производительности корпоративных приложений. Telum II предлагает значительные улучшения благодаря увеличенной кеш-памяти и высокопроизводительным ядрам. Ускоритель Spyre дополняет его, обеспечивая ещё более высокие показатели для приложений на основе ИИ.
Источник изображения: IBM Как сообщается в блоге компании, новый процессор IBM Telum II, разработанный с использованием 5-нанометровой технологии Samsung, будет оснащён восемью высокопроизводительными ядрами, работающими на частоте 5,5 ГГц. Объём кеш-памяти на кристалле получил увеличение на 40 %, при этом виртуальный L3-кеш вырос до 360 Мбайт, а L4-кеш до 2,88 Гбайт. Ещё одним нововведением является интегрированный блок обработки данных (DPU) для ускорения операций ввода-вывода и следующее поколение встроенного ускорителя ИИ. Telum II предлагает значительные улучшения производительности по сравнению с предыдущими поколениями. Встроенный ИИ-ускоритель обеспечивает в четыре раза большую вычислительную мощность, достигая 24 триллионов операций в секунду (TOPS). Архитектура ускорителя оптимизирована для работы с большими языковыми моделями и поддерживает широкий спектр ИИ-моделей для комплексного анализа структурированных и текстовых данных. Кроме того, новый процессор поддерживает тип данных INT8 для повышения эффективности вычислений. При этом на системном уровне Telum II позволяет каждому ядру процессора получать доступ к любому из восьми ИИ-ускорителей в рамках одного модуля, обеспечивая более эффективное распределение нагрузки и достигая общей производительности в 192 TOPS. IBM также представила ускоритель Spyre, разработанный совместно с IBM Research и IBM Infrastructure development. Spyre оснащён 32 ядрами ускорителя ИИ, архитектура которых схожа с архитектурой ускорителя, интегрированного в чип Telum II. Возможность подключения нескольких ускорителей Spyre к подсистеме ввода-вывода IBM Z через PCIe позволяет существенно увеличить доступные ресурсы для ускорения задач искусственного интеллекта. Telum II и Spyre разработаны для поддержки широкого спектра сценариев использования ИИ, включая метод ensemble AI. Этот метод использует преимущества одновременного использования нескольких ИИ-моделей для повышения общей производительности и точности прогнозирования. Примером может служить обнаружение мошенничества со страховыми выплатами, где традиционные нейронные сети успешно сочетаются с большими языковыми моделями для повышения эффективности анализа. Оба продукта были представлены 26 августа на конференции Hot Chips 2024 в Пало-Альто (Калифорния, США). Их выпуск планируется в 2025 году. Apple разрабатывает «ИИ-личность» для роботов-помощников, и это не Siri
27.08.2024 [05:43],
Анжелла Марина
Apple готовится выпустить вместе с iOS 18.1 обновлённую версию ИИ-помощника Siri, который получит множество интересных функций. При этом, согласно данным 9to5Mac, Apple начала разрабатывать новую «ИИ-личность», которая будет совершенно независима от Siri и предназначена для роботов-помощников.
Источник изображения: Copilot Как сообщает Марк Гурман (Mark Gurman) из Bloomberg, Apple активно работает над новым, продвинутым ИИ-ассистентом для своих роботов и роботизированных устройств для использования в быту и не только. Одним из ключевых аспектов этой разработки является создание не просто помощника, а «ИИ-личности». В то время как Siri является цифровым ассистентом на текущих устройствах Apple, «ИИ-личность», которая уже получила кодовое название J595, будет представлять из себя человекоподобный интерфейс на основе генеративного ИИ. «Мне сказали, что интерфейс может быть внедрён на настольные устройства и другие будущие робототехнические гаджеты Apple», — пишет Гурман в своей рассылке Power On. J595 будет похож на iPad, но с камерами и основанием, оснащённым роботизированным приводом. Планируется, что этот продукт появится около 2026 или 2027 года, а позднее последуют мобильные роботы и, возможно, даже человекоподобные модели. В основе идеи лежит уверенность Apple в том, что устройство полезно только в том случае, если до него можно дотянуться. При этом довольно много ситуаций, когда необходим компьютер, но его нет поблизости, или руки заняты чем-то другим. Например, присоединение роботизированной «руки» к iPad потенциально сделает устройство более полезным для видеоконференций или поиска рецептов в интернете. Робот сможет поворачивать и экран, если получит такую команду. Apple уже размышляет над возможностью создания роботов, которые смогут выполнять и домашние дела — например, загружать стиральную машину или мыть грязные тарелки. Однако это идеи будущего, которые пока не выходят за рамки идей и набросков на бумаге. Intel хочет побудить производителей ПК активнее продвигать AI PC на чипах Core
27.08.2024 [00:19],
Владимир Мироненко
Компания Intel объявила конкурс AI PC Innovation Challenge, который должен побудить производителей компьютеров, которые являются участниками партнёрской программы Intel Partner Alliance (IPA), активизировать разработку приложений для ПК с искусственным интеллектом (AI PC) на базе процессоров Core Ultra, а также предпринимать больше усилий по продвижению AI PC.
Источник изображения: Intel «Мы запускаем инновации, но мы, конечно, приглашаем наших партнёров внедрять инновации вместе с нами и расширять рынок», — заявил на прошлой неделе Яссер Рашид (Yasser Rasheed), глобальный директор Intel по стратегии клиентского канала и партнёрским программам. По словам Рашида, в конкурсе могут принять участие члены IPA. Его условиями предусмотрены три уровня призов. На первом уровне любой партнёр, который отправит квалифицированную заявку на участие в конкурсе до 15 октября, получит 500 баллов IPA и доступ в «Зону активации AI PC» (AI PC Activation Zone) компании Intel. На втором уровне конкурса 24 победителя из четырёх регионов, включая Америку, получат по 1000 баллов IPA, специальные приглашения на региональные мероприятия, продвижение на каналах Intel в социальных сетях и возможности для поиска партнёров. Другие регионы включают Европу, Ближний Восток и Африку; Азиатско-Тихоокеанский регион, Японию и Китай. На третьем уровне занявшие первые три места в каждом регионе получат средства в виде фондов развития рынка (MDF) для мероприятий по AI PC. Intel выделит $10 000 победителю, $5000 — занявшему второе место и $3000 — третьему призёру. Также Intel заявила в понедельник, что расширяет ряд преимуществ IPA для партнёров по AI PC. Речь идёт о специальных начислениях баллов IPA и новых предложениях, которые позволят партнёрам зарабатывать в два раза больше баллов за продажу AI PC с процессорами Core Ultra. Эти баллы можно будет в дальнейшем использовать для получения ваучеров у авторизованных дистрибьюторов Intel, продуктов Intel, обучения, сертификации и поддержки клиентов. Intel также представила новые учебные курсы по созданию и продаже AI PC. Кроме того, компания выпустит так называемую книгу AI PC Look Book, в которой будут представлены независимые поставщики ПО, разрабатывающие функции с поддержкой ИИ для ПК, а также запустит «Зону активации AI PC» — веб-страницу, посвящённую партнёрским ресурсам AI PC. Рашид заявил, что рынок AI PC является главным приоритетом для Intel, добавив, что партнёры играют важную роль в создании и развитии этой категории продуктов. Китайские ИИ-компании в поисках монетизации нацелились на зарубежные рынки
26.08.2024 [09:52],
Анжелла Марина
Геополитическая напряжённость и технологический разрыв вынуждают китайских разработчиков искать новые стратегии для выхода на мировой рынок. Alibaba, ByteDance и другие крупные китайские компании стали запускать приложения на базе искусственного интеллекта не только для домашнего рынка, но и для глобальной аудитории, адаптируя свои продукты к различным рынкам.
Источник изображения: Copilot По сообщению издания South China Morning Post со ссылкой на исследование Unique Capital, среди 1500 активных компаний в сфере ИИ по всему миру, 103 китайские фирмы уже начали расширяться на зарубежные рынки. Эта тенденция обусловлена сложностью в убеждении китайских пользователей платить за ИИ-сервисы, что побудило некоторые компании искать возможности роста за рубежом. Например, компания Alibaba, в соответствии со своей стратегией в области электронной коммерции и облачных вычислений в регионе, запустила ИИ-модель SeaLLMs, адаптированную для рынков Юго-Восточной Азии. Компания ByteDance, владелец TikTok, представила ряд приложений для потребителей на глобальном рынке, включая ИИ-помощника по дому Gauth, приложение с интерактивными персонажами AnyDoor и платформу для ИИ-ботов Coze. Minimax, один из ведущих китайских стартапов в области ИИ, также запустил приложение Talkie AI для международных пользователей. По мнению экспертов отрасли, зарубежные рынки предлагают больший потенциал для роста на фоне жёсткой конкуренции внутри страны. Райан Чжан Хаоран (Ryan Zhang Haoran), соучредитель Motiff, компании-разработчика платформы для дизайна пользовательского интерфейса на базе ИИ, отмечает: «Зарубежные пользователи более охотно платят за программное обеспечение, и там больше профессионалов, способных предоставить ценную обратную связь». Чжан подчёркивает, что компания с самого начала ориентировалась на возможности бизнеса как внутри страны, так и за рубежом. При этом Motiff удалось довольно быстро привлечь первых клиентов из США, Японии, Юго-Восточной Азии и Латинской Америки. Другая пекинская компания Kunlun Tech, являющаяся ветераном среди китайских технологических компаний, также нацелена на зарубежных пользователей. Генеральный директор Фан Хан (Fang Han) отмечает, что конкурентная среда за рубежом становится более насыщенной по мере того, как китайские компании выходят на международный рынок. «Контент, генерируемый ИИ, фундаментально снижает барьеры и затраты для создателей, что приводит к революции в индустрии изготовления контента», — говорит Фан. Недавно Kunlun Tech запустила ряд приложений на базе ИИ, включая музыкальный стриминговый сервис Melodio, коммерческую платформу Mureka для создания музыки с помощью ИИ и платформу для генерации короткометражных фильмов SkyReels. Выход китайских разработчиков ИИ на международный рынок обусловлен также как высокой конкуренцией на внутреннем рынке, так и стремлением к расширению и монетизации своих продуктов. Однако китайским разработчикам ИИ приходится учитывать не только рыночные реалии, но и политическую ситуацию, особенно в свете ухудшения отношений между Вашингтоном и Пекином. Некоторые компании даже пытаются скрыть своё китайское происхождение. Например, стартап HeyGen, занимающийся генеративным ИИ, переместил свою штаб-квартиру в Лос-Анджелес и призвал своих китайских инвесторов продать акции в пользу американских партнёров, чтобы минимизировать связи с материковым Китаем в условиях ужесточения контроля. «Соблюдение норм является критически важным. Вход на новый рынок означает соответствие его правилам», — отметил Чжан из Motiff. Он добавил, что, несмотря на единообразие продуктов на глобальном уровне, инфраструктура компании адаптирована для различных рынков с использованием различных моделей с открытым исходным кодом и облачных сервисов. Южнокорейский ускоритель вычислений Rebellions получит четыре 12-ярусных стека памяти HBM3E общим объёмом 144 Гбайт
25.08.2024 [06:36],
Алексей Разин
На этой неделе, как сообщает Business Korea, технический директор южнокорейского стартапа Rebellions О Чжин Ук (Oh Jin-wook) признался в намерениях ускорить вывод на рынок ускорителя вычислений Rebel Quad, который будет сочетать четыре стека памяти Samsung HBM3E с 12 ярусами в каждом. Ускоритель выйдет на рынок до конца года и будет почти полностью производиться Samsung Electronics.
Источник изображения: Rebellions Корейская компания пытается составить конкуренцию ускорителям Nvidia и AMD, её решения также могут использоваться в системах искусственного интеллекта. Примечательно, что первое поколение ускорителей Atom компании Rebellions использовало микросхемы памяти типа GDDR6 совокупным объёмом 16 Гбайт, и новинка Rebel Quad будет первенцем марки с памятью типа HBM. Четыре стека HBM3E в 12-ярусном исполнении обеспечат совокупный объём памяти 144 Гбайт, и это позволяет изделию южнокорейского стартапа сравниться с ускорителями Nvidia семейства Blackwell. Непосредственно чип ускорителя Rebel Quad будет выпускаться компанией Samsung по 4-нм технологии, она же займётся и упаковкой, поэтому в этом отношении подрядчик предложит Rebellions комплексные услуги. Представители стартапа подчеркнули, что сейчас не рассматривают возможность сотрудничества с TSMC. Примечательно, что недавно Rebellions поглотила конкурирующую южнокорейскую компанию Sapeon, которая использует в своих ускорителях память типа SK hynix. Впрочем, схема сотрудничества с Samsung вряд ли оставляет Rebellions возможность присматриваться к другим поставщикам памяти. Microsoft скоро перестанет нанимать программистов, которые не используют ИИ
24.08.2024 [01:00],
Анжелла Марина
Инвестиции в помощников по программированию на базе ИИ достигли почти $1 млрд с начала прошлого года. Microsoft, Amazon и Google включились в гонку за лидерство в этом сегменте, внедряя технологию в свои продукты, что уже приносит значительную прибыль как компаниям, так и разработчикам. Более того, в Microsoft заявили, что скоро перестанут нанимать программистов, которые не используют ИИ-помощников.
Источник изображения: Copilot Компании, разрабатывающие ИИ-ассистентов для программирования, такие как Replit, Anysphere, Magic, Augment, Supermaven и Poolside AI, привлекли $433 млн только в этом году, что в совокупности с инвестициями прошлого года составляет почти $1 млрд. Стремление вкладывать деньги в ИИ-помощников для программирования указывает на то, что кодинг может стать первой областью, которая существенно трансформируется под влиянием последней волны технологий ИИ. «Сегодня программная инженерия и программирование — это номер один среди областей, на которые влияет ИИ, — заявил Хади Партови (Hadi Partovi), генеральный директор некоммерческой образовательной организации Code.org, давний инвестор проектов Кремниевой долины и советник Airbnb, Uber, Dropbox и Facebook✴✴. — На сегодняшний день программирование без ИИ немного похоже на письмо без текстового редактора». Интересно, что растущая уверенность в преимуществах ИИ-кодирования контрастирует с вопросами некоторых инвесторов об экономической выгоде генеративного ИИ и вероятной окупаемости прогнозируемых триллионных инвестиций в крупнейшие технологические компании (Big Tech) в вычислительную инфраструктуру для поддержки этой технологии в ближайшие годы. Но в то время как некоторые инвесторы сомневаются в экономической выгоде ИИ и рентабельности инвестиций Big Tech в его инфраструктуру, в Кремниевой долине наоборот растёт уверенность. Ханна Сил (Hannah Seal), партнёр Index Ventures, которая инвестировала в стартап Augment, сказала, что «гораздо проще монетизировать ИИ, если вы можете встроить свой продукт в существующий рабочий процесс и сделать все преимущества мгновенно видимыми». Для неё вопросы монетизации ИИ-инструментов заключаются в следующем: «Каково время получения прибыли и насколько эта прибыль значима?». При этом она отмечает, что с ИИ-помощниками по кодированию таких вопросов уже не возникает. Энтузиазм в отношении ИИ побудил стартапы и технологических гигантов Microsoft, Amazon, Meta✴✴ и Google бороться за доминирование в переполненном секторе, создавая ИИ-помощников и агентов, которые могут писать и редактировать программный код. Более того, руководитель совета директоров Code.org, в который входят Дэвид Тредвелл (David Treadwell), глава электронной коммерции Amazon, и Кевин Скотт (Kevin Scott), технический директор Microsoft, недавно сказал Партови, что их компания к концу года прекратит нанимать людей, которые программируют без использования ИИ. Напомним, GitHub, пионер в области ИИ-кодирования, стал одним из первых, кто интегрировал большие языковые модели (LLM) в свои продукты. «Когда мы начали использовать GPT-3, мы быстро поняли, что он очень хорошо пишет код, и решили создать на его основе GitHub Copilot», — заявил Томас Дохмке (Thomas Dohmke), генеральный директор GitHub. GitHub Copilot, был запущен в 2022 году и уже насчитывает почти 2 млн платных подписчиков и, как утверждает Дохмке, он пишет код гораздо лучше, чем средний разработчик.
Источник изображения: GitHub Доход GitHub, по состоянию на апрель, увеличился на 45 % по сравнению с прошлым годом, и по словам генерального директора Microsoft Сатьи Наделлы (Satya Nadella), годовой доход GitHub на начало этого месяца составил $2 млрд. «Copilot стал причиной более чем 40-% роста доходов GitHub в этом году и уже превышает по размеру весь бизнес GitHub с момента его приобретения», — отметил Наделла. Тем не менее, IT-отделы крупных компаний всё ещё имеют некоторые опасения по поводу безопасности использования автоматизированных инструментов программирования для создания кода, готового к производству. Дохмке подчеркнул, что пока не следует ожидать внедрения сгенерированного искусственным интеллектом кода без ручного тестирования. Китай обходит санкции США на ИИ-ускорители с помощью облака Amazon
23.08.2024 [17:46],
Анжелла Марина
Китайские компании нашли «дыру» в законодательстве США, получая доступ к передовым американским технологиям ИИ через облачные сервисы, такие как Amazon Web Services (AWS). Расследование Reuters показало, что минимум 11 китайских компаний, связанных с государственными структурами, обходят санкции, покупая доступ к запрещённым чипам и моделям ИИ через AWS.
Источник изображения: Copilot Согласно недавно опубликованным тендерным документам, китайские организации используют облачные сервисы Amazon и сервисы других компаний для доступа к передовым американским чипам и возможностям искусственного интеллекта, которые они не могут приобрести иным способом. Известно, что правительство США ограничило экспорт передовых ИИ-чипов в Китай. Однако предоставление доступа к таким чипам или продвинутым ИИ-моделям через облако не является нарушением американских правил. Выяснилось, что по меньшей мере 11 китайских организаций, включая Шэньчжэньский университет и исследовательский институт Zhejiang Lab, стремились получить доступ к облачным сервисам, предоставляющим запрещённые чипы Nvidia. В одном из тендеров указано, что Шэньчжэньский университет потратил 200 000 юаней ($27 996) за аккаунт AWS для получения доступа к облачным серверам на базе чипов Nvidia A100 и H100 для неуточнённого проекта, получив эту услугу через посредника, компанию Yunda Technology. Институт Zhejiang Lab, разрабатывающий собственную модель ИИ GeoGPT, заявил в тендере в апреле о намерении потратить 184 000 юаней ($25 782) на услуги облачных вычислений AWS, так как его ИИ-модель не получала достаточной вычислительной мощности от местного поставщика услуг Alibaba.
Источник изображения: aboutamazon.com Правительство США в настоящее время пытается ужесточить правила, чтобы ограничить доступ через облако. «Эта лазейка беспокоит меня уже много лет, и нам давно пора её устранить», — заявил Майкл Маккол (Michael McCaul), председатель Комитета по иностранным делам Палаты представителей США. При этом, в настоящий момент AWS не нарушает правил, установленных правительством США. «AWS соблюдает все применимые законы США, включая торговые законы, в отношении предоставления услуг AWS внутри и за пределами Китая», — заявил представитель облачного подразделения Amazon. Расследование Reuters также выявило, что Китай обходит ограничения США, закупая доступ к облачным сервисам Microsoft и OpenAI. В частности, Сычуаньский университет приобрёл 40 миллионов токенов Azure OpenAI, а Сучжоуский институт передовых исследований при Научно-техническом университете Китая (USTC) арендовал 500 облачных серверов, оснащённых чипами Nvidia A100. Несмотря на то, что Microsoft и OpenAI официально не поддерживают свои сервисы в Китае, а USTC находится в чёрном списке Минторга США, китайские компании получают доступ к технологиям через их облако. Также выяснилось, что Amazon не только предоставляет организациям из Поднебесной доступ к передовым чипам для ИИ, но и открывает возможность использования ИИ-моделей, таких как Claude от Anthropic. Для этого компания активно продвигает свои облачные сервисы на китайском рынке, подчёркивая доступность «лучших в мире моделей ИИ» для клиентов в регионе. Google показала системы с собственными TPU, на которых обучаются ИИ-модели Gemini и Apple Intelligence
23.08.2024 [17:45],
Павел Котов
В большой лаборатории в штаб-квартире Google в калифорнийском Маунтин-Вью работают сотни серверных стоек, выполняя задачи, отличные от поисковой системы или рабочих нагрузок Google Cloud. Здесь тестируются тензорные процессоры (Tensor Processing Units —TPU), разработанные самой Google. Журналистам CNBC удалось заглянуть внутрь этой лаборатории.
Источник изображения: alban / unsplash.com TPU от Google появились в 2015 и стали доступны облачным клиентам в 2018 году — они используются, в частности, для обучения моделей Apple Intelligence и Google Gemini. Google была первым поставщиком облачных услуг, который построил собственные чипы для ИИ — Amazon анонсировала свои Inferentia лишь три года спустя, а Microsoft представила Maia лишь в конце 2023 года. Но это первенство не помогло Google стать лидером в гонке генеративного ИИ: Gemini вышла более чем через год после OpenAI ChatGPT. При этом предложения в области ИИ помогли Google Cloud набрать обороты: этот сегмент в компании показал рост на 29 %, а квартальная выручка впервые превысила $10 млрд, гласит последний квартальный отчёт Alphabet. В Google пришли к мысли о создании собственного чипа, когда в 2014 году задумались, какими должны быть ресурсы, чтобы все пользователи сервисов компании смогли пользоваться голосовым интерфейсом хотя бы 30 секунд в день. Как выяснилось, число компьютеров в центрах обработки данных было необходимо удвоить. Google TPU помог поднять эффективность при выполнении некоторых задач в 100 раз. В компании до сих пор используют и традиционные центральные процессоры, и графические процессоры Nvidia. Но Google TPU — это интегральная схема специального назначения (ASIC), предназначенная только для конкретного типа задач. В распоряжении компании есть ещё один такой чип — Video Coding Unit, и используется он для обработки видео. ![]() Собственные чипы Google по примеру Apple стала использовать и в устройствах своей разработки: в смартфонах Pixel 9 это процессор четвёртого поколения Tensor G4, а в наушниках Pixel Buds Pro 2 — Tensor A1. Но важной отличительной чертой Google является серверный TPU — сейчас он занимает 58 % рынка среди облачных ускорителей ИИ собственной разработки. Графические процессоры Nvidia более гибкие, но и более дорогие и дефицитные в сегодняшних условиях, когда бум ИИ взвинтил акции компании до небес, и теперь она соперничает за звание самой дорогой публичной компании в мире с Apple и Microsoft. Настоящее испытание Google TPU ждёт, когда платформа Apple Intelligence в следующем году начнёт в полную силу работать на iPhone и Mac. Разработка альтернативы ускорителям Nvidia — почти подвиг. Процесс настолько сложен и дорог, что даже Google не под силу сделать это в одиночку. С момента появления первого TPU компания заручилась поддержкой чипмейкера Broadcom, который помогает Meta✴✴ в решении той же задачи. Проект полностью разработанного чипа отправляется к полупроводниковому подрядчику — в его роли выступает TSMC, выпускающая 92 % передовой полупроводниковой продукции в мире.
Trillium. Источник изображения: CNBC/Marc Ganley В этом году у Google выйдет шестое поколение TPU Trillium; кроме того, в минувшем апреле компания анонсировала и Axion — свой первый центральный процессор, который появится в конце года. И здесь Google уже не первая: Amazon выпустила свой Graviton в 2018 году, китайская Alibaba последовала её примеру в 2021 году, а Microsoft представила чип Cobalt 100 в ноябре прошлого года. Все они основаны на архитектуре Arm, более гибкой и энергоэффективной, чем x86, которой привержены Intel и AMD. Axion CPU. Источник изображения: CNBC/Marc Ganley Эффективность является важнейшим аспектом: если верить прогнозам, к 2027 году серверы ИИ будут потреблять столько же энергии в год, сколько Аргентина. Последний экологический отчёт Google показал, что выбросы компании с 2019 по 2023 гг. выросли на 50 % — отчасти из-за роста числа ЦОД для ИИ. Для охлаждения серверов для обучения и работы ИИ требуются огромные объёмы воды, поэтому с третьего поколения Google TPU охлаждение производится непосредственно на чипе — к такой же схеме прибегла и Nvidia с новейшими Blackwell. И, несмотря на сопутствующие трудности, оборудование Google для ИИ продолжает пользоваться большим спросом, и его ослабления в компании пока не отмечают. Microsoft выпустила три новые ИИ-модели ИИ Phi-3.5 — они превосходят аналоги от Google и OpenAI
23.08.2024 [11:03],
Павел Котов
Компания Microsoft не стала почивать на лаврах своего партнёрства с OpenAI и выпустила три новые системы искусственного интеллекта, относящиеся к семейству Phi — языковые и мультимодальные модели.
Источник изображения: VentureBeat / Midjourney Три новых проекта линейки Phi 3.5 включают большую языковую модель базового варианта Phi-3.5-mini-instruct на 3,82 млрд параметров, мощную Phi-3.5-MoE-instruct на 41,9 млрд параметров, а также Phi-3.5-vision-instruct на 4,15 млрд параметров — она предназначена для анализа изображений и видео. Все три модели доступны под брендом Microsoft на платформе Hugging Face по лицензии MIT — их можно загружать, производить тонкую настройку, модифицировать и использовать в коммерческих целях без ограничений. В тестах они не уступают, а иногда и превосходят такие конкурирующие продукты как Google Gemini 1.5 Flash, Meta✴✴ Llama 3.1 и даже OpenAI GPT-4o.
Здесь и далее источник изображения: VentureBeat / Midjourney Phi-3.5 Mini Instruct оптимизирована для окружений с ограниченными вычислительными ресурсами. Это облегчённая модель с 3,8 млрд параметров. Она предназначается для выполнения инструкций и поддерживает контекст длиной 128 тыс. токенов. Модель справляется с такими задачами как генерация кода, решение математических задач и логические рассуждения. Несмотря на свой компактный размер, Phi-3.5 Mini Instruct вполне конкурентоспособна в многоязычных и многооборотных языковых задачах. В тесте RepoQA, который используется для оценки «понимания длинного контекстного кода» она опережает, в частности, Llama-3.1-8B-instruct и Mistral-7B-instruct. ![]() Phi-3.5 MoE (Mixture of Experts) объединяет несколько моделей различного типа, каждая из которых специализируется на собственной задаче. Архитектура модели характеризуется 42 млрд активных параметров и поддержкой контекста в 128 тыс., что позволяет применять её в требовательных приложениях — примечательно, что в документации Hugging Face говорится лишь о 6,6 млрд активных параметров. Phi-3.5 MoE демонстрирует достойные результаты в математике, генерации кода и понимании многоязычных запросов, зачастую превосходя более крупные модели в некоторых тестах, включая RepoQA; она также обошла GPT-4o mini в тесте MMLU (Massive Multitask Language Understanding) в области естественных и технических наук, а также гуманитарных и социальных дисциплин на разных уровнях знаний. ![]() Phi-3.5 Vision Instruct объединяет возможности обработки текста и изображений. Она подходит для распознавания картинок и символов, анализа диаграмм и таблиц, а также составления сводок по видео. Vision Instruct, как и другие модели Phi-3.5, поддерживает длину контекста 128 тыс. токенов, что позволяет ей работать со сложными многокадровыми визуальными задачами. Система была обучена на синтетических и отфильтрованных общедоступных наборах данных с упором на высококачественные массивы информации с высокой плотностью рассуждений. Phi-3.5 Mini Instruct обучалась на 3,4 трлн токенов с использованием 512 ускорителей Nvidia H100-80G в течение 10 дней; модель смешанной архитектуры Phi-3.5 MoE была обучена на 4,9 трлн токенов с использованием 512 единиц Nvidia H100-80G за 23 дня; для обучения Vision Instruct на 500 млрд токенов с использованием 256 ИИ-ускорителей Nvidia A100-80G потребовались 6 дней. Всё трио Phi-3 доступно по лицензии MIT — она позволяет разработчикам свободно использовать, изменять, объединять, публиковать, распространять, сублицензировать или продавать копии продуктов. Лицензия содержит отказ от ответственности: модели предоставляются «как есть» без каких-либо гарантий — Microsoft и другие обладатели авторских прав не несут ответственности за любые претензии, убытки и прочие обязательства, которые могут возникнуть при использовании моделей. Акции Meta✴ взлетели после того, как Цукерберг смог «продать» инвесторам идею ИИ
23.08.2024 [04:37],
Анжелла Марина
Акции Meta✴✴ обновили исторический максимум после того, как Марк Цукерберг (Mark Zuckerberg) представил на недавнем отчётном заседании убедительные аргументы о преимуществах ИИ, что повысило доверие инвесторов и привело к росту акций компании.
Источник изображения: Artapixel/Pixabay Акции компании Meta✴✴ выросли на 13 % в этом месяце, значительно превзойдя показатели других технологических гигантов, несмотря на очередной скачок капитальных расходов в ИИ и обещания увеличить их в будущем. В четверг акции выросли на 1,7 %, достигнув рекордного уровня в $544,23. Как пишет Bloomberg, cекрет такого успеха заключается в том, что Цукербергу удалось убедить инвесторов в том, что искусственный интеллект помогает улучшить результаты в основном бизнесе компании — цифровой рекламе. Другие компании Big Tech, такие как Amazon, Microsoft и Alphabet, не смогли так же чётко сформулировать преимущества ИИ для своего бизнеса. «Это был его лучший отчёт о прибылях и убытках в качестве генерального директора», — считает Джин Манстер (Gene Munster), управляющий партнёр Deepwater Asset Management. — Он объяснил краткосрочные и долгосрочные преимущества ИИ, а также сроки реализации всех планов. Это было убедительно». Цукерберг объяснил, что Meta✴✴ использует ИИ для повышения эффективности поиска целевой аудитории рекламодателями, что напрямую влияет на основной источник дохода компании. Кроме того, Meta✴✴ использует собственные большие языковые модели (LLM) для улучшения рекомендаций контента, что способствует повышению вовлечённости пользователей в Facebook✴✴ и Instagram✴✴. В то же время инвесторы стали более критично относиться к расходам других крупных технологических компаний. Так, акции Alphabet, материнской компании Google, показали более низкие результаты после публикации отчёта о прибылях и убытках в прошлом месяце, который продемонстрировал более высокие, чем ожидалось, капитальные расходы, несмотря на то, что прибыль и выручка превысили прогнозы. То же самое можно сказать и о Microsoft, после того как её результаты показали замедление роста в бизнесе облачных вычислений Azure. Акции Alphabet упали на 9 % после публикации отчёта о прибылях и убытках 23 июля, а акции Microsoft практически не изменились с момента публикации результатов 30 июля. «Google в своём отчёте по сути сказала: ну, нам нужно тратить деньги, чтобы идти в ногу со всеми, что выглядело не очень убедительно, — сказал Алек Янг (Alec Young), главный инвестиционный стратег Mapsignals. — Microsoft продала это немного лучше, высказав эту мысль другими словами. Но по сути, они делают то же самое». Инвестиционный аналитик из Global X ETFs Эндрю Йе (Andrew Ye) сказал, что Meta✴✴ инвестирует и будет продолжать значительно вкладываться в генеративный ИИ, но, очевидно, смогла более чётко сформулировать своё видение интеграции ИИ, чем её конкуренты. Microsoft будет подчёркивать вклад ИИ в свои доходы
22.08.2024 [19:08],
Сергей Сурабекянц
Крупные технологические компании, включая Microsoft и Google, сталкиваются с давлением инвесторов, требующих показать окупаемость многомиллиардных инвестиций в инфраструктуру ИИ. На сегодняшний день Microsoft — одна из немногих крупных компаний, которые выделяют вклад ИИ в своих квартальных отчётах. Теперь компания изменила структуру своих отчётов, чтобы предоставить инвесторам максимально чёткую картину вклада ИИ в доходность каждого подразделения. Часть доходов от поиска и новостной рекламы теперь отнесена к подразделению облачных вычислений Azure. А доходы от услуг ИИ и речевых технологий, предлагаемых подразделением Nuance, теперь относятся к бизнесу по производительности, который представляет пакет офисных приложений Office. По словам компании, эти изменения позволят Microsoft привести структуру отчётности в соответствие с тем, как управляется её бизнес. Компания перераспределила по подразделениям выручку за последний финансовый год и пересмотрела свой прогноз на третий квартал. Microsoft сообщила, что ИИ оказал большее влияние на рост облачного подразделения Azure во втором квартале, даже несмотря на общее замедление бизнеса. Компания ожидает ускорения роста Azure во второй половине 2025 финансового года. Доход от интеллектуального облака должен составить от $23,80 млрд до $24,10 млрд в первом квартале следующего года, что заметно ниже прежних прогнозов в диапазоне от $28,6 млрд до $28,9 млрд. Прогноз доходности в сегменте персональных компьютеров также снижен — от $12,25 млрд до $12,65 млрд по сравнению с предыдущим прогнозом от $14,9 млрд до $15,3 млрд. Снижение ожидаемой доходности этих подразделений связано как раз с изменением структуры отчётности, что подтверждается существенно выросшими ожиданиями от подразделения производительности. Прогноз его дохода вырос до диапазона от $27,75 млрд до $28,05 млрд, что на $8 млрд выше прежних планов. |
|
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |