Опрос
|
реклама
Быстрый переход
OpenAI представила GPT-4.5 — самую большую и осведомлённую ИИ-модель для ChatGPT без поддержки размышлений
28.02.2025 [00:31],
Андрей Созинов
OpenAI выпустила GPT-4.5 — свою самую передовую и крупную большую языковую модель (LLM) искусственного интеллекта. Разработчик называет этот релиз своей «самой осведомлённой моделью», но предупреждает, что GPT-4.5 не является прорывной моделью и может не демонстрировать таких высоких результатов, как o1 или o3-mini, обладающие способностями к рассуждению. ![]() Источник изображений: OpenAI GPT-4.5 предлагает улучшенные навыки написания текстов, более качественные знания о мире и то, что OpenAI называет «усовершенствованной индивидуальностью по сравнению с предыдущими моделями». Компания утверждает, что взаимодействие с GPT-4.5 будет более «естественным» и отмечает, что модель лучше распознаёт паттерны и определяет взаимосвязи, что делает её идеальной для написания текстов, программирования и «решения практических задач». ![]() При этом OpenAI предупредила, что в GPT-4.5 недостаточно новых возможностей, чтобы считать её передовой моделью. «GPT-4.5 не является прорывной моделью, но это самая большая LLM OpenAI, превосходящая вычислительную эффективность GPT-4 более чем в 10 раз, — говорится в документе OpenAI, который просочился в Сеть до анонса. — Она не представляет семь новых возможностей по сравнению с предыдущими версиями со способностью к рассуждениям, и её производительность ниже, чем у o1, o3-mini и Deep Research в большинстве тестов». Ранее сообщалось, что OpenAI использует свою модель с возможностью рассуждений o1 для обучения GPT-4.5 на синтетических данных. Сама OpenAI заявила, что обучила GPT-4.5 «с помощью новых методов контроля в сочетании с традиционными методами, такими как контролируемая тонкая настройка (SFT) и обучение с подкреплением на основе человеческой обратной связи (RLHF), аналогичными тем, что использовались для GPT-4o». «Мы адаптировали GPT-4.5 так, чтобы он лучше сотрудничал, делая разговоры более тёплыми, интуитивными и эмоционально насыщенными, — сказал Рафаэль Гонтихо Лопес (Raphael Gontijo Lopes), исследователь из OpenAI. — Чтобы оценить это, мы попросили тестировщиков сравнить её [новую модель] с GPT-4o, и GPT-4.5 оказалась впереди практически по всем категориям». Несмотря на некоторые ограничения, GPT-4.5 галлюцинирует значительно меньше, чем GPT-4o, и немного меньше, чем модель o1, заявила OpenAI. Также новинка демонстрирует более развитую интуицию и творческие способности, лучше понимает, что имеют в виду пользователи, и «интерпретирует тонкие сигналы или неявные ожидания с большим количеством нюансов». GPT-4.5 с сегодняшнего дня доступна пользователям с подпиской ChatGPT Pro за $200 в месяц, а также исследователям. Сейчас модель находится на стадии предварительного исследовательского тестирования. Решение выпустить её в таком виде обусловлено желанием «лучше понять её сильные стороны и ограничения». «Мы всё ещё изучаем её возможности и с нетерпением ждём, когда люди начнут использовать её так, как мы, возможно, не ожидали», — подытожили в OpenAI. В компании не сообщили, когда сделают новинку доступной более широкой публике. На прошлой неделе сообщалось, что OpenAI планирует запустить GPT-4.5 к концу февраля, а GPT-5 — уже в конце мая. Генеральный директор OpenAI Сэм Альтман (Sam Altman) назвал GPT-5 «системой, объединяющей множество наших технологий», отметив, что она будет включать модель OpenAI o3. В прошлом месяце OpenAI выпустила o3-mini, но полноценная o3 появится только как часть GPT-5. Компания таким образом намерена объединить свои большие языковые модели, чтобы в итоге создать одну более мощную систему, способную самостоятельно определять, какие ресурсы необходимо задействовать для решения той или иной задачи. Китайцы представили быстро думающий ИИ Turbo S — он отвечает быстрее DeepSeek
27.02.2025 [19:52],
Владимир Мироненко
Компания Tencent Holdings представила модель ИИ Hunyuan Turbo S, которая, по её словам, превосходит по скорости реагирования на запросы модель DeepSeek R1, обладающую способностью к размышлению. Tencent также отметила, что стоимость использования Hunyuan Turbo S во много раз ниже, чем у предыдущих версий её ИИ-моделей, пишет Bloomberg. ![]() Источник изображения: Tencent Hunyuan Turbo S способна отвечать на запросы в течение секунды, что отличает её «от DeepSeek R1, Hunyuan T1 и других медленно думающих моделей, которым нужно немного “подумать”, прежде чем ответить», заявила Tencent. Компания добавила, что при тестировании в таких областях, как знания, математика и рассуждения, возможности Turbo S соответствуют ИИ-модели DeepSeek V3, обеспечивающей работу чат-бота DeepSeek, который превзошёл ChatGPT от OpenAI по количеству загрузок в магазинах приложений. В подтверждение своих заявлений Tencent привела данные, показывающие, что Hunyuan Turbo S вполне может состязаться с моделью DeepSeek V3 в популярных тестах ИИ. Успех моделей DeepSeek R1 и V3, ставших широко известными и вызвавших интерес в Кремниевой долине, заставил китайские технологические гиганты, такие как Tencent и Alibaba, ускорить выпуск новых версий ИИ-моделей. Спустя всего несколько дней после выхода DeepSeek R1 гигант электронной коммерции Alibaba представил модель Qwen 2.5-Max, которая, по его словам, превосходит DeepSeek V3 по всем показателям, а также опережает по возможностям другие ведущие модели, такие, как GPT-4o и Claude-3.5 Sonnet. Tencent, которая наряду с Alibaba является одним из крупнейших провайдеров облачной инфраструктуры в Китае, интегрировала технологию DeepSeek в свой мессенджер WeChat, благодаря чему её акции выросли. Чат-бот DeepSeek также широко используется государственными органами по всему Китаю, в том числе в Гонконге. Чтобы справиться с резкими перепадами нагрузки на сервисы, DeepSeek на этой неделе снизила цены на доступ к своему API в ночные часы. Стратегия DeepSeek, направленная на предложение решений с открытым исходным кодом и низкими ценами, вынудила другие ведущие китайские компании на рынке ИИ взимать с пользователей меньшую плату, отмечает Bloomberg. «Торрент для запуска ИИ»: вышла утилита для распределённого запуска ИИ-моделей на любом оборудовании
27.02.2025 [18:30],
Павел Котов
Большие языковые модели искусственного интеллекта требуют значительных ресурсов не только при обучении, но и при запуске — необходимы существенные объёмы оперативной памяти и мощные графические процессоры. Альтернативу предложили создатели Exo — бесплатной программы для распределённого запуска ИИ на нескольких устройствах. Почти как торренты, только для запуска ИИ. ![]() Источник изображения: github.com/exo-explore/exo Приложение позволяет объединять вычислительные ресурсы нескольких компьютеров, смартфонов и даже одноплатных компьютеров, в том числе Raspberry Pi, для запуска моделей, с которыми ни одна из имеющихся в распоряжении пользователя систем не справилась бы самостоятельно. Ресурсы устройств объединяются по одноранговой сети. Exo динамически распределяет нагрузку, создаваемую большой языковой моделью, по доступным в сети устройствам, размещая её слои, исходя из доступного объёма оперативной памяти и имеющейся вычислительной мощности. Поддерживаются LLaMA, Mistral, LlaVA, Qwen и DeepSeek. Программа устанавливается на устройства под управлением Linux, macOS, Android или iOS — версии под Windows пока нет. Для работы Exo требуется минимальная версия Python 3.12.0 и, в случае машин под Linux с графикой Nvidia, ряд других компонентов. Модель ИИ, требующую 16 Гбайт оперативной памяти, можно запустить на двух ноутбуках с 8 Гбайт на каждом; а мощную DeepSeek R1, которой нужны 1,3 Тбайт памяти, в теории можно запустить на кластере из 170 Raspberry Pi 5 с 8 Гбайт. Скорость сети и задержка могут снизить качество работы модели, и разработчики Exo предупреждают, что устройства небольшой производительности способны замедлить ИИ, но с каждым добавленным в сети устройством общая производительность увеличивается. Нельзя также забывать об угрозах безопасности, которые неизбежно возникают при совместном выполнении рабочих нагрузок на нескольких машинах. И даже с учётом этих оговорок Exo представляется перспективной альтернативой облачным ресурсам. Microsoft выпустила пару открытых эффективных ИИ-моделей Phi-4 — одну дообучили по новой методике
27.02.2025 [12:38],
Павел Котов
Microsoft расширила линейку собственных больших языковых моделей искусственного интеллекта Phi-4 двумя новыми проектами с относительно скромными системными требованиями. Одна из них является мультимодальной, то есть работает с несколькими форматами данных. ![]() Источник изображений: microsoft.com Модель Microsoft Phi-4-mini является исключительно текстовой, а Phi-4-multimodal — её улучшенная версия, способная обрабатывать также запросы в визуальном и звуковом форматах. Обе модели, утверждает разработчик, в значительной мере превосходят альтернативы сопоставимых размеров при выполнении определённых задач. Microsoft Phi-4-mini имеет 3,8 млрд параметров, то есть она достаточно компактна для запуска на мобильных устройствах. В основу модели легла особая версия архитектуры «Трансформер» (Transformer). В стандартном варианте модели-трансформеры, чтобы понять значение каждого слова, анализируют текст до и после него; при разработке Phi-4-mini в Microsoft использовали версию Decoder-Only Transformer, которая предполагает анализ только предшествующего слову текста, что снижает нагрузку на вычислительные ресурсы и повышает скорость обработки данных. Для дополнительной оптимизации использована технология Grouped Query Attention — этот механизм помогает модели определять, какие фрагменты данных наиболее релевантны при обработке текущей задачи. Phi-4-mini может генерировать текст, переводить документы и управлять внешними приложениями; модель, по словам разработчиков, преуспела в решении математических задач и написании компьютерного кода, даже когда требуются «сложные рассуждения». Точность ответов Phi-4-mini, по оценкам самой Microsoft, «значительно» превосходит результаты, которые дают несколько других моделей аналогичного размера. ![]() Phi-4-multimodal — это расширенная версия Phi-4-mini с 5,6 млрд параметров; в качестве запросов она воспринимает не только текст, но также изображения, аудио и видео. Для дообучения модели в Microsoft использовали новый метод Mixture of LoRAs. Обычно адаптация ИИ к новой задаче требует изменения его весов — параметров конфигурации, которые определяют, как он обрабатывает данные. Чтобы облегчить эту задачу, используется метод LoRA (Low-Rank Adaptation) — для выполнения незнакомой задачи модели добавляется небольшое количество новых весов, оптимизированных для этой задачи. Метод Mixture of LoRAs адаптирует этот механизм к мультимодальной обработке данных: при разработке Phi-4-multimodal исходную Phi-4-mini дополнили весами, оптимизированными для работы с аудио и видео. В результате, рассказали в Microsoft, удалось смягчить некоторые компромиссы, связанные в прочими подходами к построению мультимодальных моделей. В тестах, связанных с обработкой визуальных данных, Phi-4-multimodal набрала 72 балла, незначительно уступив ведущим моделям от OpenAI и Google. В одновременной обработке видео и звука она «с большим отрывом» обошла Google Gemini-2.0 Flash, а также открытую InternOmni. Phi-4-mini и Phi-4-multimodal доступны на платформе Hugging Face по лицензии MIT, которая допускает их коммерческое использование. Apple выпустила больше ИИ-совместимых ПК в прошлом году, чем все остальные производители вместе взятые
27.02.2025 [11:52],
Алексей Разин
Уже второй год подряд производители процессоров и ПК пытаются продвигать новые продукты, обеспечивающие возможность локального запуска функций искусственного интеллекта и их ускорение. Исследование Canalys показало, что в прошлом квартале доля подобных ПК в структуре поставок на мировом рынке выросла до 23 %. ![]() Источник изображения: Dell В абсолютном выражении количество таких ПК в прошлом квартале достигло 15,4 млн штук. К ним относились ноутбуки и настольные компьютеры, оснащённые центральными процессорами с нейронным блоком (NPU), позволяющим на аппаратном уровне ускорять работу функций искусственного интеллекта. Последовательно количество поставленных ПК такого класса в четвёртом квартале выросло на 18 %. ![]() Источник изображений: Canalys В целом по году ИИ-компьютеры заняли 17 % первичного рынка, причём лидером по их экспансии оказалась компания Apple, наделившая 54 % поставленных в прошлом году ПК всех марок соответствующими аппаратными функциями. Lenovo и HP Inc. заметно отстали, но поделили между собой второе место с долей по 12 % соответственно. По прогнозам Canalys, в текущем году именно завершение поддержки Windows 10 станет главным фактором, побуждающим клиентов покупать новые ПК. Серьёзным вызовом для мирового рынка могут стать и таможенные пошлины в США, которые грозится повысить президент Дональд Трамп (Donald Trump). ![]() Поставщики центральных процессоров распределили свои маркетинговые усилия по различным ценовым сегментам. Intel старается играть в верхнем диапазоне с процессорами семейства Lunar Lake, тогда как AMD старается занимать позиции в премиум-сегменте и среднем ценовом диапазоне. Один из пионеров рынка в лице Qualcomm после дебюта в верхней ценовой категории теперь пытается освоить и ценовые сегменты в районе $600 за весь ноутбук. Даже Apple в какой-то мере демократизирует свою профильную продукцию, предлагая ноутбуки ранних поколений со скидками, и они пользуются хорошим спросом в странах с не очень развитой экономикой. ![]() Почти треть участников торговой цепочки на рынке ПК считает, что в текущем году основным локомотивом продаж станет конец цикла технической поддержки Windows 10. Конечные клиенты, как ожидается, особенно активно будут обновлять свои парки компьютеров во втором полугодии. Само по себе обновление аппаратных или программных возможностей ПК при принятии решений о покупке отходит на второй план сильнее, чем это было в прошлом году. Если учитывать только ПК под управлением Windows, то среди них ИИ-совместимые модели по итогам четвёртого квартала составили 26 %, а в общей массе Windows-ПК они формировали 15 % продаж. Продукция Apple заняла по итогам квартала 10,2 % всего рынка ПК, причём 45 % поставленных компанией систем были готовы к аппаратному ускорению ИИ. На втором месте оказалась Lenovo с долей 15 %, хотя в сегменте ПК в целом она занимает первое место и 25 % рынка. Следом идёт HP Inc. с долей 14 % среди ПК с функциями ИИ, Dell на третьем месте отстаёт сильнее с 9 % рынка. Показателен пример Huawei, которая среди ПК с ускорением ИИ занимает 3 % рынка, тогда как её доля на рынке ПК в целом не превышает 2 %. Подобный перекос среди восьми крупнейших игроков рынка заметен только у Apple и Microsoft. Последняя смогла добиться 2-процентной доли в ИИ-сегменте, но на рынке ПК в целом довольствуется 0,4 %. Nvidia отчиталась о рухнувших продажах GeForce, но «удивительный» спрос на ИИ-чипы поднял прибыль на 80 %
27.02.2025 [07:29],
Алексей Разин
Многие инвесторы ждали квартальной отчётности Nvidia с некоторой тревогой, поскольку к традиционному тезису о неизбежности снижения спроса на ускорители вычислений добавлялся фактор DeepSeek, теоретически работающий в том же направлении. В действительности же выручка Nvidia в прошлом квартале превзошла ожидания рынка, равно как и прогноз на текущий квартал. ![]() Источник изображений: Nvidia Хронологическая обособленность отчётного мероприятия Nvidia обусловлена тем, что в календаре компании четвёртый квартал 2025 фискального года завершился только 26 января текущего года. Более оптимистичная отчётность компании по сравнению с ожиданиями инвесторов не вызвала роста курсовой стоимости акций после закрытия торгов. Напротив, она снизилась на полтора процента, поскольку инвесторы поняли, что темпы роста выручки компании снижаются по сравнению с первыми двумя годами ИИ-бума. Квартальная выручка Nvidia увеличилась в годовом сравнении на 78,8 % до $39,33 млрд, что выше ожидавшихся $38,05 млрд. Удельный доход на одну акцию достиг $0,89, что также выше прогнозной величины в $0,84. В текущем квартале компания рассчитывает выручить $43 млрд против ожидаемых инвесторами $41,78 млрд, данная величина будет соответствовать годовому росту на 65 %. Если учесть, что год назад подобный прирост достигал 262 %, это могло стать некоторым разочарованием для инвесторов. Судя по заявлениям представителей Nvidia, проблемы с выпуском ускорителей Blackwell, которые наблюдались на старте, удалось решить, и в прошедшем квартале поставки данной продукции принесли компании $11 млрд выручки. Об их экспансии можно говорить, как о самой быстрой в истории компании, по словам финансового директора Колетт Кресс (Colette Kress). Больше всего ускорители Blackwell покупались провайдерами облачных услуг, клиенты такого класса обеспечили половину всей выручки серверного подразделения Nvidia. В целом, направление центров обработки данных увеличило выручку Nvidia на 93 % до $35,6 млрд, что также превышает прогнозы инвесторов. Непосредственно поставки вычислительных средств в серверном сегменте увеличили выручку на 116 % до $32,6 млрд, а вот сетевые решения сократили её на 9 % до $3 млрд. Тем не менее, руководство Nvidia с гордостью отметило, что компоненты сетевой инфраструктуры проекта Stargate в США будут поставляться именно этой компанией. Рост выручки от поставок вычислительных решений для ЦОД в прошлом квартале был обусловлен не только высоким спросом на ускорители Blackwell, но и последовательным ростом спроса на ускорители H200 поколения Hopper. Направление ЦОД обеспечивает до 91 % всей выручки Nvidia, за два предыдущих года его выручка увеличилась примерно в десять раз. ![]() Чистая прибыль Nvidia в прошлом квартале выросла на 80 % до $22,1 млрд. Норма прибыли сократилась с 76 до 73 %, но в компании объясняют это ростом затрат на экспансию ускорителей Blackwell, одновременно рассчитывая на улучшение прибыльности во втором полугодии. В прошлом же квартале операционные расходы выросли на 48 % до $4,7 млрд. Операционная прибыль при этом выросла на 77 % до $24 млрд. Если в сфере вычислений и сетевых решений выручка Nvidia по итогам четвёртого квартала увеличилась на 101 % до $36 млрд, то поставки графических решений сократили профильную выручку на 22 % до $3,3 млрд. В игровом сегменте выручка компании упала на 11 % в годовом сравнении, и на 22 % последовательно, до $2,54 млрд. Финансовый директор компании подобную динамику объяснила дефицитом графических процессоров как поколения Blackwell, так и семейства Ada Lovelace. По итогам 2025 фискального года в целом игровая выручка выросла на 9 % до $11,35 млрд, во многом за счёт популярности видеокарт семейства GeForce RTX 40-й серии. По итогам всего фискального года выручка Nvidia выросла на 114 % до $130,5 млрд, операционная прибыль выросла на 147 % до $81,5 млрд, чистая прибыль увеличилась на 145 % до $72,9 млрд, а норма прибыли поднялась с 72,7 до 75 %. По сути, замедление темпов роста финансовых показателей по итогам четвёртого квартала в отдельности и вызвало обеспокоенность отдельных инвесторов. В текущем календарном году выручка Nvidia должна заметно увеличиться, как заявил генеральный директор. ![]() Руководство компании предсказуемо делало эмоциональные заявления, которые были направлены на переубеждение скептиков. Генеральный директор и основатель Nvidia Дженсен Хуанг (Jensen Huang) назвал спрос на Blackwell «удивительным». Финансовый директор компании добавила, что «языковые модели с рассуждением требуют в 100 раз больше вычислительных ресурсов». Хуанг присоединился в своих выражениях к этому тезису, традиционно усилив его прогнозом о предстоящем появлении ИИ-алгоритмов нового поколения, которые потребуют «в миллионы раз бόльших вычислительных ресурсов». Уже сейчас, по его словам, основная часть вычислительных нагрузок на инфраструктуру ИИ подразумевает функцию рассуждения. Угрозу со стороны разрабатываемых облачными провайдерами собственных ускорителей глава Nvidia игнорирует. Как он убеждён, существование подобных чипов ещё не означает, что они в массовом порядке применяются. По поводу влияния DeepSeek глава Nvidia повторился, что распространение подобных более эффективных моделей будет лишь способствовать увеличению спроса на ускорители вычислений. Прорыв DeepSeek он назвал «превосходной инновацией». Оценить потенциальное влияние таможенных тарифов США на бизнес Nvidia он не взялся. «ИИ продвигается вперёд со скоростью света», — подытожил свою оценку текущего состояния рынка Дженсен Хуанг. «Интернет погрузится во тьму»: новомодные ИИ-агенты имеют шансы заменить привычный интернет
26.02.2025 [19:34],
Владимир Мироненко
Некоторые аналитики назвали 2025-й годом агентов ИИ — персонализированных цифровых помощников, которые могут взаимодействовать с пользователями, проводить исследования, собирать информацию, курировать контент и т.д. Как утверждают аналитики Bernstein, «если агенты ИИ действительно станут полезными, интернет погрузится во тьму». ![]() Источник изображения: Growtika/unsplash.com Веб-сайты и приложения не исчезнут, но потребители перестанут посещать их напрямую, поскольку будут получать доступ к информации, контенту и виджетам через помощника ИИ, который станет «агрегатором агрегаторов», говорят аналитики. Если агент ИИ сможет, например, вызвать такси, пользователям не понадобится открывать приложение для заказа поездки, утверждают они. Агенты ИИ, представляющие пользователей, станут новым прямым каналом, который технологические компании будут использовать для связи с потребителями. Все остальные поставщики будут направляться через этот новый цифровой шлюз и, вероятно, должны будут платить какой-то сбор — так же, как Google зарабатывает на поисковой рекламе, а Apple — на комиссиях в App Store, пишет Business Insider. Крупные технологические компании и стартапы уже сейчас сражаются за контроль над этим перспективным сегментом ИИ-рынка. В конце января OpenAI представила ИИ-агента Operator, который использует веб-браузер для выполнения действий от имени пользователей, например бронирования билетов или покупки продуктов. Ключевой момент заключается в том, что теперь взаимодействие идёт напрямую между ИИ-агентом и пользователем, тогда как раньше приходилось прибегать к поиску Google. В будущем Google может стать всего лишь одним из многих сервисов, доступных в экосистеме агентов ИИ, которую разрабатывает OpenAI. Разумеется, Google не намерен превращаться в ещё одно приложение на платформе конкурентов. В декабре прошлого года компания представила Project Mariner — ИИ-агента, способного выполнять действия в интернете от лица пользователя: просматривать веб-страницы, нажимать кнопки и заполнять формы. А ещё раньше, в октябре, Anthropic представила похожий инструмент в тестовом режиме, позволяющий её модели ИИ Claude 3.5 Sonnet взаимодействовать с любыми десктопными приложениями, имитируя нажатия клавиш, клики и жесты мыши — то есть управлять ПК так же, как это делают люди. Также агентами ИИ можно будет управлять голосом, например с помощью умных очков от Meta✴, или даже мысленно — используя мозговые импланты, такие как Neuralink Илона Маска (Elon Musk). Данные тысяч ставших частными репозиториев GitHub всё ещё доступны в Copilot, выяснили исследователи
26.02.2025 [18:08],
Владимир Мироненко
Согласно исследованию израильской компании по кибербезопасности Lasso, специализирующейся на возникающих угрозах генеративного ИИ, данные, которые были в открытом доступе в интернете хотя бы на мгновение, могут ещё продолжительное время оставаться у онлайн-чат-ботов генеративного ИИ, таких как Microsoft Copilot, после того, как доступ к ним был закрыт. ![]() Источник изображения: Windows/unsplash.com Эта проблема касается тысяч некогда открытых репозиториев GitHub ряда крупнейших компаний, включая Microsoft, которые с тех пор стали закрытыми, сообщили в Lasso ресурсу TechCrunch. По словам соучредителя Lasso Офира Дрора (Ophir Dror), компания обнаружила, что контент из её собственного репозитория GitHub появился в Copilot, поскольку он был проиндексирован и кеширован поисковой системой Bing от Microsoft. Этот репозиторий был ошибке открыт в течение короткого периода времени и сейчас является частным. При попытке получить к нему доступ на GitHub появляется сообщение «Страница не найдена». «На Copilot, как ни странно, мы нашли один из наших собственных закрытых репозиториев, — рассказал Дрор. — Если бы я просматривал веб-страницы, я бы не увидел этих данных. Но любой человек, задав Copilot правильный вопрос, может их получить». В связи с этим Lasso провела расследование, в ходе которого извлекла список репозиториев, бывших в открытом доступе какое-то время в 2024 году, и определила те, которые с тех пор были удалены или получили статус приватных. Используя механизм кеширования Bing, компания обнаружила, что более 20 тыс. частных репозиториев GitHub более 16 тыс. организаций по-прежнему доступны через Copilot. В частности, это касается Amazon Web Services, Google, IBM, PayPal, Tencent и Microsoft. Дрор рассказал, что Lasso связалась со всеми компаниями, которые «серьёзно пострадали» от утечки данных, и посоветовала им ротировать или отозвать все скомпрометированные ключи. Lasso уведомила Microsoft о своих выводах в ноябре 2024 года, но софтверный гигант сообщил ей, что относит проблему к «низкой степени серьезности», заявив, что такое поведение при кешировании «приемлемо». Microsoft отметила, что больше не включает ссылки на кеш Bing в результаты поиска с декабря 2024 года. Тем не менее Lasso утверждает, что, хотя функция кеширования была отключена, Copilot всё ещё имеет доступ к данным, несмотря на то, что они не отражались в результатах веб-поиска. Meta✴ задумала построить ИИ-суперкомпьютер за $200 млрд, но это не точно
26.02.2025 [17:04],
Павел Котов
Meta✴ обсуждает строительство нового кампуса при центре обработки данных, где будут разрабатываться проекты в области искусственного интеллекта. Стоимость объекта оценивается в $200 млрд, передаёт The Information со ссылкой на собственные источники. ![]() Источник изображения: Alex wong / unsplash.com Руководство Meta✴ сообщило компаниям, которые проектируют и возводят ЦОД, что рассматривает возможность построить кампус в штате Луизиана, Вайоминг или Техас. В феврале члены высшего руководства гиганта соцсетей посетили площадки, где может появиться комплекс объектов. В 2022 году OpenAI при поддержке Microsoft запустила сервис ChatGPT, чем спровоцировала резкий рост инвестиций в ИИ по всему миру — сегодня развернуть свои системы ИИ стремятся компании из самых разных отраслей. Официальный представитель Meta✴ отверг сведения о планах компании. Он заявил, что Meta✴ уже раскрыла планы по развитию направления ЦОД, и всё выходящее за эти рамки, по его словам, является «чистой спекуляцией». В январе глава компании Марк Цукерберг (Mark Zuckerberg) заявил, что в этом году компания потратит на расширение связанной с ИИ инфраструктуры $65 млрд. Для сравнения, Microsoft в 2025 финансовом году вложит в развитие ЦОД $80 млрд; Amazon в 2025 году намеревается потратить на эти цели больше, чем $75 млрд, которые, по оценкам, потребовались в 2024 году. «Всего несколько десятков миллионов долларов»: Anthropic обучила рассуждающий ИИ в разы дешевле конкурентов
26.02.2025 [17:03],
Павел Котов
Обучение новейшей флагманской модели искусственного интеллекта Claude 3.7 Sonnet обошлось разработавшей её компании Anthropic всего лишь в «несколько десятков миллионов долларов» и потребовало менее 1014 Тфлопс вычислительной мощности. ![]() Источник изображения: anthropic.com Об этом рассказал профессор Уортонской школы бизнеса (США) Итан Моллик (Ethan Mollick), который процитировал разъяснение, данное отделом по связям с общественностью Anthropic. «Со мной связались представители Anthropic и сказали, что Sonnet 3.7 не следует рассматривать как модель на 1026 Флопс, и стоила она всего несколько десятков миллионов долларов», — сообщил учёный, добавив, что «будущие модели окажутся намного крупнее». Если допустить, что обучение Anthropic Claude 3.7 Sonnet действительно стоило компании «всего несколько десятков миллионов долларов» без сопутствующих расходов, то стоимость разработки систем действительно начинает снижаться. Обучение её вышедшей в минувшем году предшественницы — модели среднего размера Claude 3.5 Sonnet — обошлось в схожую сумму, рассказал гендиректор Anthropic Дарио Амодеи (Dario Amodei). Для сравнения, у OpenAI на разработку GPT-4 ушли $100 млн, а Google потратила на обучение Gemini Ultra, по оценкам, около $200 млн. Долгосрочного снижения стоимости на обучение ИИ господин Амодеи, однако, не ожидает — они будут обходиться уже в миллиарды долларов, и это если не считать расходов на тестирование безопасности и фундаментальные исследования. Сейчас в обращение входят «рассуждающие» модели, которые дольше отвечают за запросы, а значит, ИИ будет требовать всё больше вычислительных ресурсов. DeepSeek запустила дешёвые ночные тарифы на доступ к ИИ-моделям
26.02.2025 [15:32],
Алексей Разин
Взрывной рост интереса к любой облачной системе становится серьёзной нагрузкой для инфраструктуры, и китайская компания DeepSeek взяла на вооружение маркетинговые инструменты для более равномерного управления нагрузкой. Со среды доступ к модели DeepSeek V3 для разработчиков будет в два раза дешевле в период с 00:30 до 8:30 по пекинскому времени. ![]() Источник изображения: Unsplash, Solen Feyissa Модель R1, которая лежит в основе популярного чат-бота DeepSeek, станет в указанное время дешевле для использования разработчиками через программный интерфейс на 75 %. В самом Китае сервисы DeepSeek стали весьма популярны, включая даже конкурирующих разработчиков ИИ-систем типа Tencent Holdings и Perplexity AI. Государственные учреждения охотно пользуются сервисами DeepSeek, поскольку передавать данные для обработки за пределы страны китайским служащим запрещает местное законодательство. Уместно будет напомнить, что использовать DeepSeek правительства отдельных стран типа Италии и Южной Кореи своим чиновникам тоже запретили. DeepSeek была вынуждена предупреждать клиентов, что у них могут возникать проблемы с доступом к её сервисам в дневное время. Снижение стоимости ночного доступа должно способствовать более равномерному распределению нагрузки. Зарубежным клиентам DeepSeek, проживающим в более удалённых от Пекина часовых поясах, подобные изменения могут быть даже более полезны, чем китайским. Alibaba снова ударила по OpenAI — вышел бесплатный ИИ-генератор реалистичных видео Wan 2.1
26.02.2025 [13:25],
Павел Котов
Китайский гигант в области электронной коммерции Alibaba сделал общедоступной разработанную им модель искусственного интеллекта для создания видео и статических изображений Wan 2.1. Этим шагом компания создала условия для её массового развёртывания и способствовала усилению конкуренции в области ИИ. ![]() Источник изображения: Alibaba Публикация ИИ-моделей с открытым исходным кодом — распространённый шаг в отрасли ИИ; одним из наиболее заметных игроков здесь стал стартап DeepSeek. Alibaba выпустила четыре варианта Wan 2.1: T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P — эти модели генерируют видео и статические картинки по текстовому запросу или по образцу, которым может служить изображение. Обозначения «1.3B» и «14B» указывают, что эти варианты содержат соответственно 1,3 млрд и 14 млрд параметров. Младшей модели T2V-1.3B для работы требуется всего 8,19 Гбайт видеопамяти, что делает её совместимой со многими потребительскими видеокартами. Разработчики заявляют, что эта модель может сгенерировать пятисекундный ролик в 480р на GeForce RTX 4090 примерно за 4 минуты (без оптимизаций). Модели доступны для пользователей по всему миру на платформах HuggingFace и ModelScope (входит в Alibaba Cloud) для академических, исследовательских и коммерческих целей. Последнюю версию модели ИИ для генерации видео Alibaba представила в январе — первоначально она называлась Wanx, впоследствии её переименовали в Wan. Проект получил высокую оценку в тестах Vbench, предназначенных для генераторов видео — в частности, она стала лидером по критерию взаимодействия объектов. Накануне Alibaba также выпустила предварительный вариант рассуждающей модели QwQ-Max, которая впоследствии также будет опубликована как проект с открытым кодом. В ближайшие три года компания намеревается вложить не менее 380 млрд юаней ($52 млрд) в поддержку облачных вычислений и инфраструктуры ИИ. ИИ начал стримить в Twitch, как играет в Pokémon Red
26.02.2025 [11:32],
Владимир Фетисов
Anthropic запустила на Twitch проект Claude Plays Pokémon, в рамках которого новейший ИИ-бот компании Claude 3.7 Sonnet играет в игру Pokémon Red. Этот проект стал своего рода экспериментом, который должен продемонстрировать возможности современных технологий на базе искусственного интеллекта и реакцию людей на них. ![]() Источник изображения: Twitch Исследователи не раз проверяли возможности ИИ-алгоритмов в разных играх, от Street Fighter до Pictionary, но обычно это делалось больше для развлечения, чем для извлечения какой-то пользы. В это же время Anthropic заявила, что Pokémon Red оказалась своего рода бенчмарком для Claude 3.7 Sonnet, который способен эффективно «думать» над содержащимися в игре головоломками. Алгоритм Claude 3.7 Sonnet, как и аналоги конкурентов, такие как OpenAI o3-mini и DeepSeek R1, может «рассуждать», преодолевая сложные задачи, например, во время игры в детские видеоигры. Предыдущая версия алгоритма Claude 3.5 Sonnet, не умеющая «рассуждать», потерпела неудачу в самом начале Pokémon Red. В отличие от этого, новый Claude 3.7 Sonnet сумел продвинуться значительно дальше. ![]() Источник изображения: Twitch Однако и этот алгоритм сталкивается с трудностями. Через несколько часов после начала стрима на Twitch Claude упёрся в каменную стену, преодолеть которую не мог, несмотря на все старания. Один из пользователей платформы даже задался вопросом: «Кто победит: ИИ, на программирование которого были потрачены тысячи часов, или 1 стена?». В конечном счёте Claude всё же понял, что может обойти стену. С одной стороны, мучительно скучно наблюдать, как Claude неспешно преодолевает Pokémon Red, тщательно обдумывая каждый шаг. Но в это же время процесс игры странным образом захватывает. В левой части экрана демонстрируется «мыслительный процесс» бота, а справа — сама игра. ![]() Источник изображения: Anthropic Для старых пользователей Twitch формат стрима Anthropic может показаться ностальгическим. Более десяти лет назад миллионы людей одновременно пытались играть в Pokémon Red в первом в своём роде социальном онлайн-эксперименте под названием Twitch Plays Pokémon. Каждый пользователь мог управлять персонажем игры через чат Twitch, что предсказуемо привело к полному хаосу в игре. Однако в 2025 году пользователи платформы превратились в зрителей, которые наблюдают за тем, как ИИ-алгоритм пытается играть в игру, с которой многие справлялись в возрасте пяти лет. ИИ-агент OpenAI для написания рефератов стал доступен всем платным пользователям ChatGPT
26.02.2025 [10:32],
Павел Котов
Компания OpenAI накануне объявила, что инструмент Deep Research — ИИ-агент для комплексного сбора и анализа информации с помощью ChatGPT и интернет-поиска — теперь доступен для пользователей всех платных тарифов ChatGPT. ![]() Источник изображения: Mariia Shalabaieva / unsplash.com Вместо короткого ответа на вопрос Deep Research выдаёт подробную и структурированную информацию, собранную из нескольких источников с полными ссылками и объяснением логики рассуждений. Сбор и систематизация информации занимает от 5 до 30 минут. Deep Research базируется на специальной версии рассуждающей модели OpenAI o3, обученной по методике Reinforcement Learning (обучения с подкреплением), которая совмещена с поиском в интернете. Подписчики тарифных планов ChatGPT Plus, Team, Enterprise и Edu могут задавать десять исследовательских запросов в месяц. Ранее услуга OpenAI Deep Research была доступна только пользователям ChatGPT Pro, которые платят по $200 в месяц — на момент выхода ИИ-агента они могли создавать 100 запросов в месяц, теперь это количество увеличено до 120. Инструменты для проведения глубокого исследования в веб-поиске уже предложили конкуренты OpenAI — Google и Perplexity — эти сервисы имеют то же название и также генерируют длинные отчёты, но доступны они для более широкого круга пользователей. На минувшей неделе Google открыла исследовательский ИИ-агент для всех пользователей Gemini Advanced — оформить эту подписку можно за $19,99 в месяц, как и ChatGPT Plus. Технологические компании рассчитывают, что инструменты глубокого исследования окажутся для потребителей стимулом оформлять дорогие подписки на системы ИИ. В OpenAI, однако, уже решили изучить вопрос, какую угрозу Deep Research может представлять для общественности, если инструментом станут злоупотреблять для распространения дезинформации. Microsoft сняла ограничения на болтовню с Copilot и ИИ-рассуждения для бесплатных пользователей
25.02.2025 [22:00],
Андрей Созинов
В прошлом месяце Microsoft сделала ИИ-модель OpenAI o1 со способностью к рассуждению бесплатной для всех пользователей Copilot. Однако для бесплатных пользователей имелись ограничения на количество сообщений. Теперь эти ограничения в функции Think Deeper сняты, равно как и временны́е ограничения на голосовое общение с Copilot через функцию Voice in Copilot. ![]() Источник изображения: Microsoft «Мы прилагаем все усилия, чтобы как можно быстрее предоставить неограниченный доступ к расширенным функциям как можно большему числу людей, начиная с Voice и Think Deeper, — говорит команда Copilot. — Стоит отметить, что вы можете столкнуться с задержками или перебоями в работе в периоды высокого спроса или в случае обнаружения проблем с безопасностью, неправильного использования или других нарушений "Условий использования Copilot"». Неограниченное использование Copilot Voice и Think Deeper появилось спустя два года после того, как Microsoft впервые запустила Copilot в поисковой системе Bing, и всего через месяц после того, как компания изменила подписку Copilot Pro, включив в неё ИИ-функции Office AI в Microsoft 365. Microsoft продолжает предлагать пользователям подписку Copilot Pro за $20 в месяц. Компания обещает, что платные пользователи «сохранят привилегированный доступ к нашим новейшим моделям во время пиковых нагрузок, ранний доступ к экспериментальным функциям искусственного интеллекта, а также дополнительное использование Copilot в избранных приложениях Microsoft 365, таких как Word, Excel и PowerPoint». Компания отметила, что «в ближайшее время» расскажет об упомянутых экспериментальных функциях, к которым платные подписчики получат ранний доступ. Весьма вероятно, что речь об GPT-4.5 — недавно инсайдер из Microsoft намекнул, что выход новой продвинутой модели состоится уже на этой неделе. Да и выход GPT-5 не за горами. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |