Сегодня 14 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → мали

Microsoft представила три новые малые ИИ-модели семейства Phi-4

Microsoft выпустила три новые малые языковые модели (SLM) с открытой лицензией: Phi-4-mini-reasoning, Phi-4-reasoning и Phi-4-reasoning-plus. Каждая из моделей относится к классу рассуждающих (reasoning) моделей, ориентированных на логическую верификацию решений и тщательную проработку сложных задач. Эти ИИ-модели стали продолжением инициативы Microsoft по разработке компактных ИИ-систем — семейства Phi, впервые представленного год назад как фундамент для приложений, работающих на устройствах с ограниченными вычислительными возможностями.

 Источник изображения: Jackson Sophat / Unsplash

Источник изображения: Jackson Sophat / Unsplash

Наиболее производительной из представленных является ИИ-модель Phi-4-reasoning-plus. Она представляет собой адаптацию ранее выпущенной Phi-4 под задачи логического вывода. По утверждению Microsoft, её качество ответов близко к DeepSeek R1, несмотря на существенную разницу в объёме параметров: у DeepSeek R1 — 671 млрд, тогда как у Phi-4-reasoning-plus их значительно меньше. Согласно внутреннему тестированию Microsoft, эта модель показала результаты, соответствующие ИИ-модели OpenAI o3-mini в рамках бенчмарка OmniMath, оценивающего математические способности ИИ.

 Модели Phi-4-reasoning и Phi-4-reasoning-plus (14 млрд параметров) демонстрируют превосходство над базовой Phi-4 и уверенно конкурируют с более крупными системами, включая DeepSeek-R1 Distill (70 млрд параметров) и OpenAI o3-mini, в задачах математического и логического мышления (AIME, HMMT, OmniMath, GPQA). Источник изображения: Microsoft

Модели Phi-4-reasoning и Phi-4-reasoning-plus (14 млрд параметров) демонстрируют превосходство над базовой Phi-4 и уверенно конкурируют с более крупными системами, включая DeepSeek-R1 Distill (70 млрд параметров) и OpenAI o3-mini, в задачах математического и логического мышления (AIME, HMMT, OmniMath, GPQA). Источник изображения: Microsoft

Модель Phi-4-reasoning содержит 14 млрд параметров и обучалась на основе «качественных» данных из интернета, а также на отобранных демонстрационных примерах из o3-mini. Она оптимизирована для задач в области математики, естественных наук и программирования. Таким образом, Phi-4 reasoning ориентирована на высокоточные вычисления и аналитическую интерпретацию данных, оставаясь при этом относительно компактной и доступной для использования на локальных вычислительных платформах.

 На универсальных тестах, включая FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen и PhiBench, модели Phi-4-reasoning-plus демонстрируют точность, сопоставимую с GPT-4o и o3-mini, несмотря на меньший объём параметров (14 млрд параметров), особенно в задачах программирования, логики и безопасности. Источник изображения: Microsoft

На универсальных тестах, включая FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen и PhiBench, модели Phi-4-reasoning-plus демонстрируют точность, сопоставимую с GPT-4o и o3-mini, несмотря на меньший объём параметров (14 млрд параметров), особенно в задачах программирования, логики и безопасности. Источник изображения: Microsoft

Phi-4-mini-reasoning — самая малогабаритная из представленных SLM. Её размер составляет около 3,8 млрд параметров. Она обучалась на основе приблизительно 1 млн синтетических математических задач, сгенерированных ИИ-моделью R1 китайского стартапа DeepSeek. Microsoft позиционирует её как ИИ-модель для образовательных сценариев, включая «встроенное обучение» на маломощных и мобильных устройствах. Благодаря компактности и точности, эта ИИ-модель может применяться в интерактивных обучающих системах, где приоритетом являются скорость отклика и ограниченность вычислительных ресурсов.

 Phi-4-mini-reasoning (3,8 млрд параметров) значительно превосходит свою базовую версию и модели с вдвое большим размером на бенчмарках AIME 24, MATH-500 и GPQA Diamond, а также сопоставима или превосходит OpenAI o1-mini по точности генерации длинных математических ответов. Источник изображения: Microsoft

Phi-4-mini-reasoning (3,8 млрд параметров) значительно превосходит свою базовую версию и модели с вдвое большим размером на бенчмарках AIME 24, MATH-500 и GPQA Diamond, а также сопоставима или превосходит OpenAI o1-mini по точности генерации длинных математических ответов. Источник изображения: Microsoft

Все три ИИ-модели доступны на платформе Hugging Face и распространяются под открытой лицензией. По словам Microsoft, при их обучении использовались дистилляция, обучение с подкреплением и высококачественные обучающие данные. Эти методы позволили сбалансировать размер SLM и их вычислительную производительность. ИИ-модели достаточно компактны, чтобы использоваться в средах с низкой задержкой, но при этом способны решать задачи, требующие строгости логического построения и достоверности результата. Ранее такие задачи были характерны лишь для гораздо более крупных ИИ.

Новая статья: Обзор системы резервного копирования и восстановления данных «Кибер Бэкап Малый Бизнес»

Данные берутся из публикации Обзор системы резервного копирования и восстановления данных «Кибер Бэкап Малый Бизнес»

Rolls-Royce прогнала данные об аварии на АЭС «Фукусима» через квантовый компьютер, чтобы сделать малые реакторы безопасными

Компания Rolls-Royce обратилась к квантовым вычислениям, чтобы узнать о подходах для обеспечения безопасной эксплуатации малых ядерных реакторов на удалённых площадках. В будущем ожидается создание множества компактных ядерных силовых установок для добывающих компаний на Земле и в космосе. Все они будут работать под дистанционным наблюдением с локальной автоматикой, для создания надёжных алгоритмов которой привлекаются квантовые компьютеры.

 Источник изображения: ИИ-генерация Кандинский 3.0/3DNews

Источник изображения: ИИ-генерация Кандинский 3.0/3DNews

В Великобритании с лета 2023 года запущена программа раннего доступа к квантовым технологиям (QTAP). Квантовые алгоритмы запускаются на фотонном оборудовании компании Orca Computing с привлечением безошибочных методологий компании Riverlane. Наряду с Rolls-Royce к программе QTAP получили доступ или ждут своей очереди компании Arup, Airbus и порт Дувра. Доступ к программе осуществляется через посредничество национальной программы Digital Catapult, призванной обеспечить промышленности Великобритании доступность квантовых вычислений.

Компания Rolls-Royce прогнала через квантовый вычислитель данные об аварии на АЭС «Фукусима». Она изучала возможность использования модели квантового машинного обучения для быстрого выявления потенциально опасных ситуаций. Это позволило бы реактору безопасно работать и при необходимости останавливаться с минимальным участием человека. О результатах проведенного эксперимента не сообщается. Возможно, понадобятся новые сеансы расчётов.

Джонатон Адамс (Jonathon Adams), помощник главного инженера Rolls-Royce, сказал: «Новая ядерная команда Rolls-Royce очень ориентирована на будущее, стремясь разрабатывать новые революционные технологии и исследовать энергоэффективные приложения для ядерной энергетики на Земле и в космосе. Квантовые технологии, включая квантовые вычисления, будут способствовать этому в течение следующих 15 лет. Важно, чтобы мы развили понимание того, как и когда мы сможем внедрить эту технологию».

Миллионы конфиденциальных электронных писем военных США уже 10 лет отправляются в Мали из-за опечатки

На протяжении последних 10 лет миллионы электронных писем, связанных с вооружёнными силами США, отправляются в западноафриканскую страну Мали из-за опечатки в адресе. Вместо того, чтобы добавлять военный домен .mil к адресу электронной почты получателя, отправители часто по ошибке вводят .ml — идентификатор страны Мали.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Йоханнес Зуурбир (Johannes Zuurbier), голландский предприниматель, управляющий доменом Мали, наблюдает эту проблему почти десять лет, несмотря на его неоднократные попытки предупредить правительство США. Он настроил систему для обнаружения и перехвата электронных писем на несуществующие домены, такие как army.ml и navy.ml. Только с января этого года было зафиксировано 117 000 отправленных по ошибке писем, в некоторых из них обнаруживается чувствительная конфиденциальная информация, связанная с вооружёнными силами США.

Сообщения содержат медицинские записи, информацию о документах, удостоверяющих личность, списки персонала на военных базах, фотографии военных баз, отчёты о военно-морских инспекциях, списки экипажей кораблей, налоговые отчёты и многое другое. Среди авторов — военнослужащие, члены их семей, туристические агенты, работающие с вооружёнными силами США и американской разведкой, и частные подрядчики.

Например, электронное письмо от начала этого года полностью раскрывало маршрут поездки начальника штаба армии США во время его визита в Индонезию. В нём содержались полный список номеров комнат, предназначенных для делегации, и подробности по получению ключей от них в отеле Grand Hyatt Jakarta.

В понедельник 10-летний контракт Йоханнеса на управление доменом Мали истекает и перехват подобных писем станет невозможен, то есть к ним получат доступ власти Мали. «Министерство обороны знает о проблеме и серьёзно относится ко всем несанкционированным раскрытиям контролируемой информации национальной безопасности или контролируемой несекретной информации», — заявил Тим Горман (Tim Gorman), представитель канцелярии министра обороны.

Горман сообщил, что электронные письма, отправленные в Мали с домена .mil, блокируются и отправитель уведомляется о том, что он должен проверить адреса электронной почты предполагаемых получателей. Правда, это не мешает другим правительственным учреждениям или тем, кто работает с правительством США, по-прежнему ошибочно отправлять электронные письма на малийские адреса.


window-new
Soft
Hard
Тренды 🔥
«Достойна получить ремастер»: бывший технический директор Rockstar прокомментировал слухи о переиздании GTA IV 25 мин.
Улучшенная графика, бесшовный мир и быстрые загрузки: Nintendo показала сравнение Hogwarts Legacy на Switch и Switch 2 2 ч.
GSC анонсировала улучшенный сборник S.T.A.L.K.E.R. Legends of the Zone Trilogy для ПК и консолей — дата выхода, бесплатный апгрейд и системные требования 3 ч.
«Яндекс Маркет» внедрил ИИ для превентивного выявления мошенничества 4 ч.
«Нас разорили»: сайты сравнения цен потребовали от Google компенсации на €12 млрд 4 ч.
Слухи: хакер украл данные 89 миллионов пользователей Steam и выставил их на продажу 4 ч.
Apple представила ИИ, который создаёт 3D-объекты и сцены всего из трёх фото 7 ч.
В Android появится режим усиленной защиты от взлома и перехвата звонков 8 ч.
Monster Hunter Wilds помогла Capcom достичь рекордных результатов восьмой год подряд 9 ч.
«У них уже закончились идеи»: ветеран Infinity Ward сравнил Call of Duty с «Симпсонами» 10 ч.
AMD прозрачно намекнула на анонс Radeon RX 9060 XT через неделю 6 мин.
LG показала растягивающиеся, скручивающиеся и прозрачные дисплеи для автомобилей 28 мин.
MediaTek представила платформу Dimensity 9400e для доступных флагманов — она очень похожа на Dimensity 9300+ 34 мин.
LG показала первый по-настоящему безрамочный 22-дюймовый монитор Zero Bezel Micro LED 2 ч.
Экс-главу китайского производителя чипов приговорили к смертной казни за коррупцию и хищение 3 ч.
$2849 за идеальный сон: Eight Sleep представила умную постель, которая борется с храпом и регулирует температуру 3 ч.
LG показала свои лучшие OLED-дисплеи и мониторы на их основе 3 ч.
Представлены умные часы Amazfit Balance 2 с 1,5-дюймовым AMOLED-дисплеем и 21-дневной автономностью 3 ч.
Смарт-кольцо «Сбера» должно было выйти в начале года — теперь названы новые сроки 4 ч.
Роботакси китайской Baidu скоро появятся на дорогах Европы 4 ч.