Сегодня 14 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple создала ИИ, который генерирует тексты в 128 раз быстрее аналогов

Разработчики Apple и Университета штата Огайо создали новую диффузионную модель Few-Step Discrete Flow-Matching (FS-DFM), которая может писать тексты в 128 раз быстрее аналогов, сообщил ресурс 9to5mac.com со ссылкой на исследование «FS-DFM: быстрая и точная генерация длинных текстов с помощью моделей языка диффузии с малым количеством шагов».

 Источник изображения: Jackson Sophat/unsplash.com

Источник изображения: Jackson Sophat/unsplash.com

Согласно исследованию, FS-DFM способна записывать полные текстовые фрагменты всего за восемь быстрых шагов уточнения. Для получения аналогичного результата по записи текстового фрагмента другим моделям диффузии требуется более тысячи шагов.

Для этого исследователи используют трёхэтапный подход: сначала модель обучается обрабатывать различные виды итераций уточнения. Затем они используют направляющую модель «учителя», которая помогает ей делать более крупные и точные обновления на каждой итерации, не выходя за рамки заданного текста. И наконец, они выполняют корректировку работы каждой итерации с тем, чтобы конечный результат был достигнут за меньшее количество шагов при более стабильной работе модели.

По сравнению с более крупными моделями диффузии, FS-DFM показала хорошие результаты по двум важным метрикам: перплексии и энтропии. Показатель перплексии отражает качество текста в языковых моделях. Чем он ниже, тем точнее и естественнее звучит текст. Энтропия отражает, насколько уверенно модель выбирает каждое слово. Если энтропия слишком низкая, текст может стать повторяющимся или предсказуемым, но если она слишком высокая, он может выглядеть бессвязным со случайным набором слов.

По сравнению с моделями диффузии Dream с 7 млрд параметров и LLaDA с 8 млрд параметров варианты FS-DFM с 1,7 и 1,3, а также 0,17 млрд параметров стабильно обеспечивали меньшую перплексию и более стабильную энтропию на протяжении всего количества итераций.

Разработчики сообщили, что «планируют опубликовать код и контрольные точки модели для облегчения воспроизводимости и дальнейших исследований».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Группа Астра» представила программно-определяемую систему хранения данных TROK 24 мин.
Хакеры научились похищать коды 2FA и личные сообщения со смартфонов на Android 3 ч.
Apple создала ИИ, который генерирует тексты в 128 раз быстрее аналогов 4 ч.
CD Projekt Red отправила «Ведьмака» в космос 4 ч.
Microsoft представила первый ИИ-генератор изображений собственной разработки — MAI-Image-1 5 ч.
Конец эпохи: Microsoft прекратила поддержку Windows 10 6 ч.
«Базис» и MIND Software представляют первое в России коробочное HCI-решение для ускорения цифровой трансформации бизнеса 7 ч.
«Базис» и MIND Software представляют первое в России коробочное HCI-решение для ускорения цифровой трансформации бизнеса 7 ч.
Devolver объявила дату выхода Forestrike — тактического кунг-фу-экшена, где каждая смерть приближает к победе в бою, который ещё не начался 8 ч.
В популярнейшем архиваторе 7-Zip обнаружены две уязвимости, позволяющие удалённо взламывать ПК 17 ч.
Intel продала компании Graid технологию VROC: будут временные перебои с продажами и техподдержкой 28 мин.
HP показала ноутбук Omen 16 для фанатов League of Legends — на базе Core i7-14650HX и GeForce RTX 5070 2 ч.
Vivo представила беспроводные наушники TWS 5 и TWS 5 Hi-Fi с активным шумоподавлением и автономностью до 48 часов 2 ч.
Fujifilm представила гибридную камеру Instax LiPlay Plus — с записью звука, принтером и селфи-камерой 3 ч.
В Китае начали массово выпускать квантовые однофотонные детекторы для радаров, датчиков и связи завтрашнего дня 3 ч.
«Нервная система» ИИ-фабрик: Meta и Oracle развернут сетевые платформы NVIDIA Spectrum-X Ethernet в своих ЦОД 3 ч.
Прототипы флагманского внедорожника Xiaomi YU9 замечены на тестах в высокогорной местности 3 ч.
EHang представила «летающую маршрутку» VT35 на электротяге — два пассажира и 200 км за час 4 ч.
OpenAI и Broadcom совместно разработают и развернут ИИ-ускорители на 10 ГВт 4 ч.
Акции Broadcom взлетели в цене на 9 % после новостей о сделке с OpenAI 4 ч.