Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple представила малые языковые модели OpenELM, которые работают локально на смартфонах и ноутбуках

Компания Apple не слишком распространяется о своих планах относительно генеративного ИИ, но проявляет заметный интерес к возможности запускать ИИ-модели на своих устройствах локально.

 Источник изображения: Bangyu Wang / unsplash.com

Источник изображения: Bangyu Wang / unsplash.com

Сегодня исследователи Apple представили восемь крайне малых языковых моделей OpenELM, добавив их в библиотеку Hugging Face. В комментариях Apple сообщила, что эти «эффективные языковые модели с открытым исходным кодом» (Open-source Efficient Language Models, OpenELM) отлично справляются с текстовыми задачами, например, написанием электронных писем. И все эти модели уже доступны для разработчиков.

Серия ИИ-моделей OpenELM имеет разновидности с разным набором параметров: 270 и 450 миллионов, 1,1 и 3 миллиарда. Под параметрами здесь подразумевается количество переменных, которые модель использует, принимая решения на основе обучающих наборов данных. Например, у недавно выпущенной модели Phi-3 от Microsoft — 3,8 млрд параметров, а у Gemma от Google — 2,2 млрд. При этом модели меньшего размера дешевле в использовании и оптимизированы для работы на телефонах и ноутбуках.

Apple разрешает использовать OpenELM по «лицензии на образец кода» совместно с различными контрольными точками обучения, статистикой работы моделей, инструкциями по предварительному обучению, оценке и настройке. Данная лицензия не запрещает коммерческого использования или модификации кода, однако требует распространять программное обеспечение Apple совместно с текстами самой лицензии и отказа от ответственности. Последний подразумевает отсутствие гарантий безопасности и вероятность неточных, необъективных, неприемлемых и даже вредных ответов на запросы пользователя.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Криптобиржу Grinex заподозрили в связях с заблокированной российской биржей Garantex 43 мин.
Reddit заблокировала учёных за тайный эксперимент с ИИ-ботами в дискуссиях 4 ч.
OpenAI откатила обновление ChatGPT из-за подхалимского поведения ИИ 4 ч.
Mozilla Firefox представила долгожданную функцию разделения профилей, как в Chrome 5 ч.
Маск объявил скорый выход Grok 3.5 — размышляющего ИИ, который будет «создавать ответы с нуля» без интернета 10 ч.
Московский суд оштрафовал Blizzard на 600 тысяч рублей за нарушение правил работы в России 11 ч.
Electronic Arts отменила эвакуационный шутер по Titanfall и устроила новую волну сокращений в Respawn 11 ч.
Meta похвасталась, что число загрузок ИИ-моделей Llama перевалило за 1,2 млрд 12 ч.
ИИ-блокнот Google NotebookLM заговорил на русском и ещё более чем 50 языках 12 ч.
Амбициозная российская стратегия Broken Arrow о противостоянии России и США получила дату выхода — в Steam открыт предзаказ 13 ч.
AWS построит в Индиане дата-центр, который будет потреблять энергии как половина населения штата 56 мин.
Выручка Seagate выросла на 31 % и превзошла ожидания аналитиков 2 ч.
Ракета Firefly Alpha не смогла вывести спутник Lockheed Martin на орбиту — полезная нагрузка упала в океан 2 ч.
Прибыль Samsung в полупроводниковом секторе упала на 42 % из-за санкций и низких цен 3 ч.
TSMC приступила к строительству третьего предприятия в штате Аризона 4 ч.
Новая статья: Гид по выбору складного смартфона в 2025 году 10 ч.
Inventec вложит до $85 млн в производство серверов в Техасе 11 ч.
Европейская ракета Vega-C вывела в космос научный спутник ESA Biomass для подсчёта лесов на планете 12 ч.
SilverStone выпустила блок питания мощностью 2500 Вт, которых хватит на трио RTX 5090 или квартет RTX 5080 12 ч.
Одних лишь фабрик чипов недостаточно: на создание полноценной цепочки поставок в США у TSMC уйдёт до 10 лет 15 ч.
Включить темный режим