Сегодня 21 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Для обучения ИИ-модели Google PaLM 2 использовали впятеро больше текстовых данных, чем для предыдущей

Анонсированная на прошлой неделе большая языковая модель Google PaLM 2 была обучена на объёме, который в пять раз превышает аналогичный показатель модели 2022 года. Это позволяет новой нейросети решать более сложные задачи по программированию, математике и написанию текстов, выяснили журналисты CNBC.

 Источник изображения: blog.google

Источник изображения: blog.google

При обучении Google PaLM 2 было использовано 3,6 трлн токенов — эти элементы обучения больших языковых моделей помогают нейросетям предсказывать последующие слова в последовательностях. Алгоритмы предсказания, в свою очередь, позволяют большим языковым моделям составлять связные фразы. Предыдущую её версию, Google PaLM, которая была выпущена в 2022 году, обучили на 780 млрд токенов.

На прошедшем мероприятии Google I/O компания активно демонстрировала возможности искусственного интеллекта при его интеграции в поиск, электронную почту, работу с текстовыми документами и электронными таблицами, но не сообщала подробностей об объемах обучающих данных. Аналогичной стратегии предпочла придерживаться компания OpenAI, недавно представившая GPT-4. Свои действия компании объясняют конкурентным характером бизнеса, а общественность настаивает на большей прозрачности в отношении ИИ.

Google всё же рассказала, что новая модель оказалась меньше предыдущих, то есть эффективность технологии при выполнении более сложных задач выросла. PaLM 2, согласно внутренним документам компании, обучена на 340 млрд параметров, тогда как у первой версии их было 540 млрд — это свидетельствует, что увеличилась сложность модели. В компании подтвердили, что PaLM 2 обучена сотне языков, и это позволяет ей интегрироваться в 25 функций и продуктов экосистемы Google, включая экспериментальный чат-бот Bard.

Google PaLM 2, если верить общедоступным данным, может оказаться мощнее всех существующих моделей. Для сравнения, анонсированная в феврале Meta LlaMA обучена на 1,4 трлн токенов; OpenAI, когда ещё делилась информацией, докладывала, что GPT-3 обучалась на 300 млрд токенов; а представленная ещё два года назад Google LaMDA была обучена на 1,5 трлн токенов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple обжалует европейский штраф на €1,8 млрд за ущемление Spotify 15 мин.
Adobe добавила «Генеративное удаление» объектов в Lightroom 21 мин.
Nvidia выпустила драйвер с поддержкой F1 24, Senua’s Saga: Hellblade II, Serum и XDefiant 28 мин.
Слухи: Microsoft одобрила новую игру Ninja Theory даже до релиза Senua's Saga: Hellblade II 40 мин.
Китайские техногиганты снизили цены на доступ к своим моделям ИИ 2 ч.
Microsoft добавила в Paint ИИ-генератор изображений по текстовому описанию или наброскам 3 ч.
«Прямиком из "Чёрного зеркала"»: пользователи раскритиковали функцию записи действий Recall в Windows 11 4 ч.
Спустя девять лет после релиза The Witcher 3: Wild Hunt на ПК получила редактор модов REDkit и поддержку «Мастерской Steam» 4 ч.
Авторы Norco выпустят «микроприключение» Silenus про андроида на населённом ИИ заводе — в Steam вышло необычное демо 5 ч.
Ethereum взлетел более чем на 20 % и продолжает расти на фоне слухов об одобрении спотовых Ethereum-ETF 5 ч.
Sonos представила дебютные беспроводные наушники Ace — они «самые удобные» в своём классе и стоят $450 15 мин.
«Аквариус» запустил производство отечественного ноутбука Cmp NE355 на чипе AMD Ryzen 6000 2 ч.
Core42 и Cerebras построят в Техасе ИИ-суперкомпьютер с 173 млн ядер 2 ч.
Noctua вышла за рамки ПК: представлены вентиляторы и аксессуары Home для дома и офиса 2 ч.
Объём производства российского оптоволокна сократился 3 ч.
«Джеймс Уэбб» приблизил учёных к разгадке тайны пухлой экзопланеты с плотностью хлопка 3 ч.
Китайские SMIC и CXMT активизировали работу по импортозамещению расходных материалов для выпуска чипов 4 ч.
Первый в мире коммерческий космический самолет Dream Chaser прибыл во Флориду для последних тестов перед полётом на МКС 4 ч.
HP перестанет выпускать компьютеры Spectre, Envy и Pavilion — их заменят Omni и Elite 5 ч.
Операционный директор Apple провёл тайные переговоры с TSMC по поводу выпуска ИИ-чипов 5 ч.