Сегодня 19 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Для обучения ИИ-модели Google PaLM 2 использовали впятеро больше текстовых данных, чем для предыдущей

Анонсированная на прошлой неделе большая языковая модель Google PaLM 2 была обучена на объёме, который в пять раз превышает аналогичный показатель модели 2022 года. Это позволяет новой нейросети решать более сложные задачи по программированию, математике и написанию текстов, выяснили журналисты CNBC.

 Источник изображения: blog.google

Источник изображения: blog.google

При обучении Google PaLM 2 было использовано 3,6 трлн токенов — эти элементы обучения больших языковых моделей помогают нейросетям предсказывать последующие слова в последовательностях. Алгоритмы предсказания, в свою очередь, позволяют большим языковым моделям составлять связные фразы. Предыдущую её версию, Google PaLM, которая была выпущена в 2022 году, обучили на 780 млрд токенов.

На прошедшем мероприятии Google I/O компания активно демонстрировала возможности искусственного интеллекта при его интеграции в поиск, электронную почту, работу с текстовыми документами и электронными таблицами, но не сообщала подробностей об объемах обучающих данных. Аналогичной стратегии предпочла придерживаться компания OpenAI, недавно представившая GPT-4. Свои действия компании объясняют конкурентным характером бизнеса, а общественность настаивает на большей прозрачности в отношении ИИ.

Google всё же рассказала, что новая модель оказалась меньше предыдущих, то есть эффективность технологии при выполнении более сложных задач выросла. PaLM 2, согласно внутренним документам компании, обучена на 340 млрд параметров, тогда как у первой версии их было 540 млрд — это свидетельствует, что увеличилась сложность модели. В компании подтвердили, что PaLM 2 обучена сотне языков, и это позволяет ей интегрироваться в 25 функций и продуктов экосистемы Google, включая экспериментальный чат-бот Bard.

Google PaLM 2, если верить общедоступным данным, может оказаться мощнее всех существующих моделей. Для сравнения, анонсированная в феврале Meta LlaMA обучена на 1,4 трлн токенов; OpenAI, когда ещё делилась информацией, докладывала, что GPT-3 обучалась на 300 млрд токенов; а представленная ещё два года назад Google LaMDA была обучена на 1,5 трлн токенов.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Battle Shapers — боязнь амбиций. Рецензия 4 ч.
Новая статья: Gamesblender № 709: анонс Nintendo Switch 2, кризис Ubisoft и вампирская RPG от авторов «Ведьмака» 4 ч.
Стало известно, о чём Дуров говорил и что обещал на допросе во французском суде 14 ч.
TikTok предупредил, что завтра прекратит работу в США, если Байден не вмешается 15 ч.
Instagram добавил новые функции в Reels в преддверии блокировки TikTok в США 17 ч.
Новая статья: Marvel Rivals — нужна ли теперь Overwatch? Рецензия 18-01 00:03
Ремастер Tomb Raider: The Angel of Darkness для сборника Tomb Raider IV-VI Remastered раскроет потенциал худшей игры серии — подробности улучшений 17-01 22:06
Первый «геймплей» Virtua Fighter 6 оказался точной копией боевой сцены из фильма «Драконы навсегда» с Джеки Чаном 17-01 20:52
Руководитель разработки Dragon Age: The Veilguard покинет BioWare после 18 лет в Electronic Arts 17-01 19:41
Верховный суд США поддержал закон о блокировке TikTok — соцсети осталось два дня 17-01 19:03
ASRock представила индустриальные мини-ПК и материнские платы на базе Intel Arrow Lake-H и AMD Ryzen 300 AI 5 ч.
CoreWeave поставит IBM ИИ-суперкомпьютер на базе NVIDIA GB200 NVL72 для обучения моделей Granite 5 ч.
Потенциальный министр транспорта США пообещал разобраться со штрафами SpaceX и ликвидировать космическую бюрократию 7 ч.
Vast Space построила первую в мире частную космическую станцию — на орбиту она отправится в этом году 8 ч.
Телевизоры Samsung получат полезные ИИ-функции благодаря интеграции с нейросетями OpenAI 10 ч.
Qualcomm начала выпускать неполноценные Snapdragon 8 Elite 10 ч.
Астрономы получили наиболее детальное инфракрасное изображение активного ядра галактики 13 ч.
Новую тяжёлую европейскую ракету Ariane 6 улучшили — следующий пуск состоится в феврале 15 ч.
Российский аналог Starlink решено строить на отечественной электронике — проект «Бюро 1440» может затянуться 15 ч.
Amazon прекратила доставлять товары дронами после инцидента на испытательном полигоне 16 ч.