Сегодня 19 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → translategemma

Google представила TranslateGemma — семейство открытых ИИ-моделей для локального перевода на 55 языков

Компания Google выпустила три версии ИИ-модели TranslateGemma для обеспечения перевода на десятки языков на портативных и мобильных устройствах. Версия алгоритма с 4 млрд параметров оптимизирована для работы на мобильных устройствах, вариант с 12 млрд параметров предназначен для использования в потребительских ноутбуках, а версия с 27 млрд параметров — в облачных серверах, работающих на базе одного графического ускорителя H100 или тензорном процессоре.

 Источник изображений: Google

Источник изображений: Google

Google протестировала новые алгоритмы на платформе MetricX, которая позволяет отслеживать ошибки при переводе (чем ниже балл, тем лучше). Модель TranslateGemma с 12 млрд параметров набрала 3,6 балла, превзойдя результат базовой версии Gemma 3 с 27 млрд параметров, которая в этом тесте набрала 4,04 балла. По сравнению с версией Gemma 3 на 12 млрд параметров, набравшей на MetricX 4,86 балла, уровень ошибок снизился примерно на 26 %. Существенные улучшения в плане качества перевода наблюдаются для всех 55 протестированных языковых пар, включая не самые популярные языки. Так количество ошибок при переводе с английского на исландский снизилось на 30 %, а на суахили — на 25 %.

Двухэтапное обучение алгоритмов позволяет переносить знания Gemini в более компактные модели. На первом этапе алгоритмы обучаются на параллельных данных — как переведённых людьми, так и сгенерированных другими нейросетями. На втором этапе качество перевода оптимизируется за счёт обучения с подкреплением, когда несколько нейросетей автоматической оценки проверяют данные без необходимости использования эталонных переводов от человека. Отдельная модель оценивает, насколько естественно звучит полученный перевод.

Чтобы сохранить универсальность моделей, несмотря на их специализацию, 30 % обучающей выборки составили общие данные. Это означает, что модели TranslateGemma могут работать подобно привычным чат-ботам. Оценка профессиональными переводчиками в целом подтвердила улучшения, за одним исключением: в переводах с японского на английский было отмечено ухудшение качества, которое Google связывает с ошибками при обработке имён собственных.

Все три ИИ-модели сохранили мультимодальные возможности Gemma 3. Они могут переводить текст с изображений, даже без дополнительного обучения. Тесты в бенчмарке Vistra показали, что улучшения в переводе текста распространяются и на перевод с изображений. Для достижения оптимального результата Google рекомендует использовать промпты, указывающие модели на то, что она должна действовать как «профессиональный переводчик», учитывающий разные культурные нюансы. Все три новые модели TranslateGemma доступны на платформах Kaggle и Hugging Face.


window-new
Soft
Hard
Тренды 🔥
«Базис» впервые стал лауреатом премии «ЦИПР Диджитал» за проект в теплоэнергетике 2 ч.
Конференция Apple WWDC 2026 начнётся 8 июня, уделив особое внимание искусственному интеллекту 5 ч.
Google запустил масштабное обновление иконок своих сервисов — они станут более индивидуальными 5 ч.
Илон Маск проиграл суд против OpenAI — присяжные сочли претензии просроченными 5 ч.
Календарь релизов 18–24 мая: Forza Horizon 6, Zero Parades, Lego Batman и Phonopolis 11 ч.
PS Plus снова подорожает, но не для всех и не везде 14 ч.
«Одно из самых весёлых игровых событий года»: приключенческий экшен Lego Batman: Legacy of the Dark Knight понравился критикам 15 ч.
NVIDIA представила платформу Fleet Intelligence для мониторинга парка ИИ-ускорителей 15 ч.
Ошибочка вышла: европейские дистрибьюторы опровергли слухи о сегодняшнем старте предзаказов GTA VI 15 ч.
«СберТех» представил «бесконечную» СУБД О.К.Е.А.Н., универсальную и с неограниченной масштабируемостью 15 ч.
Intel и Qualcomm поборются за ИИ-стартап Джима Келлера стоимостью $5 млрд 12 мин.
Спутниковый интернет Starlink подорожал на $5–10 14 мин.
Южнокорейский суд запретил работникам Samsung бастовать из-за низких премий — разве что понемножку 29 мин.
Baikal обещает к 2030 году выпустить «основу суверенных дата-центров» — отечественные ИИ-чипы, совместимые с Nvidia CUDA 31 мин.
Европа снова хочет свой «Шаттл» — французский проект космоплана VORTEX поддержала Германия 32 мин.
Энергия как услуга: Hitachi и X LABS займутся созданием гигаваттных энергетических парков для ИИ ЦОД 2 ч.
Компактный планшет Huawei MatePad Mini стал доступен для предзаказа в России 2 ч.
Учёные получили водород из воды без драгоценных металлов в катализаторах 3 ч.
«Очень серьёзный прорыв»: Intel уверена, что техпроцесс 14A позволит ей снова бросить вызов TSMC 3 ч.
Дженсен Хуанг надеется, что Китай со временем откроет рынок для Nvidia H200 4 ч.