Сегодня 11 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» ищет тренеров для обучения YandexGPT переводу текста с изображений, аудио- и видеофайлов

Нейросеть YandexGPT научат распознавать и переводить текст с изображений, аудио- и видеофайлов, пишут «Ведомости» со ссылкой на описание вакансии AI-тренера, опубликованной на сайте компании «Яндекс». По словам источника ресурса, близкого к «Яндексу», предполагается нанять около десятка специалистов такого профиля.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как указано в описании вакансии, в обязанности тренера входит обучение генеративной модели, создавая собственные эталонные примеры, а также оценка качества перевода и обучение нейросети распознаванию и переводу текста с изображений и видео.

В начале 2023 года «Яндекс» объявляла набор AI-тренеров для обучения моделей семейства YandexGPT, напомнил представитель компании. Но если тогда принимали на работу специалистов гуманитарного направления, умеющих работать с русскоязычными текстами, то сейчас речь идёт о специалистах, ориентирующихся в узкоспециализированных тематиках, чтобы точечно углубить знания ИИ-модели. Например, они должны разбираться в терминологии самых разных направлений — от физики до юриспруденции, сообщил представитель «Яндекса».

Гендиректор Dbrain, автор Telegram-канала AI Happens Алексей Хахунов отметил, что в машинном обучении самыми важными критерии являются чистота и качество данных. По словам Хахунова, для обучения современных моделей нужны два типа специалистов: нейролингвисты, которые знают, как работают нейросети и могут создавать современные алгоритмы — в первую очередь машинных переводов, и специалисты, в совершенстве владеющие несколькими языками, что позволяет создавать пары между различными языками.

При этом нужно делать не дословный перевод, а собирать семантически близкие виды переводов. «Одни и те же фразы по смыслу могут звучать по-разному на разных языках, и важно, чтобы переводчик опирался на глубокое понимание языка, а не на дословный перевод», — пояснил эксперт.

С ним согласился эксперт Альянса искусственного интеллекта Андрей Комиссаров, по словам которого, проблема в том, что на большом количестве языков нейросети делают дословный перевод, поскольку не ощущают тонкостей языка и не могут работать с фразеологизмами. «В данном случае речь идёт о дообучении модели. Для этого необходимо чутье языка», — отметил он.

Сейчас с переводом у нейросетей дела идут по-разному. «Если с английским языком машина более-менее справляется, то в случае с китайским, если перевести текст туда и обратно, он фактически превратится в бессвязный набор слов», — сообщил Комиссаров.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Кентавры, божественные силы и третья глава сюжета: для Titan Quest 2 вышло первое крупное обновление в 2026 году 3 мин.
Discord объяснил, почему большинству пользователей не придётся проходить проверку возраста 3 ч.
Облачная служба Apple хранения данных iCloud столкнулась с массовым техническим сбоем 3 ч.
Facebook научился оживлять фото профиля с помощью ИИ 5 ч.
Nothing запустила бета-версию Essential Apps — ИИ-конструктора мини-приложений 10 ч.
Nebius Аркадия Воложа купит за $275 млн разработчика поисковых систем для ИИ-агентов Tavily 11 ч.
Тактический роглайк о разведении кошек Mewgenics от автора The Binding of Isaac и Super Meat Boy стартовал в Steam с рейтингом 97 % 11 ч.
Анонсирована Terrinoth: Heroes of Descent — тактическая RPG по популярной настольной игре Descent 12 ч.
Спустя шесть лет после релиза средневековая песочница Besiege отправит игроков покорять космос — подробности аддона The Broken Beyond 13 ч.
ИИ научился формировать политические взгляды так же эффективно, как человек — и людей это не смущает 13 ч.
Австралийское неооблако Firmus привлекло $10 млрд в кредит для строительства ИИ-фабрик Project Southgate 30 мин.
Илон Маск потерял ещё одного ключевого сотрудника стартапа xAI 3 ч.
ЕС предложил полностью запретить криптовалютные операции с Россией в рамках нового пакета санкций 3 ч.
По итогам 2026 года ёмкость рынка памяти в два с лишним раза превысит оборот рынка контрактных услуг по производству чипов 5 ч.
Новая статья: Обзор смартфона vivo X300 Pro: маленькие изменения, которые ведут к большому результату 10 ч.
Filum представила серию беспроводных клавиатур FL-WKB с ярким дизайном и подключением по Bluetooth или 2,4 ГГц 11 ч.
Представлены доступные геймерские мониторы AOC Gaming 24G4ZR и AOC Gaming 27G4ZR на панелях Fast IPS 13 ч.
Камера для звёзд и туманностей: OM System представила OM-3 Astro, которая видит больше обычных беззеркалок 13 ч.
Путь к 1 нм: в TSMC одобрили рекордные $45 млрд инвестиций в производство 14 ч.
Cisco представила 102,4-Тбит/с чип-коммутатор Silicon One G300 15 ч.