Сегодня 19 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Тестировщики оценивают ответы ИИ-бота Google Bard наугад, чтобы не терять деньги

Компания Google в прошлом месяце начала ограниченное бета-тестирование своего ИИ-чат-бота Bard. С тех пор сотрудники некоторых крупных подрядчиков IT-гиганта участвуют в тестировании нейросети, а также проверяют точность выдаваемых им ответов. Оказалось, что зачастую участникам тестирования не хватает времени на проверку ответов Bard, из-за чего им приходится давать оценку наугад.

 Источник изображения: Google

Источник изображения: Google

Так, сотрудники компании Appen, которые помогают Google в тестировании алгоритма Bard, на условиях анонимности сообщили представителям СМИ, что им не хватает времени на осмысленную оценку ответов, выдаваемых ИИ-ботом. В полученных ими инструкциях сказано, что в процессе тестирования необходимо подготовить запрос для чат-бота, а после получения двух ответов выбрать наиболее связный и корректный ответ. У них также есть возможность добавить комментарий, чтобы объяснить, почему выбран тот или иной вариант.

Участники тестирования отмечают, что на обработку каждого запроса даётся несколько минут, но иногда на это отводится только 60 секунд. Зачастую дать корректную оценку полученного от чат-бота ответа за такое время весьма затруднительно, особенно в случаях, когда запрос связан с малознакомой темой. Оплата за эту работу начисляется на основе времени, выделяемого для решения каждой задачи. Чтобы не терять деньги тестировщикам приходится выполнять задачи за отведённое время даже в случаях, когда они не уверены в том, какой из предложенных ИИ-алгоритмом ответов является более точным. Проще говоря, чтобы не терять деньги участники тестирования вынуждены наугад выполнять задания, поскольку им не хватает времени на качественную проверку ответов Bard.

Источник отмечает, что сотрудники подрядных организаций Google всё чаще призывают к улучшению условий труда. Ещё в феврале участники бета-тестирования системы Bard передали петицию руководству Google с призывом повысить оплату труда. Согласно имеющимся данным, сотрудники Appen, участвующие в тестировании Bard, зарабатывают от $14 до $14,50 в час.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Windows 11 станет умнее: Microsoft тестирует ИИ-поиск по файлам 27 мин.
Слияние вместо продажи: Perplexity AI хочет спасти TikTok в США 30 мин.
Новая статья: Battle Shapers — боязнь амбиций. Рецензия 6 ч.
Новая статья: Gamesblender № 709: анонс Nintendo Switch 2, кризис Ubisoft и вампирская RPG от авторов «Ведьмака» 6 ч.
TikTok предупредил, что завтра прекратит работу в США, если Байден не вмешается 17 ч.
Instagram добавил новые функции в Reels в преддверии блокировки TikTok в США 19 ч.
Новая статья: Marvel Rivals — нужна ли теперь Overwatch? Рецензия 18-01 00:03
Тактическая стратегия по «Звёздным войнам» от бывших разработчиков XCOM скоро выйдет из тени — инсайдер рассказал, когда ждать анонс 17-01 23:31
Ремастер Tomb Raider: The Angel of Darkness для сборника Tomb Raider IV-VI Remastered раскроет потенциал худшей игры серии — подробности улучшений 17-01 22:06
Первый «геймплей» Virtua Fighter 6 оказался точной копией боевой сцены из фильма «Драконы навсегда» с Джеки Чаном 17-01 20:52
ASRock представила индустриальные мини-ПК и материнские платы на базе Intel Arrow Lake-H и AMD Ryzen 300 AI 7 ч.
CoreWeave поставит IBM ИИ-суперкомпьютер на базе NVIDIA GB200 NVL72 для обучения моделей Granite 7 ч.
Потенциальный министр транспорта США пообещал разобраться со штрафами SpaceX и ликвидировать космическую бюрократию 9 ч.
Телевизоры Samsung получат полезные ИИ-функции благодаря интеграции с нейросетями OpenAI 12 ч.
Qualcomm начала выпускать неполноценные Snapdragon 8 Elite 12 ч.
Астрономы получили наиболее детальное инфракрасное изображение активного ядра галактики 15 ч.
Новую тяжёлую европейскую ракету Ariane 6 улучшили — следующий пуск состоится в феврале 17 ч.
Российский аналог Starlink решено строить на отечественной электронике — проект «Бюро 1440» может затянуться 17 ч.
Amazon прекратила доставлять товары дронами после инцидента на испытательном полигоне 18 ч.
Во Франции создали крошечного робота-хирурга, который очень аккуратно покопается в мозгах 18 ч.