Сегодня 03 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В Google Books появились книги сомнительного качества, написанные ИИ

Эмануэль Майберг (Emanuel Maiberg) из 404Media провёл нехитрое исследование и обнаружил, что Google Books индексирует сгенерированные ИИ книги, при том довольно плохого качества. Для их поиска он использовал характерную для сгенерированных ИИ ответов фразу «As of my last knowledge update» («По последним данным из моей базы знаний»), и результаты его удивили, хотя ранее он уже находил написанные с использованием ИИ книги на Amazon и Google Play.

 Источник изображения: freepik.com

Источник изображения: freepik.com

Большинство книг с этой фразой на первых восьми страницах выдачи оказались не связаны с темой ИИ, для которой она была бы уместной. В качестве примера Майберг приводит книгу «Медведи, быки и волки: биржевая торговля для 20-летних» (Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old), которую автор позиционирует как «всеобъемлющее руководство для новичков, стремящихся раскрыть тайны финансовых рынков». Своим содержанием она напомнила сгенерированный ChatGPT текст с поверхностным анализом сложных событий, на уровне «Википедии».

В других рассмотренных Майбергом книгах содержались откровенно устаревшие, бесполезные читателю в 2024 году сведения, которые скорее всего были почерпнуты ChatGPT из своей «базы знаний». Он приводит в пример вышедшую в марте 2024 года книгу «Максимум от Twitter: Стратегии успешного продвижения для новичков» (Maximize Your Twitter Presence: 101 Strategies for Marketing Success) Шу Чен Хоу (Shu Chen Hou). Как и в случае со множеством подобных авторов, на его счету числится не один десяток книг. В конце многостраничного раздела о верификации учётной записи в Twitter (ныне X) Майберг обнаружил строки: «Насколько мне известно на сентябрь 2021 года Twitter находилась в процессе переоценки и обновления критериев и процесса верификации, поэтому необходимые шаги могли измениться». В 2022 году Twitter приобрёл Илон Маск и превратил верификацию в торговлю «галочками».

«Не могу поверить, что в компании не знают, что ищут пользователи в Google Books. Они индексируют всё подряд, но мне хотелось бы верить, что они могут распознать сгенерированные ИИ материалы, и они оказали бы себе и пользователям огромную услугу, если их промаркировали», — прокомментировал открытия Майберга библиотекарь, консультант и редактор infoDOCKET.

Отдельное беспокойство Майберга вызывает возможное влияние таких книг на Google Ngram — профессиональный инструмент, оценивающий частоту вхождения фраз и отдельных слов в проиндексированных книгах с 1500 по 2019 годы. Он интересен тем, что учёные и исследователи используют его для оценки культурных тенденций. Соответственно, распространение написанных ИИ книг может заметно исказить результаты анализа с использованием Google Ngram. Однако представитель Google отрицает влияние сгенерированных книг на Google Ngram:

«Наши автоматизированные алгоритмы настроены на поиск релевантных высококачественных книг. Указанные вами книги найдены по необычному и очень специфичному запросу, и не влияют на результаты Ngram. Мы стремимся, чтобы Ngram оставался высококачественным инструментом и продолжим адаптировать его по мере развития индустрии книгоиздания».

«Ngram уже сейчас даёт довольно неточные данные, чтобы на них могли опираться вычислительные социологи и лингвисты, а через несколько лет он, вероятно, и вовсе потеряет значимость, — прокомментировала Алекс Ханна (Alex Hanna), директор по исследованиям Distributed AI Research Institute (DAIR). — Это ещё один пример того, как искусственный интеллект начинает поглощать сам себя. Созданный им контент попадает в Google Books, а затем Google начинает тренировать на его основе собственные модели. Да, они скажут, что тщательно контролируют качество, но детали они, конечно, не раскроют».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Хакеры украли почти все данные пользователей сервиса цифровой подписи Dropbox Sign 9 ч.
«Буду слишком занят этим, чтобы с нетерпением ждать TES VI»: видео о прогрессе разработки фанатского ремейка Morrowind на движке Skyrim воодушевило игроков 10 ч.
С новым патчем Starfield стала работать на ПК «заметно лучше», но лишь в некоторых ситуациях 10 ч.
«Базис» купила конкурента и планирует занять не менее половины российского рынка виртуализации 11 ч.
Apple освободила разработчиков бесплатных приложений от уплаты €0,5 за каждую первую установку 11 ч.
Космическая стратегия Sins of a Solar Empire II выйдет в Steam после полутора лет пребывания в EGS 13 ч.
На 20-летие российской стратегии «Периметр» в Steam выйдет переиздание со «множеством улучшений» — трейлер «Периметр: Legate Edition» 13 ч.
TikTok вновь стал доступен в России, но ненадолго 13 ч.
Winamp возродится в качестве стримингового сервиса 1 июля — обещана и новая версия классического плеера 13 ч.
Microsoft добавила поддержку ключей Passkey для всех потребительских аккаунтов 14 ч.
Удаление оборудования Huawei и ZTE из сетей связи США забуксовало из-за нехватки финансирования 8 мин.
Joby Aviation завершила программу тестирования предсерийных прототипов летающих такси 3 ч.
По мнению учёных, интенсивное расширение спутниковой сети Starlink повышает риск столкновений в космосе 4 ч.
Новость о падении выручки на 4 % компания Apple подсластила заявлением о выкупе акций на $110 млрд 5 ч.
Не прошло и года: системы на AMD Zen 2 получили прошивки, устраняющие уязвимость Zenbleed 9 ч.
Новая статья: Обзор Hyundai H-LED55QBU7500: недорогой телевизор с QLED-экраном 55" 10 ч.
Samsung планирует выпустить «новые премиальные смарт-часы» 11 ч.
Asus выпустила первые в мире двухвентиляторные Radeon RX 7900 XT и RX 7900 XTX 11 ч.
Vivo представила смартфон среднего уровня Y38 5G на чипе Snapdragon 4 Gen 2 14 ч.
BenQ выпустила профессиональный 24-дюймовый монитор SW242Q со встроенным кардридером и USB Type-C 14 ч.