Сегодня 10 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Развитие ИИ замедляется из-за переизбытка бесполезных данных — их слишком много

Дальнейшее совершенствование ИИ-систем, которое обеспечит переход от ChatGPT к использованию человекоподобных роботов, зависит от качества данных, которые предоставляются этим системам для обучения, пишет ресурс Fortune.

 Источник изображения: Igor Omilaev/unsplash.com

Источник изображения: Igor Omilaev/unsplash.com

Ресурс отметил, что отрасль находится на пороге следующего рубежа ИИ — физического ИИ и моделей окружающего мира — систем, которые будут учиться и в конечном итоге работать в физическом мире. Для того чтобы они получили когнитивные способности, необходимые для навигации по дорогам, складывания белья или оказания помощи при сложных медицинских операциях, им требуются не просто данные, которые можно загрузить. Их обучение требует богатых и многогранных данных. И если исследователи не смогут остановить избыток ненужных данных — данных, которые не способствуют развитию модели, — весь потенциал физического ИИ и моделей окружающего мира может никогда не раскрыться в полной мере.

Проблема заключается в том, что для создания новых, более совершенных ИИ-моделей требуется всё больше данных. На волне ажиотажа вокруг ИИ возникло множество ИИ-стартапов, таких, как Scale AI, Surge AI и Mercor, испытывающих ненасытную потребность в данных. Однако удовлетворение этой потребности привело к появлению огромного количества ненужных данных, которые на самом деле никак не способствуют развитию моделей ИИ, отметил Fortune.

Обучение моделей пониманию сложного многомерного мира требует значительно больше данных — данных, которые также очень трудно получить. Инженеры по машинному обучению прибегают к моделированию данных, используя виртуальные реконструкции реальных сценариев для создания данных, которые будут использоваться для обучения роботов и беспилотных автомобилей.

Использование некачественных данных при обучении ИИ-моделей может привести к непредсказуемым результатам. Как утверждает ресурс Fortune, OpenAI прекратила поддержку видеоприложения Sora из-за проблемы некачественных данных, поскольку её модель мира не обладала достаточным пониманием физики, что затрудняло реалистичные прогнозы.

Для дальнейшего продвижения ИИ-специалистам, занимающимся машинным обучением, необходимы инструменты и технологии для удаления ненужных данных, которые анализируют, очищают, нормализуют и корректируют обучающие данные. Для достижения успеха в обучении потребуется извлечение ценных выводов и их отделение от ненужных данных.

Теперь ограничивающим фактором стала нехватка качественных данных. Компании, которые первыми поймут это, создадут ИИ-системы, которые действительно будут работать, пишет Fortune.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Еврокомиссия требует от Meta восстановить доступ конкурирующих ИИ-агентов к WhatsApp 12 мин.
Microsoft исправила три опасные уязвимости нулевого дня и ещё 200 багов в своём ПО 8 ч.
Orion soft представил платформу StarGuard AI для безопасной работы с ИИ 10 ч.
В ядре Linux нашли серьёзную уязвимость, созданную всего одним лишним символом в коде 12 ч.
Meta будет использовать активность пользователей на других сайтах для персонализации их лент и ответов ИИ 13 ч.
Nintendo подтвердила ремейк легендарной The Legend of Zelda: Ocarina of Time эксклюзивно для Switch 2 13 ч.
«Всё по-честному, без обмана»: Сулейман из Microsoft отказался от своих слов о полной замене офисных сотрудников ИИ 13 ч.
Dragon’s Dogma 2 всё-таки получит большое дополнение и улучшения оптимизации — первый трейлер и детали Dragon's Dogma 2: Dark Arisen 14 ч.
Роскомнадзор и Минцифры увидели основания для разблокировки Roblox в России 15 ч.
Закон един для всех: ЕС отказался делать исключение из DMA для новой Siri AI от Apple 15 ч.
ФАС проверит операторов на законность рекламы 5G — «не реализованных в настоящее время технологий» 54 мин.
Тайвань задумался об ограничении поставок ИИ-чипов в Китай в составе готовых систем 2 ч.
Автоконцерн GM будет выпускать аккумуляторы для инфраструктуры ИИ 3 ч.
Инвесторы готовы купить акций SpaceX на сумму более $250 млрд, вчетверо превышая предложение 4 ч.
Новая статья: Обзор игрового ноутбука ASUS ROG Zephyrus G14 GU405: пример удачной погони за двумя зайцами 9 ч.
NASA представило экипаж луной миссии Artemis 3, но до Луны он не доберётся 10 ч.
Финская твердотельная чудо-батарея Donut Lab оказалась фикцией — и способом выманить $25 млн у инвесторов 11 ч.
MaxSun выпустила низкопрофильную GeForce RTX 5060 с тройкой вентиляторов за $501 13 ч.
В AMD предсказали, что цены на DDR5 вернутся в норму только через два года 13 ч.
Спутниковый Wi-Fi на борту авиалайнеров станет важным «полем битвы» между SpaceX Starlink и Amazon Leo 14 ч.