Сегодня 21 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ можно полностью обучить только на бесплатных материалах, доказали исследователи

Специализирующиеся на разработке ИИ компании утверждают, что их проекты невозможно было бы создать без материалов, защищённых авторским правом. Группа учёных из США и других стран доказала, что разработка ИИ в таких условиях возможна, хотя и затруднительна. Они создали модель, обученную исключительно на общедоступном контенте и материалах с открытой лицензией.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

Проект стал результатом сотрудничества 14 учреждений, включая Массачусетский технологический институт, Университет Карнеги — Меллона и Торонтский университет. Исследователи составили массив данных для обучения, собранных только из этичных источников, — его объём достиг 8 Тбайт. В него, в частности, вошли 130 000 книг из Библиотеки Конгресса США. На этих материалах исследователи обучили большую языковую модель с 7 млрд параметров. Она работает примерно на уровне модели Meta Llama 2-7B аналогичного размера, вышедшей в 2023 году. Тестов производительности модели в сравнении с ведущими отраслевыми проектами авторы исследования не привели.

Качество работы системы на уровне модели двухлетней давности было не единственным недостатком — утомительным оказался и процесс перевода обучающего массива в надлежащий формат. Значительная часть данных не читалась машинами, поэтому людям приходилось участвовать в их подготовке. «Мы пользовались средствами автоматизации, но все наши материалы аннотировались вручную в конце дня и проверялись людьми. И это очень непросто», — рассказала одна из участниц проекта. Учёным пришлось определять, какая лицензия действует для каждого подвергшегося сканированию сайта.

В 2024 году OpenAI заявила одному из комитетов британского парламента, что «обучать ведущие современные модели ИИ без использования защищённых авторским правом материалов невозможно». В прошлом году с этим тезисом согласился эксперт из Anthropic: «Больших языковых моделей, скорее всего, не было бы, если бы фирмы [специализирующиеся на] ИИ были обязаны лицензировать работы в своих наборах обучающих данных». Теперь есть доказательство, что оба утверждения не соответствуют действительности. Едва ли исследование что-то изменит в отрасли, но один из приводимых разработчиками ИИ распространённых аргументов оказался несостоятельным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Чиновников обяжут пользоваться мессенджером Max 3 мин.
Пентагон принял боевую ИИ-систему Palantir Maven в качестве основной для армии США 7 мин.
Microsoft представила MAI-Image-2 — ИИ-генератор изображений, который оказался неожиданно хорош в фотореализме и инфографике 18 мин.
Меньше ИИ, больше надёжности: Microsoft рассказала, как будет возвращать утраченное доверие к Windows 11 22 мин.
Суд признал, что «глупые твиты» Илона Маска перед покупкой Twitter привели к убыткам инвесторов 7 ч.
Панель задач Windows 11 всё же станет перемещаемой — как в Windows 10 11 ч.
Новая статья: Esoteric Ebb — кубик всемогущий. Рецензия 13 ч.
Поиск Google начал подменять заголовки новостей сгенерированными ИИ — и не гнушается искажением смысла 13 ч.
Продажи Crimson Desert в день релиза превысили два миллиона копий — Pearl Abyss пообещала оперативно улучшать игру 17 ч.
Мартовское обновление Windows 11 сломало вход в Teams и OneDrive, призналась Microsoft 18 ч.
Tesla нацелилась на 100 ГВт солнечной энергии — с китайской помощью 42 мин.
Второй полёт прототипа тихого сверхзвукового авиалайнера NASA X-59 оказался недолгим, но информативным 59 мин.
Джефф Безос поставил на физический ИИ: он создаёт фонд на $100 млрд для скупки производств и перевода их на ИИ-рельсы 6 ч.
xAI переманила у OpenAI крупного клиента, применив тактику «внедрения» 7 ч.
Nintendo сделает батарею в Switch 2 сменной, но не для всех 8 ч.
Учёные создали «рентген» для работающих чипов — мечта инспекторов и хакеров 15 ч.
В Китае придумали, как охлаждать квантовые процессоры без дефицитного гелия-3 15 ч.
Huawei представила смартфон Mate 80 Pro Max Wind Edition с сильно выступающими камерами и вентилятором 17 ч.
Доступный MacBook Neo стал хитом: Тим Кук похвастался лучшим запуском новых Mac в истории 17 ч.
Ракету SLS с кораблём Orion вернули на стартовую площадку в преддверии исторического облёта Луны людьми 17 ч.