Twitter открыл доступ к части исходного кода, включая алгоритмы рекомендаций
Читать в полной версииВсего через неделю после инцидента с утечкой части исходного кода Twitter на ресурсе GitHub администрация социальной сети выложила в одноимённый репозиторий уже официально одобренные к свободному распространению фрагменты кода. По замыслу Илона Маска (Elon Musk), подобная инициатива сделает Twitter похожей на Linux, поможет усовершенствовать алгоритмы и устранить ошибки при помощи сторонних разработчиков.
Безусловно, соответствующая информация будет в большей степени интересна профессиональным разработчикам, поэтому Twitter одновременно опубликовала и инструкции по работе с исходным кодом. Наибольшей открытости пока удостоилась та часть исходного кода Twitter, которая имеет отношение к рекомендательным алгоритмам, позволяющим социальной сети предлагать пользователям наиболее интересные им записи.
Как поясняется, настроенная примерно по 48 млн параметров нейронная сеть ежедневно фильтрует сотни миллионов твитов, чтобы выделить из них примерно 1500 штук, наиболее соответствующих интересам каждого конкретного пользователя. Они затем фильтруются дополнительно, чтобы попасть в раздел рекомендаций «For You». Лента этого раздела на 50 % состоит из авторов, за активностью которых пользователь следит, и на 50 % — из незнакомых ему авторов.
По словам Илона Маска, команда Twitter готова обновлять рекомендательный алгоритм каждые 24 или 48 часов, опираясь на предложения пользователей и сторонних разработчиков. Критике уже подверглась практика присвоения отдельным пользователям маркера принадлежности к республиканцам и демократам по своим политическим убеждениям, но когда эта информация дошла до Маска, он заявил, что такого быть не должно. По словам сотрудников Twitter, эта устаревшая классификация никак на работу системы рекомендаций сейчас не влияет, и должна быть удалена в обозримом будущем.
В репозитории GitHub не будут доступны фрагменты исходного кода Twitter, которые позволяют понять, как работает рекомендательный механизм для демонстрации пользователям рекламы. Компания также защитит от посторонних глаз всю ту информацию, которая может быть использована злоумышленниками для доступа к пользовательским данным или для обхода механизмов защиты от злоупотребления незаконным контентом. «Люди будут находить много ошибок, но мы собираемся устранять их очень быстро. Примером для подражания в этом случае, которым мы вдохновлялись, является Linux в качестве операционной системы с открытым исходным кодом», — пояснил Илон Маск в сессии голосовых чатов Twitter Spaces.