Сегодня 19 марта 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → исходный код
Быстрый переход

Twitter открыл доступ к части исходного кода, включая алгоритмы рекомендаций

Всего через неделю после инцидента с утечкой части исходного кода Twitter на ресурсе GitHub администрация социальной сети выложила в одноимённый репозиторий уже официально одобренные к свободному распространению фрагменты кода. По замыслу Илона Маска (Elon Musk), подобная инициатива сделает Twitter похожей на Linux, поможет усовершенствовать алгоритмы и устранить ошибки при помощи сторонних разработчиков.

 Источник изображения: Reuters, Dado Ruvic

Источник изображения: Reuters, Dado Ruvic

Безусловно, соответствующая информация будет в большей степени интересна профессиональным разработчикам, поэтому Twitter одновременно опубликовала и инструкции по работе с исходным кодом. Наибольшей открытости пока удостоилась та часть исходного кода Twitter, которая имеет отношение к рекомендательным алгоритмам, позволяющим социальной сети предлагать пользователям наиболее интересные им записи.

Как поясняется, настроенная примерно по 48 млн параметров нейронная сеть ежедневно фильтрует сотни миллионов твитов, чтобы выделить из них примерно 1500 штук, наиболее соответствующих интересам каждого конкретного пользователя. Они затем фильтруются дополнительно, чтобы попасть в раздел рекомендаций «For You». Лента этого раздела на 50 % состоит из авторов, за активностью которых пользователь следит, и на 50 % — из незнакомых ему авторов.

По словам Илона Маска, команда Twitter готова обновлять рекомендательный алгоритм каждые 24 или 48 часов, опираясь на предложения пользователей и сторонних разработчиков. Критике уже подверглась практика присвоения отдельным пользователям маркера принадлежности к республиканцам и демократам по своим политическим убеждениям, но когда эта информация дошла до Маска, он заявил, что такого быть не должно. По словам сотрудников Twitter, эта устаревшая классификация никак на работу системы рекомендаций сейчас не влияет, и должна быть удалена в обозримом будущем.

В репозитории GitHub не будут доступны фрагменты исходного кода Twitter, которые позволяют понять, как работает рекомендательный механизм для демонстрации пользователям рекламы. Компания также защитит от посторонних глаз всю ту информацию, которая может быть использована злоумышленниками для доступа к пользовательским данным или для обхода механизмов защиты от злоупотребления незаконным контентом. «Люди будут находить много ошибок, но мы собираемся устранять их очень быстро. Примером для подражания в этом случае, которым мы вдохновлялись, является Linux в качестве операционной системы с открытым исходным кодом», — пояснил Илон Маск в сессии голосовых чатов Twitter Spaces.

Twitter через суд требует от GitHub раскрыть личность человека, допустившего утечку части исходного кода социальной сети

В прошлую пятницу, как сообщает CNBC со ссылкой на судебный документооборот, на страницах ресурса GitHub некий пользователь с псевдонимом FreeSpeechEnthusiast разместил фрагменты исходного кода Twitter без разрешения одноимённой компании, и теперь она пытается выйти на его след. В настоящее время фрагменты кода со страниц GitHub уже удалены.

 Источник изображения: Reuters, Dado Ruvic

Источник изображения: Reuters, Dado Ruvic

Фактически, как поясняет CNBC, утечка была перекрыта в тот же день по запросу Twitter. Представители последней ситуацию пока никак не комментируют, но из судебных документов известно, что они запросили у GitHub информацию, позволяющую идентифицировать личность пользователя, выложившего фрагменты исходного кода Twitter на страницах этого ресурса. По предварительным данным, он зарегистрировался на GitHub только в этом году, а в ходе описываемой утечки выложил на ресурсе данные кеша Twitter. Компания также требует от GitHub информацию о тех пользователях, которые успели скачать выложенную информацию.

Самое интересное, что Илон Маск (Elon Musk) ранее заявлял о готовности выложить в открытый доступ ту часть исходного кода Twitter, которая отвечает за рекомендации. Сделать это планировалось к 31 марта, хотя сам Маск и признал, что подобная практика будет смущать представителей компании на первых порах. Пока нет информации о том, имела ли пятничная утечка отношение к рекомендательным алгоритмам Twitter. Одновременно компанией запущено внутреннее служебное расследование, направленное на поиск виновных в инциденте.

«Приготовьтесь разочароваться»: Маск пообещал опубликовать исходный код рекомендательного алгоритма Twitter

Twitter собирается опубликовать исходный код своего рекомендательного алгоритма уже на следующей неделе. Об этом сообщил владелец и глава соцсети Илон Маск (Elon Musk) — предпринять этот шаг бизнесмен собирался ещё с апреля прошлого года, за полгода до покупки платформы.

 Источник изображения: Edar / pixabay.com

Источник изображения: Edar / pixabay.com

«Приготовьтесь сначала разочароваться, когда на следующей неделе будут опубликованы исходные коды нашего алгоритма, но он будет быстро улучшаться», — заявил Маск. Это решение поможет защитить Twitter от чрезмерного внимания американских политических сил к платформе и её техническим особенностям. Верховный суд США сейчас рассматривает дело о том, как YouTube рекомендовал рядовым пользователям видео с экстремистских каналов, а различные политические силы наперебой упражняются в предложениях подвергнуть анализу рекомендательные алгоритмы TikTok.

 Источник изображения: twitter.com/elonmusk

Источник изображения: twitter.com/elonmusk

Кроме того, после прихода Илона Маска в Twitter многие его политические оппоненты вообще ушли с платформы и перебрались в аналогичную ей децентрализованную соцсеть Mastodon с открытым исходным кодом. Публикация алгоритма Twitter поможет противостоять и этой тенденции. Примечательно, что основатель Twitter Джек Дорси (Jack Dorsey) в прошлом году выразил сожаление, что проект превратился в компанию, и добавил, что он должен был стать открытым протоколом. Своими соображениями Дорси как-то поделился с Маском, и тот его идею поддержал. Дорси решил реализовать эту идею в рамках проекта децентрализованной соцсети Bluesky, запущенного внутри Twitter. Работа над проектом продолжается и по сей день — первая тестовая версия может выйти в ближайшие недели.

Хакеры выставили на продажу украденный у Riot исходный код League of Legends, Teamfight Tactics и античит-платформы Packman

Киберпреступники, используя методы социальной инженерии и нейро-лингвистического программирования, получили доступ к инфраструктуре разработки Riot Games. Украденные гигабайты исходного кода сейчас выставлены на аукцион, так как компания не поддалась на шантаж и не пошла на переговоры с похитителями.

 Источник изображения: Riot Games

Источник изображения: Riot Games

Как мы сообщали ранее, в Riot Games подтвердили факт кибератаки, в результате которой хакеры получили доступ к исходникам, после чего прислали требование выкупа в $10 млн, угрожая выложить украденный программный код в общий доступ. Хотя атака, «возможно, вызовет проблемы в будущем», платить Riot отказалась, так как в компании уверены, что данные игроков и других пользователей скомпрометированы не были.

По данным аналитиков по информационной безопасности из компании VX-Underground, организаторы атаки взломали инфраструктуру Riot Games с помощью социальной инженерии — оказалось достаточно отправить SMS-сообщение одному из работников компании.

Злоумышленники утверждают, что провели 36 часов на серверах Riot Games до обнаружения взлома сотрудниками подразделения по защите информации. Однако добраться до главной цели атаки — исходников античит-технологии Riot Vanguard — преступникам не удалось.

В настоящий момент украденный исходный код League of Legends, Teamfight Tactics и устаревшей античит-платформы Packman выставлен на аукцион на популярном хакерском форуме. Начальная цена на League of Legends — $1 млн. Packman также можно купить отдельно — «всего» за $500 тыс. Там же можно скачать 1000-страничный PDF-файл, содержащий каталог исходных кодов общим объёмом 72,4 Гбайт. На основании этого документа журналисты издания Bleeping Computer пришли к выводу о правдивости хакерской информации.

Независимо подтвердить, что украдены исходники именно League of Legends, пока не удалось. В Riot отметили, что сейчас пытаются оценить перспективы утечки и сделать всё, чтобы максимально быстро вносить изменения в игровой код, если такая необходимость возникнет.

«Непонятно, смогут ли злоумышленники продать исходники по такой заоблачной цене, — отмечает Никита Павлов, эксперт по информационной безопасности компании SEQ. — Исходный код может быть использован для поиска уязвимостей, в теории угрожающих конечным устройствам запуском произвольного кода. Кроме того, исходники могут использоваться для создания новых читов — опять же, с помощью выявленных уязвимостей. Но эти "баги" можно найти с помощью обратной разработки, не тратя громадных денег. Так что захочет ли кто-то эти исходники покупать за миллион и больше — вопрос неоднозначный».

«Яндекс» нашёл в утекшем коде функцию скрытного включения микрофона у «Алисы»

Компания «Яндекс» представила первые результаты расследования утечки почти 45 Гбайт исходных кодов её проектов, которая произошла на прошлой неделе. Компания извинилась за случившееся, снова подтвердила подлинность утекших данных и рассказала, какие проблемы благодаря инциденту удалось выявить: начиная от тайных функций «Алисы» и заканчивая использованием «костылей» и расистских слов в коде.

«Яндекс» отметил, что опубликованные исходные коды действительно взяты из внутреннего репозитория компании, но соответствуют решениям из устаревшей версии репозитория. Другими словами, данные исходные коды отличаются от тех, которые используются сервисами «Яндекса» сейчас.

Наиболее пугающе выглядит признание «Яндекса», что в утекшем коде нашёлся фрагмент, который скрытно включает микрофон устройства с голосовым ассистентом «Алиса». Компания заверяет, что это тестовая версия алгоритма, и публичной она не была. Однако существует как минимум возможность включения такой функции на любом, в том числе пользовательском устройстве.

В заявлении компании сказано: «Опубликованные фрагменты кода содержат в том числе и тестовые алгоритмы, которые использовались только внутри "Яндекса" для проверки корректности работы сервисов. Например, для улучшения качества активации ассистента и уменьшения количества ложных срабатываний в бета-версии для сотрудников применяется настройка, которая включает микрофон устройства на несколько секунд в случайный момент без упоминания Алисы».

Ещё «Яндекс» сообщила, что благодаря инциденту выявила ряд нарушений её политик. Например, в коде нашлись контактные данные некоторых партнёров, в том числе водителей: контакты и номера водительских удостоверений передавались из одного таксопарка в другой. В сервисе «Яндекс Лавка» обнаружилась возможность ручной настройки рекомендаций любых товаров без добавления пометки о том, что данные рекомендации являются рекламными. А в сервисах Такси и Еда у отдельных групп пользователей оказалась приоритетная поддержка.

Ещё выяснилось, что разработчики «Яндекса» грешили использованием «костылей» — временных неоптимальных решений — для изменения логики работы сервисов вместо алгоритмов. Через такие временные решения исправляли отдельные проблемы в системе, отвечающей за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео.

Наконец, компания призналась, что «некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но были сами по себе оскорбительны для людей разных рас и национальностей». Речь идёт об использовании расистских слов в коде.

Компания отметила, что теперь изменит подход к разработке своих продуктов таким образом, чтобы сократить использование «костылей». Ещё компания пообещала сформировать новые стандарты и принципы технологической этики, и исправит фрагменты кода, которые будут им противоречить. Ещё было отмечено, что внутренняя среда разработки останется открытой и сохранится единый репозиторий. Также часть данных, которые не имеют отношения к алгоритмам и настройкам сервисов, получат дополнительную защиту.

У «Яндекса» украли и опубликовали 45 Гбайт исходных кодов — в компании взлом отрицают

В Сети появились архивы с исходными кодами проектов «Яндекса». В компании признали их подлинность — материалы действительно были похищены из внутреннего репозитория, — но отвергли предположения, что это произошло в результате взлома.

 Источник изображения: yandex.ru/company

Источник изображения: yandex.ru/company

Общий объём опубликованных злоумышленниками архивов (.tar.bz2) составил более 44,7 Гбайт — хакеры утверждают, что им удалось получить доступ к исходным кодам проектов «Яндекса» за исключением правил антиспама. Произошло это, по версии похитителей данных, в июле 2022 года. В архивах представлены материалы на языках Python, C++, Go и TypeScript, а также методы работы с данными Protocol Buffers, YAML и JSON, говорится в публикации на «Хабре». К странным особенностям информации в архивах относятся большое количество вспомогательного кода на Python 2.7 и единая дата всех файлов и папок — «2022-02-24», что расходится с заявлениями хакеров.

Представители «Яндекса» признали подлинность опубликованных материалов, но заявили, что взлома не было: «Служба безопасности "Яндекса" обнаружила в открытом доступе фрагменты кода из внутреннего репозитория. Однако, их содержимое отличается от текущей версии репозитория, которая используется в сервисах "Яндекса"».

В компании также подчеркнули, что репозитории не предназначены для хранения персональных данных пользователей, так что угрозы им нет, но всё же проводят по факту инцидента расследование: «Мы проводим внутреннее расследование о причинах попадания фрагментов исходного кода в открытый доступ, но не видим какой-либо угрозы для данных наших пользователей или работоспособности платформы». Знакомый с ситуацией источник сообщил, что исходные коды проектов «Яндекса» попали в Сеть по вине одного из сотрудников.

Стоит отметить, что утекшие исходные коды в большей степени интересны для изучения, но напрямую использовать и запустить на их основе «собственный «Яндекс» вряд ли получится. Здесь задействовано множество специфичных решений, в том числе заточенных под инфраструктуру самого «Яндекса». А для ИИ-проектов нет самого главного — натренированных нейросетей и набора данных для обучения тоже нет.

Опубликован исходный код платформы Apple Lisa OS, которой исполнилось 40 лет

В честь 40-летия выхода первого компьютера Apple Lisa американский Музей компьютерной истории с разрешения производителя опубликовал исходный код Lisa OS 3.1. Скачать его можно с официального сайта организации, предварительно заполнив форму на странице загрузки.

 Источник изображения: computerhistory.org

Источник изображения: computerhistory.org

Платформа Lisa Office System 3.1 вышла в апреле 1984 года — это был предшественник современных macOS и Windows. Пакет исходного кода на Pascal занимает 26 Мбайт — он включает более 1300 файлов с комментариями, структура файлов распределена по подкаталогам: в комплект вошли сама операционная система, приложения и среда разработки Lisa Toolkit.

Первый компьютер Apple Lisa поступил в продажу 19 января 1983 года. Это важный этап в истории компании — здесь впервые появился графический интерфейс с управлением мышью, перекочевавший в линейку Macintosh лишь год спустя. Несмотря на множество по-настоящему инновационных решений, продукт так и не стал популярным из-за отсутствия поддержки и стоимости $9995 (сегодня это около $30 300). Через год после выхода Macintosh с такими же возможностями Apple значительно снизила цену на Lisa.

Lisa, конечно, не был первым компьютером с графическим интерфейсом — это звание принадлежит Xerox Star — но именно здесь дебютировали такие важные черты оконных платформ как функция drag-and-drop, перемещение окон, корзина с удалёнными файлами, горизонтальное меню с выпадающими подменю, копирование и вставка ярлыков, панель управления, перекрытие окон и автоматическое отключение системы в одно касание.

Исследователи и преподаватели в образовательных организациях теперь смогут изучить, как Apple реализовала все эти возможности 40 лет назад — лицензия позволяет использовать код «только для некоммерческих, академических исследований, обучения и самообразования».

Исходные тексты операционной системы CP/M теперь доступны всем желающим

Стало известно, что энтузиастам ретросистем удалось урегулировать вопрос с лицензией на исходные тексты операционной системы CP/M, которая в 70-е годы прошлого века доминировала на компьютерах с 8-битными процессорами i8080 и Z80. Компания Lineo Inc, которой перешла интеллектуальная собственность разработчика CP/M в лице Digital Research, передала код ОС в руки сообщества cpm.z80.de в 2001 году.

 Источник изображения: Darwin Laganzon / pixabay.com

Источник изображения: Darwin Laganzon / pixabay.com

Лицензия на переданный код допускала его использование, распространение и изменение, но с пометкой, что эти права распространяются на участников упомянутого сообщества. Из-за этого разработчики связанных с CP/M проектов, таких как CP/Mish, не использовали оригинальный код ОС, поскольку это могло привести к нарушению лицензии. Один из энтузиастов связался с президентом компаний Lineo и DRDOS Брайаном Спарксом и попросил его уточнить, что конкретно имелось ввиду при упоминании отдельного сайта в лицензии.

В ответ на это Спаркс сообщил, что изначально он не планировал передавать код ОС только одному сайту, и упоминание конкретной площадки является лишь отдельным частным случаем. Он также дал официальные разъяснения по данному вопросу, в которых от имени компании, владеющей интеллектуальными правами на CP/M, указал, что определённые в лицензии условия применимы ко всем желающим. Это означает, что текст лицензии по своей сути аналогичен лицензии MIT.

Напомним, исходные тексты CP/M написаны на языке PL/M и ассемблере. Ознакомиться с этой операционной системой можно с помощью эмулятора, работающего в веб-браузере.

NVIDIA перевела свои драйверы для Linux в разряд открытого ПО

Компания NVIDIA сообщила о выпуске пакета графических драйверов версии 515.43.04 с открытым кодом для Linux. Он распространяется в виде свободного программного обеспечения с двойной лицензией GPLv2/MIT. Иными словами, его можно модифицировать и распространять.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Компания отмечает, что релиз R515 содержит предварительно скомпилированные версии как драйвера с закрытым исходным кодом, так и модули ядра с открытым исходным кодом. Эти версии являются взаимоисключающими, и пользователь может сделать выбор во время установки.

Драйвер умеет работать с библиотеками пользовательского окружения: CUDA, OpenGL и Vulkan. Однако они все ещё закрыты, и при этом их версия должна соответствовать версии драйвера — не получится использовать стек библиотек из прошлого релиза.

Драйвер с открытым исходным кодом доступен для GPU на архитектуре Turing (GeForce GTX 16-й серии и GeForce RTX 20-й серии) и Ampere (GeForce RTX 30-й серии). Для профессиональных карт, предназначенных для работы в дата-центрах, код уже «отполирован» и готов к стабильной работе. «Исходники» для рабочих станций и линейки GeForce пока находятся в альфа-стадии тестирования. Более функциональными и стабильными они станут со следующими релизами. Всё необходимое ПО можно найти в репозитории NVIDIA Open GPU на GitHub.

Перевод драйверов в разряд открытого программного обеспечения упрощает работу с видеокартами NVIDIA, а также может повысить безопасность драйверов и улучшить интеграцию с Linux. Помимо упрощённой работы с отладкой софта, открытие исходного кода ведёт к улучшению игровой производительности фирменных ускорителей NVIDIA в Linux. В рамках пресс-релиза NVIDIA разработчики из Canonical, Red Hat и SUSE сообщили о планах распространения пакетов с открытыми модулями для своих дистрибутивов.

Проприетарные драйверы видеокарт NVIDIA для GNU/Linux долгое время были недоступны для изучения их содержимого. Это настоящий альтруизм, или на решение NVIDIA повлияли угрозы и вымогательства хакеров из группировки LAPSUS$, которые ранее взломали сервера компании и украли около 250 Гбайт конфиденциальных данных, включая исходники технологии масштабирования DLSS? Злоумышленники потребовали от NVIDIA перевести свои графические драйверы в разряд открытого программного обеспечения, или в противном случае они грозились опубликовать другие секреты производителя графических процессоров.

Также можно напомнить, что несколько дней назад сразу две команды разработчиков ПО для майнинга NiceHash и NBMiner сообщили о разработке алгоритмов, позволяющих полностью обойти LHR-защиту графических ускорителей GeForce RTX 30-й серии. Алгоритмы работают не только с операционной системой Windows, но также и в среде Linux. И теперь NVIDIA объявляет о выпуске драйверов с открытым кодом для Linux. Выглядит, как минимум подозрительно.


window-new
Soft
Hard
Тренды 🔥
На смену Family Sharing в Steam придут «Семейные группы» с общей библиотекой, контролем за детьми и привязкой к региону 21 мин.
Nvidia запустила Quantum Cloud — облачный симулятор квантового компьютера для исследований 41 мин.
Telegram выгодно для себя привлёк $330 млн через продажу облигаций 44 мин.
Более 500 российских программистов приняли участие в совместном хакатоне Хоум Банка и «Сколково» 2 ч.
Всё своё ношу с собой: Nvidia представила контейнеры NIM для быстрого развёртывания оптимизированных ИИ-моделей 9 ч.
Nvidia AI Enterprise 5.0 предложит ИИ-микросервисы, которые ускорят развёртывание ИИ 10 ч.
NVIDIA запустила облачную платформу Quantum Cloud для квантово-классического моделирования 10 ч.
NVIDIA и Siemens внедрят генеративный ИИ в промышленное проектирование и производство 10 ч.
SAP и NVIDIA ускорят внедрение генеративного ИИ в корпоративные приложения 11 ч.
Microsoft проведёт в мае презентацию, которая положит начало году ИИ-компьютеров 12 ч.
Смарт-часы Xiaomi Watch S3 и Redmi Watch 4 для любителей активного образа жизни и ТВ-приставка Mi Box S 2 Gen для развлечений 56 мин.
SK hynix запустила массовое производство стеков памяти HBM3E — первой её получит Nvidia 2 ч.
Смартфоны Redmi Note 13 и 13 Pro+ 5G, планшет Xiaomi Pad 6 расширят возможности для работы и развлечений 3 ч.
Зарубежные поставщики Intel и TSMC не спешат строить свои предприятия в Аризоне 3 ч.
Nvidia и Synopsys внедрили искусственный интеллект в сфере литографической подготовки производства чипов 4 ч.
NVIDIA представила облачную платформу для исследований в сфере 6G 11 ч.
Ускорители NVIDIA H100 лягут в основу японского суперкомпьютера ABCI-Q для квантовых вычислений 11 ч.
NVIDIA показала цифрового двойника нового дата-центра с ИИ-ускорителями Blackwell 11 ч.
NVIDIA B200, GB200 и GB200 NVL72 — новые ускорители на базе архитектуры Blackwell 11 ч.
Новая статья: Система жидкостного охлаждения MSI MAG CoreLiquid E240: альтернатива суперкулеру? 12 ч.