Сегодня 30 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → репозиторий

Данные тысяч ставших частными репозиториев GitHub всё ещё доступны в Copilot, выяснили исследователи

Согласно исследованию израильской компании по кибербезопасности Lasso, специализирующейся на возникающих угрозах генеративного ИИ, данные, которые были в открытом доступе в интернете хотя бы на мгновение, могут ещё продолжительное время оставаться у онлайн-чат-ботов генеративного ИИ, таких как Microsoft Copilot, после того, как доступ к ним был закрыт.

 Источник изображения: Windows/unsplash.com

Источник изображения: Windows/unsplash.com

Эта проблема касается тысяч некогда открытых репозиториев GitHub ряда крупнейших компаний, включая Microsoft, которые с тех пор стали закрытыми, сообщили в Lasso ресурсу TechCrunch.

По словам соучредителя Lasso Офира Дрора (Ophir Dror), компания обнаружила, что контент из её собственного репозитория GitHub появился в Copilot, поскольку он был проиндексирован и кеширован поисковой системой Bing от Microsoft. Этот репозиторий был ошибке открыт в течение короткого периода времени и сейчас является частным. При попытке получить к нему доступ на GitHub появляется сообщение «Страница не найдена».

«На Copilot, как ни странно, мы нашли один из наших собственных закрытых репозиториев, — рассказал Дрор. — Если бы я просматривал веб-страницы, я бы не увидел этих данных. Но любой человек, задав Copilot правильный вопрос, может их получить».

В связи с этим Lasso провела расследование, в ходе которого извлекла список репозиториев, бывших в открытом доступе какое-то время в 2024 году, и определила те, которые с тех пор были удалены или получили статус приватных. Используя механизм кеширования Bing, компания обнаружила, что более 20 тыс. частных репозиториев GitHub более 16 тыс. организаций по-прежнему доступны через Copilot. В частности, это касается Amazon Web Services, Google, IBM, PayPal, Tencent и Microsoft.

Дрор рассказал, что Lasso связалась со всеми компаниями, которые «серьёзно пострадали» от утечки данных, и посоветовала им ротировать или отозвать все скомпрометированные ключи.

Lasso уведомила Microsoft о своих выводах в ноябре 2024 года, но софтверный гигант сообщил ей, что относит проблему к «низкой степени серьезности», заявив, что такое поведение при кешировании «приемлемо». Microsoft отметила, что больше не включает ссылки на кеш Bing в результаты поиска с декабря 2024 года.

Тем не менее Lasso утверждает, что, хотя функция кеширования была отключена, Copilot всё ещё имеет доступ к данным, несмотря на то, что они не отражались в результатах веб-поиска.

Проект российского аналога GitHub отложен — на него до сих пор не перечислили средства

Из-за отсутствия финансирования эксперимент с созданием российского аналога GitHub отложен на неопределённый срок, хотя платформу планировали запустить уже в апреле 2024 года. В декабре 2022 года в Минцифры предлагали направить на финансирование проекта 1,2 млрд руб. из фонда «Росинфокоминвест», которые хранились на его счетах с 2007 года, но средства так и не были перечислены, пишут «Ведомости» со ссылкой на источники в двух компаниях.

 Источник изображений: StockSnap / pixabay.com

Источник изображений: StockSnap / pixabay.com

Потребность в создании отечественной платформы для совместной разработки IT-проектов стала очевидной после блокировки крымских учётных записей на GitHub — глава правительства Михаил Мишустин выступил с соответствующим предложением в сентябре 2021 года. В октябре 2022 года было опубликовано постановление правительства, согласно которому разработка отечественной платформы должна была идти с ноября 2022 по конец апреля 2024 года. Единый репозиторий помог бы накопить кодовую базу внутри страны, обеспечив России цифровой суверенитет.

В декабре Минцифры предложило направить на реализацию проекта средства «Росинфокоминвеста» — фонд был создан в 2007 году, при открытии он получил 1,5 млрд, но до 2019 года потратил лишь 75 млн руб. Средства должен был получить Российский фонд развития информационных технологий (РФРИТ) и перенаправить их в АНО «Открытый код», учреждённую VK, «Ростелекомом», университетом «Иннополис», группой T1 и другими структурами. Но в РФРИТ деньги так и не поступили.

В конце мая 2023 года Минцифры был утверждён список из 82 участников эксперимента по созданию отечественного репозитория — в него вошли региональные и федеральные органы власти, «Тинькофф банк», «Мосбиржа», «Сбертех» (входит в «Сбер»), компании-разработчики и частные лица.

При этом с 2022 года было запущено несколько частных платформ совместной разработки и хостинга кода: «РТК-Феникс» и «Лукоморье» от «Ростелекома», «Сфера» от T1, GitFlame от «Иннополиса», «Мосхаб» правительства Москвы, Gitflic от ГК «Астра» и GitVerse от «Сбера». Об аналогичных планах сообщали VK и «Росатом», а также «Банк России» — для финсектора. С появлением частных площадок потребность в единой платформе отпала, считают опрошенные «Ведомостями» эксперты. Но эти проекты обозначили проблему разобщённости разработчиков, которую в АНО «Открытый код» предлагают решать, реализовав возможность использовать на них одну учётную запись и единый способ верификации — сегодня вход на разные платформы может производиться через личный кабинет на mos.ru, Sber ID, VK ID, ЕСИА, электронную почту и номер телефона.

В проектах с открытым исходным кодом участвуют около 1 млн российских разработчиков — при этом на GitHub в 2023 году численность русскоязычного сообщества составляла 2,5 млн пользователей. Вклад российских разработчиков в проекты с открытым кодом в мировом масштабе составляет 7 % при численности 3 % от всей аудитории — то есть вклад оказывается выше численности, отметили в АНО «Открытый код». Расходы на работу единого репозитория с учётом аренды мощностей и обеспечения отказоустойчивости за три года составили бы около 300–500 млн руб., подсчитали эксперты.


window-new
Soft
Hard
Тренды 🔥
Google AI Overviews до недавнего времени жил в 2024 году — после огласки проблему быстро устранили 7 мин.
У россиян стали вдвое чаще угонять аккаунты от ChatGPT и других ИИ-сервисов 47 мин.
Благодаря ИИ Microsoft выбилась из отстающих в лидеры по темпам роста акций 2 ч.
AMD выпустила необязательный драйвер с поддержкой F1 25 2 ч.
«Хоть завтра, но с тем же успехом — через год»: датамайнер предупредил, что Valve может анонсировать Half-Life 3 «в любой момент» 2 ч.
Комиссия по ценным бумагам и биржам США передумала судиться с Binance и её основателем 2 ч.
Ассоциация больших данных (АБД) России выступила против доступа силовых ведомств к базам данных бизнеса 2 ч.
На YouTube появится поиск объектов из коротких видео Shorts 4 ч.
Capcom наконец удалила Games for Windows Live из Lost Planet 2 в Steam, но это сломало онлайновый кооператив и сохранения 5 ч.
«Лучший сезон в Fortnite»: Elden Ring Nightreign стартовала в Steam со «смешанными» отзывами и вторым по успешности пиковым онлайном для FromSoftware 6 ч.
В России успешно испытали спутниковую связь 5G — наземная сеть 5G в стране всё ещё не запущена 2 мин.
Репортаж со стенда SAMA на выставке Computex 2025: блоки питания, СЖО, кулеры для процессоров и корпуса 2 ч.
Nokia представила шлюзы Beacon 4 и Beacon 9 с поддержкой Wi-Fi 7 2 ч.
Мировые продажи смартфонов замедлят рост в этом году из-за повышения таможенных тарифов США и другими странами 3 ч.
Илон Маск рассказал, когда Starship впервые полетит на Марс — с вероятностью 50 % 4 ч.
Foxconn решила, что ИИ и электромобили помогут ей компенсировать потери из-за роста таможенных пошлин 5 ч.
ИИ обгонит майнинг биткоина по потреблению энергии в мировом масштабе уже к концу 2025 года 5 ч.
Японская Renesas передумала выпускать силовые полупроводники на базе карбида кремния 5 ч.
Смартфон iQOO Neo 10 дебютировал в России по цене от 38 тыс. рублей 5 ч.
Pure Storage превзошла ожидания Уолл-стрит, но сотрудничество с гиперскейлерами пока не отразилось на её доходах 6 ч.