Опрос
|
реклама
Быстрый переход
«Википедия» выпустила набор данных для обучения ИИ, чтобы боты не перегружали её серверы скрейпингом
17.04.2025 [16:43],
Владимир Мироненко
Фонд Wikimedia (некоммерческая организация, управляющая «Википедией») предложил компаниям вместо веб-скрейпинга контента «Википедии» с помощью ботов, который истощает её ресурсы и перегружает серверы трафиком, воспользоваться набором данных, специально оптимизированным для обучения ИИ-моделей. ![]() Источник изображения: Oberon Copeland @veryinformed.com/unsplash.com Wikimedia объявил о заключении партнёрского соглашения с Kaggle, ведущей платформой для специалистов в области Data Science и машинного обучения, принадлежащей Google. В рамках соглашения на ней будет опубликована бета-версия набора данных «структурированного контента “Википедии” на английском и французском языках». Согласно Wikimedia, набор данных, размещённый Kaggle, был «разработан с учётом рабочих процессов машинного обучения», что упрощает разработчикам ИИ доступ к машиночитаемым данным статей для моделирования, тонкой настройки, сравнительного анализа, выравнивания и анализа. Содержимое набора данных имеет открытую лицензию. По состоянию на 15 апреля набор включает в себя обзоры исследований, краткие описания, ссылки на изображения, данные инфобоксов и разделы статей — за исключением ссылок или неписьменных элементов, таких как аудиофайлы. Как сообщает Wikimedia, «хорошо структурированные JSON-представления контента “Википедии”», доступные пользователям Kaggle, должны быть более привлекательной альтернативой «скрейпингу или анализу сырого текста статей». На данный момент у Wikimedia есть соглашения об обмене контентом с Google и Internet Archive, но партнёрство с Kaggle позволит сделать данные более доступными для небольших компаний и независимых специалистов в сфере Data Science. «Являясь площадкой, к которой сообщество машинного обучения обращается за инструментами и тестами, Kaggle будет рада стать хостом для данных фонда Wikimedia», — сообщила Бренда Флинн (Brenda Flynn), руководитель по коммуникациям в Kaggle. Grok научился запоминать предпочтения пользователя
17.04.2025 [12:33],
Павел Котов
Стартап Илона Маска (Elon Musk) xAI представил функцию «памяти» для Grok, тем самым приблизив его к ведущим конкурентам, таким как OpenAI ChatGPT и Google Gemini. Благодаря новой возможности чат-бот сможет запоминать предпочтения пользователя. ![]() Источник изображения: Mariia Shalabaieva / unsplash.com Компания xAI анонсировала функцию «памяти» для Grok, с которой он сможет запоминать подробности прежних разговоров с пользователем. Если попросить Grok дать рекомендации, его ответы будут персонализированными — предполагается, что у пользователя уже есть некоторый опыт общения с системой, и у той была возможность изучить его предпочтения. Аналогичная функция памяти у ChatGPT есть уже продолжительное время; недавно OpenAI усовершенствовала её механизмы и дала системе возможность учитывать историю всех переписок с пользователем. Собственная долговременная память есть и у Google Gemini, который адаптирует ответы под отдельных пользователей. «Воспоминания прозрачны. Вы можете в точности увидеть, что знает Grok, и выбрать, что ему забыть», — пояснили в xAI. Функция памяти доступна на собственном сайте чат-бота и в приложениях под Android и iOS; пользователи из ЕС и Великобритании воспользоваться ей пока не смогут. Отключить функцию можно в настройках чат-бота; отдельные «воспоминания» удаляются через веб-интерфейс — вскоре функция дебютирует в приложении для Android. Сейчас идёт работа над добавлением функции памяти в Grok на платформе X. В Microsoft разработали сверхэффективную ИИ-модель, которая запускается на CPU
17.04.2025 [11:15],
Павел Котов
Исследователи из Microsoft сообщили о разработке самой масштабной однобитной модели искусственного интеллекта — такой архитектурный подход называется «битнет». Модель BitNet b1.58 2B4T выложена в открытый доступ по лицензии MIT, и для её работы достаточно центрального процессора, в том числе Apple M2. ![]() Системы «битнет» — это сжатые модели, предназначенные для запуска на оборудовании невысокой производительности. В случае стандартных моделей веса — значения, которые определяют её внутреннюю структуру, — зачастую квантуются. При квантизации уменьшается количество битов, необходимых для представления весов, а модели получают возможность быстрее работать на системах с меньшим объёмом памяти. Битнет предполагает квантование веса в три значения: «-1», «0» и «1», то есть в теории такие модели оказываются значительно эффективнее с точки зрения памяти и вычислительных ресурсов, чем большинство современных систем ИИ. BitNet b1.58 2B4T, утверждают в Microsoft, — это первая модель на основе данной архитектуры, у которой 2 млрд параметров, причём параметры в значительной степени — то же, что веса. Она была обучена на массиве данных в 4 трлн токенов, что, по оценкам, эквивалентно примерно 33 млн книг. BitNet b1.58 2B4T не уступает аналогичным моделям того же размера: она превзошла Meta✴ Llama 3.2 1B, Google Gemma 3 1B и Alibaba Qwen 2.5 1.5B в тестах GSM8K (математика уровня начальной школы) и PIQA (оценка здравого смысла). При этом модель в некоторых случаях работает вдвое быстрее аналогов и использует меньше памяти. Но есть один нюанс: для достижения максимальной производительности модели необходим разработанный Microsoft фреймворк bitnet.cpp, который поддерживает лишь определённое оборудование. В списке поддерживаемых чипов отсутствуют графические процессоры, без которых современная отрасль ИИ немыслима. Таким образом, архитектурный подход «битнет» представляется перспективным направлением, но препятствием пока является аппаратная совместимость. Microsoft научила бесплатный Copilot «подсматривать» за тем, что пользователь делает в браузере Edge
17.04.2025 [10:40],
Владимир Фетисов
Функция Copilot Vision, которая позволяет фирменному ИИ-помощнику Microsoft просматривать и понимать происходящее на экране пользовательского устройства, теперь доступна для бесплатного использования в браузере Edge. Об этом сообщил глава подразделения Microsoft AI Мустафа Сулейман (Mustafa Suleyman). ![]() Источник изображения: Microsoft Он также рассказал, что функция Copilot Vision позволяет ИИ-алгоритму буквально видеть то, что видит пользователь на экране. Это нововведение может пригодится в разных ситуациях, например, Copilot может подсказывать выведенный на экран рецепт приготовления какого-то блюда. При этом он не будет самостоятельно переходить по ссылкам или выполнять какие-то действия от имени пользователя. Более продвинутые общесистемные функции Copilot Vision останутся доступными только платным подписчикам Copilot Pro. С этой подпиской Copilot Vision выходит за пределы Edge и может помогать при взаимодействии с другими приложениями. Например, ИИ-помощник подскажет, как использовать ту или иную функцию Photoshop, расскажет, как пройти трудное место в игре, и др. Для начала использования Copilot Vision в браузере необходимо с помощью Edge открыть соответствующий раздел на сайте Microsoft и подтвердить своё согласие на использование ИИ-функции. После этого будет достаточно открыть боковую панель Copilot и нажать на ярлык с изображением микрофона. Начало работы функции Copilot Vision будет сопровождаться характерным звуковым сигналом, а в браузере также немного изменится цветовое оформление. Согласно имеющимся данным, Microsoft регистрирует ответы Copilot, но не собирает пользовательскую информацию, изображения или содержание страниц во время взаимодействия с Copilot Vision. Для отключения функции достаточно закрыть окно браузера. Новая статья: Расширяя границы возможностей: обзор российских студенческих разработок в сфере искусственного интеллекта
17.04.2025 [00:07],
3DNews Team
Данные берутся из публикации Расширяя границы возможностей: обзор российских студенческих разработок в сфере искусственного интеллекта OpenAI выпустила o3 и o4-mini — самые мощные рассуждающие модели, которые умеют «думать» картинками
16.04.2025 [22:30],
Андрей Созинов
Компания OpenAI объявила о выпуске двух новых моделей искусственного интеллекта, в которых основной акцент сделан на улучшение способности к рассуждению. Модель OpenAI o3 разработчики называют «самой мощной моделью со способностью к рассуждению». А OpenAI o4-mini — это более компактная и быстрая рассуждающая модель, которая демонстрирует «впечатляющую производительность для своего размера и стоимости». ![]() Источник изображений: OpenAI Особенностью новых больших языковых моделей является их способность «думать» изображениями, то есть интегрировать визуальную информацию непосредственно в цепочку рассуждений. Это особенно полезно при работе с эскизами или контентом на электронных досках. Модели также умеют изменять изображения — увеличивать, поворачивать и анализировать их в процессе обработки. ![]() OpenAI также сообщает, что новые модели смогут использовать все инструменты ChatGPT, включая веб-поиск, анализ и генерацию изображений, а также чтение файлов. Эти функции становятся доступны с сегодняшнего дня пользователям тарифов ChatGPT Plus, Pro и Team, использующим модели o3, o4-mini и o4-mini-high. Поддержка инструментов для самой мощной модели o3-pro ожидается «в течение нескольких недель». При этом текущие модели o1, o3-mini и o3-mini-high будут постепенно выведены из эксплуатации в рамках указанных тарифных планов. ![]() ![]() Сегодняшние анонсы последовали за презентацией флагманской модели ИИ GPT-4.1 — преемницы GPT-4o, состоявшейся в понедельник. Игровой ИИ-помощник от Microsoft стал доступен сотрудникам Xbox — подробности тестовой версии Copilot for Gaming
16.04.2025 [21:40],
Дмитрий Рудь
Старший редактор The Verge Том Уоррен (Tom Warren) со ссылкой на свои источники сообщает, что Microsoft приступила к тестированию среди сотрудников ранней версии анонсированного в марте игрового ИИ-помощника Copilot for Gaming. По данным информаторов Уоррена, работники Microsoft получили доступ к Copilot в мобильном приложении Xbox — эта версия чат-бота напоминает существующую, но предназначена для интеграции с учётной записью Xbox. Сейчас Copilot for Gaming включает возможность «подтянуть» последние достижения, получить рекомендации игр на основе своей истории и советы по прохождению. Чат-бота также можно использовать для загрузки/установки игр на консоль Xbox. Как и в случае с существующей версией Copilot, пользователь может напечатать свой запрос чат-боту или озвучить вопрос. Среди доступных голосов ассистента фигурируют энергичный, мудрый, спокойный и мужественный. В будущем Microsoft планирует добавить в игровой Copilot анимированные версии персонажей для помощника и функцию Copilot Vision, которая позволит ИИ «видеть» экран пользователя и помогать ему в ходе геймплея. Стартовая версия Copilot for Gaming станет доступна участникам программы Xbox Insider уже совсем скоро (обещали в апреле). Microsoft собирается активно дорабатывать ИИ-помощника на основе пользовательских отзывов. Согласно мартовскому анонсу, в конечном итоге Copilot for Gaming будет доступен на разных устройствах, включая консоли Xbox, в качестве ассистента и компаньона, который сможет давать советы по играм, их загрузке, запуску и многому другому. Grok получил функцию Studio для совместной работы ИИ и пользователя над документами и кодом
16.04.2025 [17:56],
Павел Котов
Чат-бот с искусственным интеллектом Grok, созданный стартапом Илона Маска (Elon Musk) xAI, получил новую функцию, которая позволит ему участвовать в создании документов и приложений наравне с пользователем. Функция, получившая название Grok Studio, доступна для пользователей бесплатной и платной версий Grok на отдельном сайте проекта. ![]() Источник изображения: x.com/grok «Теперь Grok может генерировать документы, код, отчёты, и браузерные игры. Grok Studio открывает ваши материалы в отдельном окне, что позволяет вам и Grok совместно работать над ними», — гласит опубликованный в соцсети X анонс новой функции. Это уже не первый чат-бот с ИИ, которому выделили отдельное пространство для совместной работы с пользователем: в версии OpenAI ChatGPT эта функция называется Canvas, а у Anthropic это Artifacts for Claude. Существенных отличий Grok Studio от служб конкурентов, видимо, нет. Сервис позволяет просматривать элементы HTML и запускать код на языках Python, C++ и JavaScript — все материалы демонстрируются в окне справа от ответов Grok. Возможности Grok Studio обещают дополнительно расшириться за счёт ещё одной новой функции чат-бота — интеграции с «Google Диском». Она позволяет отправлять файлы в Grok прямо из облачного хранилища. Чат-бот работает с текстовыми документами, электронными таблицами и презентациями. Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя
16.04.2025 [17:49],
Павел Котов
Microsoft добавила в Copilot Studio новую функцию «Использовать компьютер» — она позволяет агентам искусственного интеллекта взаимодействовать с веб-сайтами и настольными приложениями. Copilot Studio, как ранее OpenAI Operator и аналогичная функция Anthropic Claude, может использовать сайты и локальное ПО как средства для автоматизации рабочих задач. ![]() Источник изображений: microsoft.com «Использование компьютера позволяет агентам взаимодействовать с сайтами и настольными приложениями, нажимая кнопки, выбирая [пункты] меню и вводя текст в экранные поля. Агенты выполняют задачи, даже когда нет API для прямого подключения к системе. Если приложение может использовать человек, то может и агент», — рассказали о новой функции в Microsoft. В Copilot Studio можно создавать агентов ИИ, способных автоматизировать ввод данных, проводить маркетинговые исследования или обрабатывать бухгалтерские документы. ИИ, уверяют в Microsoft, обучен обнаруживать, когда расположение кнопок в приложениях или на сайтах меняется, и продолжает работать без сбоев. ![]() Ранее похожую функцию Actions компания Microsoft добавила в потребительскую версию Copilot — действия выполняются в фоновом режиме, когда человек занят другими задачами. Copilot может бронировать столки в ресторане, покупать билеты на мероприятия и товары в интернет-магазинах. При этом возможности Actions ограничены установленными партнёрами Microsoft, а Copilot Studio предлагает бесплатную работу с бо́льшим числом сайтов и приложений. ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов
16.04.2025 [16:42],
Павел Котов
В 2024 году Google заблокировала на рекламной платформе 39,2 млн учётных записей — более чем в три раза больше, чем в предыдущем году. Такого результата компания добилась в рамках последней операции, направленной на борьбу с мошенничеством в рекламе. ![]() Источник изображений: Google Большие языковые модели помогли учесть такие сигналы как выдача себя за другое лицо и не соответствующие действительности платёжные реквизиты — теперь компания уверена, что способна блокировать «подавляющее большинство» рекламных аккаунтов ещё до того, как их реклама начнёт демонстрироваться. В прошлом году Google внесла более 50 улучшений в большие языковые модели для улучшения механизмов безопасности на всех своих платформах. Компания собрала команду из более чем сотни экспертов, включая работников отдела Ads Safety, подразделения Trust and Safety и учёных из DeepMind — они проанализировали мошеннические схемы с присутствием фейков в рекламе, в том числе поддельных изображений известных людей, и разработали контрмеры. В прошлом году компания развернула технические контрмеры и внесла более 30 обновлений политики для рекламодателей и площадок. Это помогло заблокировать более 700 тыс. нарушающих правила учётных записей, и число жалоб на фейки в рекламе снизилось на 90 %. ![]() Только в США Google за минувший год заблокировала 39,2 млн аккаунтов рекламодателей и удалила 1,8 млрд рекламных объявлений — основные нарушения были связаны со злоупотреблениями платформой, неправомерным использованием товарных знаков, заявлениями в области здравоохранения, персонализацией рекламы и искажением фактов. В Индии, самой густонаселённой стране мира и втором по величине интернет-рынке после Китая по количеству пользователей, в прошлом году компания заблокировала 2,9 млн учётных записей — по этому критерию страна стала второй в мире после США. Здесь были удалены 247,4 млн рекламных объявлений; самые частые нарушения были связаны с финансовыми услугами, неправомерным использованием товарных знаков, злоупотреблением рекламными сетями, персонализацией рекламы и азартными играми. Из всех случаев блокировки рекламных аккаунтов Google заблокировала 5 млн учётных записей за нарушения, связанные с мошенничеством, и около полумиллиарда объявлений по той же причине. В 2024 году, который в большинстве стран мира оказался годом выборов, компания проверила более 8900 новых рекламодателей по данному направлению и удалила 10,7 млн предвыборных объявлений. В общей сложности Google за минувший год заблокировала 5,1 млрд объявлений и удалила 1,3 млрд страниц — для сравнения, в 2023 году это были 5,5 млрд объявлений и 2,1 млрд страниц на сайтах издателей. Снижение этих показателей указывает на улучшение профилактических мер, считают в компании. Из-за работы механизмов раннего обнаружения и блокировки учётных записей, нарушающих условия обслуживания, создаются меньше рекламных объявлений с нарушениями. Прочие ограничения были наложены на 9,1 млрд объявлений. В Google не исключают и собственных ошибок, поэтому предусмотрена процедура подачи апелляции — каждый спорный случай рассматривает уже человек. Opera Mini получила ИИ-помощника Aria AI
16.04.2025 [13:14],
Павел Котов
Норвежский разработчик браузеров Opera сообщил о выходе в общий доступ помощника с искусственным интеллектом Aria AI для пользователей Opera Mini на Android. Воспользоваться им смогут владельцы недорогих устройств и абоненты, у которых тарифы с небольшими объёмами трафика. ![]() Источник изображения: opera.com Aria AI поможет пользователям узнать последние новости и прочую информацию по разным темам, поддерживается генерация изображений. Для получения ответов на запросы пользователей инженеры Opera подключили модели ИИ от OpenAI и Google. Браузер Opera Mini дебютировал в 2005 году — он помогает пользователям экономить данные при веб-сёрфинге. Этот принцип не будет нарушаться даже с появлением ИИ-помощника в приложении, уверяют разработчики. За минувшие годы компания заключила соглашения с несколькими телекоммуникационными компаниями в Африке, которые предложили бесплатный трафик для пользователей Opera Mini. В минувшем году Opera пришлось закрыть программу в Кении — местные власти ограничили показ рекламы в интерфейсе браузера. К настоящему моменту число загрузок Opera Mini превысило 1 млрд — у браузера более 100 млн пользователей по всему миру. Только с начала этого года приложение Opera Mini скачали 7,1 млн раз, гласит статистика аналитической компании Appfigures. Помимо ИИ-помощника, разработчики Opera экспериментируют и с другими функциями на основе ИИ: это, в частности, управление вкладками при помощи команд естественной речью и запуск агентов, выполняющих операции в автономном режиме. Шведские учёные обучили ИИ переводу с лошадиного
16.04.2025 [12:40],
Павел Котов
Группа учёных из Швеции разработала модель искусственного интеллекта Dessie, предназначенную для перевода языка тела лошадей в понятный для человека формат. В основу решения легли технологии машинного обучения и синтетические изображения. ![]() Источник изображений: Helena Lopes / unsplash.com Во время клинических осмотров ветеринары часто изучают визуальные сигналы, которые подают животные, но этот способ не всегда надёжен: лошадь может перенести боль на другую ногу, изменить распределение веса или позу. Её поведение может указывать на проблемы ортопедического характера, расстройства поведения или признаки травмы. Традиционные средства диагностики, в том числе рентген и МРТ, дают результаты уже после того, как проблема возникла. Цель Dessie — прочитать язык тела лошади, чтобы обнаружить признаки проблемы заранее. Во время работы модель в реальном времени преобразует плоские изображения в трёхмерные, которые отражают форму, позу и движение лошади. Это не просто визуализация, а попытка осуществить перевод с выразительного языка тела. При создании Dessie использовалось обучение с разделением факторов. В традиционных моделях вся информация — поза, форма, фон, освещение — идёт в едином потоке, что может сбить ИИ с толку и затруднить фокусировку на главном — самой лошади. Обучение с разделением факторов позволяет учитывать каждую особенность отдельно: форма представляется одной сущностью, поза — другой, а не имеющий отношения к задаче фоновый шум игнорируется. Генерируемые Dessie трёхмерные объекты отличаются не только высокой детализацией, но и надёжностью. ИИ помогает исследователям изолировать шаблоны движения, не отвлекаясь на окружающие объекты и различия в освещении. Dessie не требует высококачественных камер и маркеров на теле лошади — ей достаточно одной простой камеры и базовых видеоматериалов. Воспользоваться технологией могут работники сельских клиник, не имеющие доступа к дорогостоящим средствам визуализации. ![]() Для обучения ИИ исследователям потребовались огромные объёмы визуальных данных. Поскольку собрать реальные изображения лошадей разных пород в различных позах и при разном освещении сложно, они разработали генератор синтетических данных DessiePIPE. Он способен создавать неограниченное количество изображений лошадей с использованием трёхмерной модели и текстур, сгенерированных ИИ, на основе характеристик разных пород. Это позволило авторам проекта обучить Dessie особенностям движений лошадей без необходимости изучения тысяч реальных животных: DessiePIPE визуализирует лошадей, которые ходят, едят, встают на дыбы или отдыхают — в различных фонах и условиях освещения. Система также создаёт пары изображений для сопоставления, отличающиеся лишь одним параметром — например, формой или позой, — чтобы модель научилась замечать тонкие различия. В результате Dessie научилась распознавать малые изменения в движении и стала эффективнее обобщать данные для новых условий. Лошади сигнализируют о болевых ощущениях незначительными изменениями в походке и позе, заметными лишь опытному ветеринару. Dessie переводит эти сигналы в объективные трёхмерные показатели, помогая выявлять проблемы на ранней стадии. Она создаёт цифровую запись позы и движений животного, которую можно просматривать многократно, отслеживать в динамике и передавать в другие клиники. Несмотря на то что Dessie обучалась на синтетических данных, ИИ эффективно работает с реальными изображениями: для настройки системы потребовалось всего 150 реальных снимков с аннотациями. Этого набора хватило, чтобы Dessie обошла передовые модели в тестовых задачах: при обнаружении ключевых точек, таких как суставы и другие важные элементы, система показала лучшие результаты, чем MagicPony и Farm3D. Также Dessie точнее предсказывает форму тела и движение, что важно для диагностики хромоты или мышечной асимметрии. При увеличении объёма обучающих данных её эффективность возрастала ещё сильнее — благодаря преимуществам обучения с разделением факторов. Dessie создавалась для анализа лошадей, но архитектура системы настолько гибка, что позволяет получать качественные результаты и при работе с другими похожими животными: коровами, зебрами, оленями. Модель успешно реконструировала их в 3D, несмотря на отсутствие прямого обучения на этих видах. Это открывает большой потенциал в сфере защиты животных: система может изучать редкие виды, используя только готовые фотографии и видео, без необходимости в инвазивном мониторинге. Dessie также продемонстрировала высокую эффективность при обработке художественных изображений, включая картины и мультфильмы, по которым она способна строить точные трёхмерные модели. Однако у системы есть и недостатки. Она работает лучше всего, когда в кадре находится только одна лошадь, и испытывает трудности при столкновении с необычными формами тела, отсутствовавшими в обучающих данных. Эту проблему должна решить новая модель VAREN, поддерживающая большее разнообразие форм. В целом Dessie проста в использовании: она анализирует язык тела лошади и переводит его в синтезированную речь, благодаря чему общение человека с животным выходит на новый уровень. По Китаю прокатилась череда загадочных смертей ведущих учёных в области ИИ
16.04.2025 [11:56],
Павел Котов
Область искусственного интеллекта стала крупнейшим полем битвы в технологической войне Китая и США, особенно после того, как DeepSeek и другие компании бросили вызов американскому доминированию. В Китае растёт кадровый резерв в области ИИ, есть знаменательные истории успеха, но нескольких ведущих деятелей в важнейшем секторе страна потеряла. Неожиданный уход из жизни нескольких экспертов — из-за несчастных случаев или болезней — вызвал опасения по поводу личной безопасности тех, кто работает в отрасли и занимается исследованиями. ![]() Сунь Цзянь. Источник изображений: scmp.com Исследователям в области ИИ назначают высокие зарплаты, но и ответственность у них чрезвычайно высокая. В условиях жёсткой конкуренции один исследователь может подать идею и довести проект до стадии эксперимента, а другой — уже опубликовать работу по той же теме. Издание South China Morning Post составило список ведущих учёных в области ИИ, которые ушли из жизни в относительно молодом возрасте. Большинство из них находилось в расцвете сил и были авторами открытий по таким важным направлениям как компьютерное зрение, военный и медицинский ИИ. В июне 2022 года главный научный сотрудник специализирующейся на ИИ пекинской компании Megvii Technology Сунь Цзянь (Sun Jian) скончался от внезапной болезни в возрасте 45 лет. Компания разрабатывает ПО для распознавания изображений и глубокого обучения. Сунь был известной фигурой в области ИИ и компьютерного зрения. Ранее значился исследователем в Microsoft с многолетним опытом в области компьютерного зрения и вычислительной фотографии; в 2016 году перешёл на работу в стартап Megvii, где занял пост главного научного сотрудника и управляющего директора по исследованиям. В компании руководил разработкой запускающейся на мобильных устройствах нейросети ShuffleNet; а также Brain++ — основной рабочей платформы Megvii. В 2019 году получил должность декана в Колледже искусственного интеллекта при Университете Сиань Цзяотун — своей альма-матер. Лауреат ряда отраслевых и академических наград; в 2010 году включён в список «Новаторов в возрасте до 35 лет» по версии MIT Technology Review. На его имя зарегистрированы 35 патентов в США, 13 из которых — на международном уровне. ![]() Фэн Янхэ В июле 2023 года в возрасте 38 лет по пути на «важное задание», как указано в некрологе, скончался Фэн Янхэ (Feng Yanghe), эксперт по ИИ в оборонном секторе Китая. Работы Фэна были сосредоточены на военно-полевых учениях, обучении с подкреплением и интеллектуальном планировании; занимал должность доцента в Национальном университете оборонных технологий в Чанше (провинция Хунань). Руководил отделами, разработавшими системы ИИ War Skull I и War Skull II, которые использовались Народно-освободительной армией Китая при моделировании военных учений при совместных операциях. До перевода в Национальный университет оборонных технологий в рамках совместной учебной программы с 2011 по 2013 год изучал статистику в Гарвардском университете и высокопроизводительные вычисления в университете Айовы. В 2023 году в возрасте 55 лет ушёл из жизни эксперт по искусственному интеллекту Тан Сяоу (Tang Xiaoou) — профессор Китайского университета Гонконга и основатель технологического гиганта SenseTime. Причиной его смерти стала болезнь, природа которой не разглашается. В 1990 году получил степень бакалавра в Университете науки и технологий Китая (провинция Аньхой) и переехал в США для обучения в аспирантуре. В 1991 году получил степень магистра в Рочестерском университете (шт. Нью-Йорк) и в 1996 году — степень доктора в Массачусетском технологическом институте. Его научные работы охватывали области компьютерного зрения, распознавания изображений и обработки видео; способствовал индустриализации технологии машинного зрения в Китае. С 2005 по 2008 год был руководителем группы визуальных вычислений в Microsoft Research Asia; в 2014 году основал компанию SenseTime. SenseTime разработала технологию многоракурсного захвата и распознавания лиц в реальном времени. В некоторых городах её решения используются для мониторинга плотности толпы и обнаружения припаркованных с нарушениями транспортных средств. Большая модель Ririxin помогла SenseTime наладить бизнес в области генеративного ИИ по таким направлениям как финансы, здравоохранение и офисная работа. ![]() Тан Сяоу Рано утром 29 апреля 2024 года по итогам «безуспешной попытки спасти жизнь» после остановки дыхания и сердца из-за высотной болезни в возрасте 41 года умер Хэ Чжи (He Zhi) — соучредитель и главный инновационный директор компании Yidu Tech, работающей в области технологий искусственного интеллекта для здравоохранения. Был «выдающимся первопроходцем», который начал цифровизацию отрасли здравоохранения, говорится в некрологе. В 2000 году поступил на факультет материаловедения и инженерии в Университете Цинхуа; в 2009 году получил степень магистра в области электронных коммуникаций и инженерии. С 2012 по 2014 год работал в технологическом гиганте Alibaba. В 2015 году стал соучредителем Yidu Tech — отвечал за инновации и технологическое развитие в компании, которая разрабатывает решения для здравоохранения на основе больших данных и технологий ИИ. 14 января 2025 года в возрасте 39 лет после болезни ушёл из жизни Цюань Юйхуэй (Quan Yuhui), эксперт по компьютерной обработке изображений, доцент Школы компьютерных наук и инженерии при Южно-китайском технологическом университете (провинция Гуандун). В 2008 году Цюань получил степень магистра, в 2013 году — кандидата наук в том же университете. Дальнейшее обучение проходил в Национальном университете Сингапура; в 2016 году вернулся в родной университет, где начал карьеру преподавателя. Его исследования были сосредоточены на передовых областях вычислительной фотографии, обучения без учителя и анализа текстур. Руководил множеством исследовательских проектов на провинциальном и национальном уровне, опубликовал более 80 научных работ, выступал рецензентом в престижных международных научных журналах и на конференциях. В 2024 году вошёл в список «2 % лучших учёных мира» по версии Стэнфордского университета. Главный конкурент ChatGPT научился проводить глубокие исследования и рыться в Gmail
16.04.2025 [00:14],
Анжелла Марина
Компания Anthropic, разработчик ИИ-ассистента Claude, представила новый инструмент Research для глубоких исследований с помощью ИИ. Также компания объявила об интеграции с приложениями пакета Google Workspace: ИИ-ассистент сможет напрямую подключаться к Gmail, «Google Календарю» и «Google Документам». ![]() Источник изображения: Anthropic Вместо ручного поиска информации в громадном количестве писем, приглашениях и документах, Claude будет делать это за пользователя. ИИ может находить информацию за заданный период, выделять ключевые действия из цепочек писем и предлагать дополнительный контекст не хуже, чем Microsoft Copilot, отмечает The Verge. Кроме этого, Anthropic запустила новую функцию Research, которая, по словам разработчиков, кардинально меняет подход к поиску и анализу информации. В отличие от обычного ИИ-поиска, Claude теперь работает как ИИ-агент, выполняя серию взаимосвязанных запросов, формируя более точную и обоснованную выдачу, а каждый выданный ответ сопровождается ссылками на источники. ![]() Источник изображения: Anthropic Функция Research уже доступна в ранней бета-версии для пользователей тарифов Max, Team и Enterprise в США, Японии и Бразилии. Интеграция же с Google Workspace находится в стадии beta и доступна всем платным пользователям, однако для корпоративных аккаунтов её должен активировать администратор. Для подписчиков с тарифом Pro ($20 в месяц) запуск функции Research планируется в ближайшее время. Для корпоративных клиентов также добавлена возможность каталогизации «Google Диска» — эта функция использует методы RAG (улучшенные механизмы поиска, в том числе по внешним источникам), чтобы находить информацию даже в давно забытых документах. Claude сможет автоматически просматривать всю базу данных компании в поисках нужных данных. Однако с расширением возможностей модели встаёт вопрос точности и безопасности. Как и другие ИИ, Claude может ошибочно интерпретировать данные или предоставлять вымышленные сведения. «Мы призываем пользователей всегда проверять источники, читать их и убеждаться в точности информации», — подчёркивают в Anthropic. Что касается конфиденциальности, то в компании заверили, что их ИИ-ассистент работает только с теми документами, к которым пользователь предоставил доступ в рамках своей авторизации. Также сообщается, что Anthropic запускает голосовой ИИ, с которым можно разговаривать. Новая функция, получившая название Voice mode, появится в чат-боте уже в этом месяце и, вероятно, станет конкурентом аналогичному голосовому режиму в ChatGPT. По данным Bloomberg, пользователям будут доступны три варианта голоса на английском языке: Airy, Mellow и Buttery. Ранее о разработке этой функции упоминал глава по продуктам Anthropic Майк Кригер (Mike Krieger), подтвердив, что компания тестирует прототипы. Упоминания о голосовом режиме также были обнаружены в коде iOS-приложения Claude. Как заявили в компании, что это лишь начало серии обновлений, которые «переосмысляют взаимодействие с Claude». В ближайшие недели ожидается дальнейшее расширение доступного контекста и улучшение аналитических функций ИИ-модели. Эксперты предупредили о схеме «галлюцинаторного захвата» — атаки на разработчиков ПК, использующих ИИ
15.04.2025 [19:00],
Павел Котов
Исследователи в области кибербезопасности предупредили о новом методе, с помощью которого хакеры могут злоупотреблять «галлюцинациями», которые посещают искусственный интеллект, используемый при разработке программных продуктов. Существующая пока лишь в теории схема получила название «галлюцинаторный захват» (slopsquatting). ![]() Источник изображений: socket.dev Системы генеративного ИИ, в том числе OpenAI ChatGPT и Microsoft Copilot, склонны к галлюцинациям — когда ИИ просто выдумывает нечто не соответствующее действительности и выдаёт это за фактическую информацию. Он может приписать человеку слова, которых он не говорил; придумать событие, которого не было; или при разработке ПО сослаться на продукт с открытым исходным кодом, которого не существует. С распространением генеративного ИИ многие разработчики ПО стали в значительной степени полагаться на него при написании кода. Чат-боты сами пишут код или предлагают разработчику сторонние библиотеки для их включения в проект. Примечательно, что при возникновении галлюцинаций ИИ может раз за разом выдумывать один и тот же несуществующий пакет. Если обнаружить запрос, провоцирующий ответ с галлюцинацией, установили эксперты компании Socket, и повторить этот запрос десятикратно, то в 43 % случаев ИИ снова сошлётся на несуществующий программный продукт, а в 39 % случаев про него не вспомнит. В целом 58 % выдуманных ИИ пакетов появлялись более одного раза за десять запросов, и на этом злоумышленники могут попытаться сыграть. Схема существует только в теории, но ничто не мешает хакерам выявить такую закономерность в сбоях и создать несуществующий программный пакет, на который упорно ссылается ИИ — и внедрить в этот пакет вредоносный код. Получив рекомендацию от ИИ, разработчик откроет одну из наиболее популярных платформ, например, GitHub, найдёт указанный продукт и развернёт его в проекте, не зная, что это вредоносное ПО. На данный момент инцидентов с использованием схемы «галлюцинаторного захвата» пока не зарегистрировано, но, вероятно, их возникновение — это лишь вопрос времени. Лучший способ защититься тот же, что и всегда — осмотрительность. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |