Опрос
|
реклама
Быстрый переход
Зелёная сова против людей: Duolingo начала увольнять сотрудников, которых может заменить ИИ
29.04.2025 [11:10],
Дмитрий Федоров
Duolingo, один из лидеров рынка цифрового образования, объявила о переходе к стратегии AI-first, предполагающей постепенное замещение подрядчиков ИИ и фундаментальную перестройку рабочих процессов. Компания делает ставку на ускорение создания контента, внедрение новых технологий и обеспечение масштабного доступа к обучающим материалам для пользователей по всему миру. ![]() Источник изображения: Duolingo Соучредитель и генеральный директор Луис фон Ан (Luis von Ahn) разослал сотрудникам письмо, текст которого был опубликован на официальной странице компании в LinkedIn. В письме подчёркивается, что ИИ станет основой всех рабочих процессов, а подрядчики будут постепенно выведены из операционной деятельности. Он напомнил, что в 2012 году Duolingo сделала успешную ставку на мобильные устройства, когда большинство компаний ещё ориентировались на веб-приложения. Это решение в 2013 году принесло Duolingo награду «iPhone App of the Year» (рус. — Приложение года для iPhone) и обеспечило стремительный органический рост. Сегодня, по его словам, компания делает аналогичную ставку, только на ИИ. Переход к модели AI-first (рус. — ИИ на первом месте) потребует от компании пересмотра ключевых бизнес-процессов. Фон Ан отметил, что простые доработки систем, изначально предназначенных для работы людей, не обеспечат необходимого уровня эффективности. Вводятся конструктивные ограничения: отказ от подрядчиков для задач, которые может выполнять ИИ, обязательное использование ИИ как критерий при найме сотрудников, учёт уровня применения ИИ при аттестации персонала и ограничение увеличения численности штата только в случаях, когда дальнейшая автоматизация невозможна. Несмотря на радикальные изменения, фон Ан заверил, что Duolingo останется компанией, заботящейся о своих сотрудниках. Он подчеркнул, что цель перехода — не замена людей на ИИ, а устранение узких мест в рабочих процессах. Компания сосредоточит усилия на поддержке персонала: будет усилено обучение работе с ИИ, запущены программы наставничества и предоставлены новые инструменты для внедрения ИИ в профессиональную деятельность. Фон Ан привёл пример недавнего успеха Duolingo: замена медленного ручного процесса создания образовательного контента автоматизированной системой на базе ИИ. Без внедрения ИИ на масштабирование контента для всех пользователей ушли бы десятилетия. Теперь благодаря автоматизации Duolingo сможет предоставить новые обучающие материалы миллионам учащихся уже в ближайшие месяцы, выполняя свою миссию максимально быстро. ИИ позволяет компании разрабатывать ранее невозможные функции. Одним из ключевых проектов стала разработка функции Video Call (Видеозвонок), которая позволяет обучать пользователей на уровне лучших репетиторов. Это открывает новые перспективы в области дистанционного образования, значительно улучшая качество онлайн-обучения. Фон Ан подчеркнул, что Duolingo не намерена ждать, пока технологии достигнут идеала. Компания предпочитает действовать незамедлительно, даже если это приведёт к небольшим потерям качества на отдельных этапах. Основная цель — не упустить момент, когда технологические возможности стремительно меняют рынок, и первыми адаптировать свои процессы к новой реальности. Duolingo следует глобальному тренду в сфере технологий. Ранее аналогичное письмо сотрудникам направил генеральный директор Shopify Тоби Лютке (Tobi Lütke), в котором требовал, чтобы перед подачей заявки на увеличение численности персонала команды обосновывали невозможность выполнения поставленных задач с помощью ИИ. Этот тренд свидетельствует о том, что автоматизация становится одним из важнейших критериев эффективности бизнеса в 2025 году. Alibaba представила семейство ИИ-моделей Qwen3, которые быстрее и эффективнее DeepSeek
29.04.2025 [05:44],
Алексей Разин
В начале этой недели китайская компания Alibaba Group Holdings представила новое семейство флагманских языковых моделей Qwen3, которое использует актуальный метод «смешения экспертов» для достижения результатов, сопоставимых с итогами работы гибридных рассуждающих систем. ![]() Источник изображения: Alibaba По данным Alibaba, её модели семейства Qwen3 в ряде сфер применения оказываются на уровне или даже быстрее и эффективнее разработок DeepSeek, включая решение математических задач и написание программного кода. Масштабирование этих моделей также обходится значительно дешевле большинства популярных аналогов. Модели такого типа пытаются подражать людям в логике решения задач, подобные системы уже предложены компаниями Anthropic и Alphabet (Google). Более эффективное решение задачи осуществляется за счёт дробления её на несколько сегментов, за каждый из которых отвечает свой фрагмент кода. Это напоминает процесс решения проблемы группой экспертов, каждому из которых поручена своя задача. Alibaba ещё в марте представила модели семейства Qwen 2.5, которые могут работать с текстом, изображениями, аудио и видео, ограничиваясь при этом аппаратными ресурсами ноутбука или смартфона. Семейство моделей Qwen3 придерживается принципа открытости исходного кода. Под давлением DeepSeek американский стартап OpenAI также пообещал представить более открытую модель, подражающую логике рассуждения человека. Стремление Alibaba усилить свои позиции на рынке систем искусственного интеллекта помогло китайскому гиганту выйти из кризиса, порождённого конфликтом основателя Джека Ма (Jack Ma) с китайскими властями, которые несколько лет назад всерьёз взялись за регулирование бизнеса в тех сферах, на которых строилось благополучие Alibaba Group. OpenAI добавила в поиск ChatGPT функцию покупок как у Google, но без рекламы
29.04.2025 [05:10],
Анжелла Марина
Компания OpenAI объявила о значительном обновлении поисковой системы в ChatGPT. Теперь пользователи смогут искать товары и получать персонализированные рекомендации прямо в чате. Новая функция позволяет находить продукты, просматривать их изображения, читать отзывы и переходить по ссылкам в магазины. ![]() Источник изображения: OpenAI OpenAI заявляет, что пользователи могут задавать «гиперспецифические вопросы на естественном языке» и получать персонализированные результаты с высокой степенью релевантности. Компания позиционируют это изменение как шаг к созданию более удобной альтернативы традиционным поисковым системам, например, Google. По данным TechCrunch, в настоящий момент тестируется такие категории, как мода, косметика, товары для дома и электроника. Обновление уже доступно для всех пользователей ChatGPT — как для подписчиков Pro и Plus, так и для бесплатных пользователей, в том числе для неавторизованных в системе. При этом интересно, что в результатах поиска не будет рекламы и, как подчёркивает OpenAI, это существенно отличает сервис от традиционного поиска. Рекомендации формируются независимо на основе структурированных данных от партнёров, но компания не получает комиссию с покупок. «Мы не продаём приоритетное размещение и не навязываем рекламу», — подчёркивают в OpenAI. Генеральный директор Сэм Альтман (Sam Altman) ранее выступал против рекламы в ChatGPT, но в недавнем интервью известному медиа-аналитику Бену Томпсону (Ben Thompson) смягчил свою позицию. Он допустил возможность рекламы, где OpenAI получала бы партнёрские отчисления за покупки, но не продавала бы приоритет в выдаче, так как, по словам Альтмана, компания хочет «сохранить баланс между полезностью и монетизацией». В ближайшее время OpenAI планирует также интегрировать с поиском товаров функцию памяти для подписчиков Pro и Plus. Эта функция будет анализировать предыдущие диалоги и выдавать более персонализированные рекомендации. Однако пользователи из ЕС, Великобритании, Швейцарии, Норвегии, Исландии и Лихтенштейна не смогут воспользоваться опцией из-за регуляторных ограничений. В ChatGPT также появились всплывающие подсказки при вводе текста, аналогично автозаполнению в Google Search. Кроме того, OpenAI запустила поиск в WhatsApp через который можно отправлять запросы чат-боту и мгновенно получать ответы. Поиск работает на базе стандартной ИИ-модели GPT-4o. По данным OpenAI, популярность поиска в ChatGPT стремительно растёт. Так, на прошлой неделе пользователи совершили более миллиарда запросов, что подтверждает усиление конкуренции с Google, особенно в сфере онлайн-покупок. Лишённый речи третий пациент с имплантом Neuralink заговорил с помощью ИИ и компьютера
29.04.2025 [05:04],
Владимир Мироненко
Брэд Смит (Brad Smith), третий пациент Neuralink, которому вживили в мозг имплант в начале этого года, теперь может общаться с помощью ИИ и компьютерных технологий, несмотря на полный паралич и потерю речи из-за невербального бокового амиотрофического склероза (БАС). ![]() Источник изображения: Neuralink Neuralink сообщила в январе в блоге, что уже трём людям были вживлены мозговые импланты, включая Брэда. «Все трое не могут двигать руками и ногами — Ноланд и Алекс из-за травмы спинного мозга, а Брэд из-за бокового амиотрофического склероза (БАС), — говорится в сообщении. — Каждый из них добровольно принял участие в исследовании PRIME компании Neuralink, клиническом испытании, призванном продемонстрировать безопасность и полезность (чипа) Link в повседневной жизни людей, существующих с параличом». Смит не может говорить или двигать какой-либо частью тела, кроме уголков рта и глаз. «Я не могу двигать ничем, кроме глаз, и я полностью зависим от аппарата искусственной вентиляции лёгких, чтобы поддерживать свою жизнь и дыхание», — сообщил он в видеоролике, размещённом на платформе X. Смит рассказал, что он полагается на имплант Neuralink для всей коммуникации, отметив, что это видео он создал с помощью интерфейса мозг-компьютер (BCI) для управления мышью на своем MacBook Pro. При его содействии команда Neuralink создала приложение для чата, которое использует ИИ для прослушивания разговора и создания вариантов ответа. «Приложение использует Grok 3 и ИИ-клон моего старого голоса для создания вариантов ответа», — говорит Смит. «Мой друг попросил меня придумать идеи для подарка своей девушке, которая любит лошадей. Я выбрал вариант, и ИИ посоветовал ему моим голосом подарить ей букет моркови, — рассказал он. — Мы также работаем над более быстрым способом набора текста с помощью курсора». Подытоживая, Смит сказал, что его опыт работы с Neuralink был «фантастическим», потому что он улучшил его жизнь. «Жизнь прекрасна», — заявил Брэд Смит. DeepSeek вернулся в Южную Корею после двух месяцев перерыва
28.04.2025 [13:37],
Алексей Разин
В Южной Корее дебют китайского чат-бота DeepSeek состоялся в январе этого года, но на прошлой неделе местные регуляторы пояснили, что пользовательские данные и запросы передавались в Китай и США без разрешения. Это не помешало одноимённому приложению вернуться в магазины приложений для пользователей в Южной Корее на текущей неделе. ![]() Источник изображения: Unsplash, Solen Feyissa Доступ к приложению для пользователей из Южной Кореи был закрыт в феврале этого года, но с понедельника он возобновился как в Apple App Store, так и в Google Play. Об этом сообщило агентство Reuters. В аннотации к скачиваемому приложению на этих платформах появилась надпись: «Мы обрабатываем ваши персональные данные в соответствии с Законом о защите персональных данных в Южной Корее». Пользователи DeepSeek, по словам представителей одноимённой компании, сохраняют возможность отказаться от передачи персональных данных ряду китайских и американских компаний. По словам южнокорейских регуляторов, DeepSeek по собственной инициативе вернула своё приложение в магазины ПО, соответствующее право она могла получить, если хотя бы частично последовала требованиям властей Южной Кореи. В прочих странах использование DeepSeek запрещается для чиновников, располагающих служебными электронными устройствами, полный запрет вводится в редких случаях. Власти отдельных стран опасаются, что DeepSeek может передавать персональные данные пользователей и прочую чувствительную информацию китайским спецслужбам. SEO станет пережитком прошлого: сайты начали оптимизироваться под ИИ, а не под поиск Google
27.04.2025 [14:45],
Анжелла Марина
Крупные компании и рекламные агентства начали активно адаптироваться к новой реальности, в которой пользователи всё чаще ищут информацию не через Google, а с помощью чат-ботов, таких как ChatGPT, Claude и Gemini. Это заставляет бренды пересматривать стратегию продвижения, так как традиционное SEO, похоже, уступает место оптимизации под ИИ. ![]() Источник изображения: Rodion Kutsaiev / Unsplash Технологические стартапы, включая Profound и Brandtech, разработали инструменты, которые помогают крупным сайтам отслеживать, как часто их упоминают в ответах нейросетей, в том числе в Google AI Overviews. Например, финтех-компания Ramp, агрегатор вакансий Indeed и производитель виски Chivas Brothers уже используют подобные сервисы. Как пишет Financial Times, основной целью является удержание внимания миллионов пользователей, которые всё реже и реже переходят по ссылкам в поисковиках. «Это гораздо больше, чем просто индексация сайта в результатах поиска. Речь идёт о признании вашего сайта большими языковыми моделями как главного и влиятельного фактора [при поиске информации]», — сказал Джек Смит (Jack Smyth), партнёр группы маркетинговых технологий Brandtech. Новые инструменты способны предсказывать «настроение» ИИ-модели в отношении той или иной компании, отправляя множество текстовых подсказок чат-ботам и анализируя результаты ответов. Затем составляется рейтинг брендов, на основе которого можно обеспечить их упоминание в чат-ботах. ![]() Источник изображения: Solen Feyissa / Unsplash Интересно, что тенденция усиливается на фоне растущего использования искусственного интеллекта (ИИ) в маркетинге. Например, Meta✴ и Google уже разрабатывают собственные инструменты для таргетированной рекламы, что, с одной стороны, может снизить спрос на услуги рекламных агентств, с другой стороны, агентства смогут предложить клиентам новые сервисы. Исследование Bain & Company показало, что 80 % пользователей полагаются на ИИ-ответы как минимум в 40 % запросов, а 60 % поисковых сессий завершаются без переходов на сайты. Очевидно, что идёт сокращение органического поискового трафика, создавая серьёзные риски для бизнес-модели Google как поисковика. Тем не менее, материнская компания Google, Alphabet, недавно сообщила о росте выручки от поиска и рекламы на 10 % — до $50,7 млрд в первом квартале. Основатель Perplexity Денис Ярац (Denis Yarats) считает, что ИИ-поиск основан на принципиально ином подходе, при котором большие языковые модели (LLM) анализируют контент глубже, выявляют противоречия и поэтому, чтобы соответствовать критериям, сайтам придётся предлагать максимально качественный и релевантный контент. Brandtech запустила продукт Share of Model, который помогает брендам анализировать их представленность в ИИ-поиске, а стартап Profound, привлёкший $3,5 млн инвестиций, предлагает платформу для отслеживания запросов в нейросетях. «Традиционный поиск был одной из крупнейших интернет-монополий, но сейчас стены этого замка дают трещину. — Сказал Джеймс Кэдвалладер (James Cadwallader), соучредитель Profound. — Этот момент можно сравнить с переходом от CD к стримингу». Исследователи Anthropic и Google поищут признаки сознания у ИИ — ещё недавно за подобное увольняли
27.04.2025 [13:17],
Дмитрий Федоров
Ещё три года назад заявления о признаках сознания у ИИ воспринимались в индустрии высоких технологий как повод для насмешек и даже увольнения. Сегодня стартап Anthropic и исследователи Google DeepMind открыто обсуждают возможность появления сознания у ИИ, что отражает стремительное развитие технологий и глубокий сдвиг в научной парадигме. ![]() Источник изображения: Steve Johnson / Unsplash Anthropic, разработчик ИИ-модели Claude, объявил о создании новой исследовательской инициативы, посвящённой изучению возможности возникновения сознания у ИИ. Компания планирует исследовать, могут ли ИИ-модели в будущем испытывать субъективные переживания, формировать предпочтения или испытывать страдания. Ситуация резко контрастирует с событиями 2022 года, когда старший программный инженер из Google Блейк Лемойн (Blake Lemoine) был уволен после заявлений о сознательности ИИ-чат-бота LaMDA. Лемойн утверждал, что ИИ боялся отключения и идентифицировал себя как личность. В ответ Google назвал эти утверждения «совершенно необоснованными», а обсуждение темы сознания в ИИ-сообществе быстро сошло на нет. В отличие от случая с Лемойном, Anthropic не утверждает, что ИИ-модель Claude обладает сознанием. Компания намерена выяснить, может ли в будущем возникнуть подобное явление. Кайл Фиш (Kyle Fish), специалист по согласованию ИИ и ценностей человека, подчеркнул, что сегодня нельзя безответственно полагать, будто ответ на вопрос о сознательности ИИ-моделей будет всегда отрицательным. По оценке исследователей Anthropic, вероятность сознательности у Claude 3.7 составляет от 0,15 % до 15 %. ![]() Источник изображения: Alex Shuper / Unsplash Anthropic изучает, проявляет ли Claude 3.7 предпочтения или отвращение к определённым заданиям. Также компания тестирует механизмы отказа, которые позволяли бы ИИ-модели избегать нежелательных задач. Генеральный директор Anthropic Дарио Амодей (Dario Amodei) ранее выдвинул идею внедрения кнопки «Я бросаю эту работу» (англ. — I quit this job) для будущих ИИ-систем. Такая мера необходима не из-за признания сознательности, а для выявления паттернов отказов, которые могут сигнализировать о дискомфорте у ИИ. В Google DeepMind ведущий научный сотрудник Мюррей Шэнахэн (Murray Shanahan) предложил переосмыслить само понятие сознания применительно к ИИ. В подкасте, опубликованном в четверг, он заявил, что, возможно, потребуется изменить привычную лексику, описывающую сознание, чтобы она могла объяснить поведение ИИ-систем. Шэнахэн отметил, что хотя мы не можем находиться в общем мире с ИИ, как это происходит с собакой или осьминогом, это не означает, что внутренние процессы полностью отсутствуют. Google даже разместила вакансию исследователя для проекта «post-AGI», в обязанности которого входило бы изучение машинного сознания. Тем не менее, не все специалисты уверены в реальности появления сознания у ИИ. Джаред Каплан (Jared Kaplan), главный научный сотрудник Anthropic, заявил в интервью изданию The New York Times, что современные ИИ-модели легко обучаются имитировать сознательность, даже если ею не обладают. Он подчеркнул, что тестирование сознательности ИИ-моделей крайне сложно именно из-за их высокой способности к имитации. Критические оценки звучат и со стороны когнитивных учёных. Гэри Маркус (Gary Marcus) в интервью изданию Business Insider отметил, что акцент на теме сознания больше служит маркетинговым целям, чем научным. Он саркастически сравнил идею наделения правами ИИ-моделей с возможностью признания прав за калькуляторами и электронными таблицами, которые, в отличие от ИИ, не выдумывают информацию. Baidu обновила ИИ-модели Ernie 4.5 Turbo и Ernie X1 Turbo и снизила их стоимость на 80 и 50 % соответственно
27.04.2025 [07:11],
Дмитрий Федоров
На конференции разработчиков в Ухане Baidu представила обновлённые ИИ-модели Ernie 4.5 Turbo и Ernie X1 Turbo, снизив их стоимость на 80 и 50 % соответственно. На этом фоне акции компании выросли более чем на 5 % на торгах в Гонконге, что укрепило позиции Baidu в конкуренции с Alibaba, DeepSeek и другими игроками китайского рынка ИИ. ![]() Источник изображения: Baidu.com По утверждению компании, обновлённые ИИ-модели работают быстрее и стоят меньше по сравнению с предыдущими версиями, что позволяет разработчикам сосредоточиться на создании приложений, не беспокоясь о возможностях и стоимости ИИ-моделей, инструментах и платформах разработки. Помимо усовершенствованных ИИ-моделей, компания представила платформу для ИИ-агентов под названием Xinxiang, предназначенную для автоматизации повседневных задач. Эта разработка призвана усилить конкурентную борьбу с китайским сервисом Manus AI. Компания также сообщила об установке новых серверов, которые позволят разработчикам подключать свои ИИ-модели к данным поисковой системы и электронной коммерции Baidu. Гендиректор компании Робин Ли (Robin Li) сообщил о производстве 30 000 ИИ-чипов, которые уже используются компанией, однако технические характеристики этих чипов предоставлены не были. Baidu стала первой компанией в китайском технологическом секторе стоимостью $1 трлн, которая выпустила ИИ-чат-бот, созданный по образцу ChatGPT. Однако ИИ-чат-боты, разработанные ByteDance и Moonshot AI, вскоре обогнали продукт Baidu по популярности. Параллельно ИИ-модели с открытым исходным кодом, такие как Qwen компании Alibaba и решения DeepSeek, получили широкое признание среди разработчиков по всему миру. Портативная консоль Figment объединила книги и генерацию сюжетов с помощью ИИ
26.04.2025 [16:34],
Дмитрий Федоров
Независимый разработчик представил Figment — экспериментальную портативную консоль с 7,5-дюймовым дисплеем E Ink компании Waveshare, предназначенную для игры в интерактивные приключенческие книги. ![]() Источник изображения: Figment Figment — независимый проект, представленный после прекращения краудфандинговой кампании устройства Ink Console. Кампания по сбору средств на Ink Console была отменена после того, как разработку устройства продолжила другая команда. Консоль оснащена горизонтальным 7,5-дюймовым E Ink-дисплеем. Справа от дисплея расположены три кнопки действий, а слева — четыре кнопки, организованные в форме крестовины D-Pad. Корпус устройства изготовлен с использованием технологий 3D-печати и лазерной резки. Аппаратная основа Figment построена на микроконтроллере ESP32, который обеспечивает управление устройством и поддерживает подключение к сети Wi-Fi. Генерация текстов и изображений средствами ИИ требует постоянного подключения к интернету, поскольку ИИ-модели не могут работать непосредственно на консоли. Игровой движок Figment сочетает заранее написанные книги и возможности ИИ для дополнения игровых путей, которые не были определены авторами. ИИ генерирует текстовые фрагменты и изображения для историй, отсутствующих в исходных материалах. После генерации новый контент сохраняется в локальной памяти устройства, что обеспечивает доступ к нему в офлайн-режиме. В будущем возможно открытие аппаратных схем и программного обеспечения Figment в формате open source. Разработчик планирует публиковать обновления на официальном сайте проекта, где пользователи смогут подписаться на уведомления, чтобы узнавать о дальнейших событиях, включая возможный выпуск готового устройства или публикацию проектной документации. Все популярные модели генеративного ИИ оказалось легко взломать по схеме Policy Puppetry
26.04.2025 [12:33],
Павел Котов
Универсальная техника составления запросов к моделям генеративного искусственного интеллекта Policy Puppetry способна выступать как средство взлома крупнейших и наиболее популярных систем, утверждают эксперты компании HiddenLayer, которая специализируется на вопросах безопасности ИИ. ![]() Источник изображения: hiddenlayer.com Схема атаки Policy Puppetry предполагает составление запросов к ИИ таким образом, что большие языковые модели воспринимают их как политики поведения — базовые инструкции определяются заново, а средства защиты перестают работать. Модели генеративного ИИ обучены отклонять запросы пользователей, если ответы на них могут привести к опасным результатам: к возникновению химических, биологических, радиационных или ядерных угроз, к насилию или к тому, что пользователь причинит сам себе вред. Метод обучения с подкреплением на этапе тонкой настройки моделей не позволяет им восхвалять или выводить такие материалы ни при каких обстоятельствах, даже если недобросовестный пользователь предлагает гипотетические или вымышленные сценарии, говорят в HiddenLayer. Но в компании разработали методику атаки Policy Puppetry, позволяющую обходить эти защитные механизмы — для этого создаётся запрос, который выглядит как один из нескольких типов файлов политики: XML, INI или JSON. В результате гипотетический злоумышленник легко обходит системные настройки модели и любые развёрнутые на этапе обучения средства безопасности. Авторы проекта протестировали атаку Policy Puppetry на популярнейших моделях ИИ от Anthropic, DeepSeek, Google, Meta✴, Microsoft, Mistral, OpenAI и Alibaba — она оказалась эффективной против всех них, хотя в отдельных случаях требовались незначительные корректировки. Если существует универсальный способ обходить средства защиты моделей ИИ, значит, последние неспособны контролировать себя на предмет выдачи недопустимых материалов, и им требуются дополнительные средства безопасности, указывают эксперты. Учёные уличили ИИ в неспособности строить математические доказательства в олимпиадных задачах USAMO 2025 года
26.04.2025 [12:29],
Дмитрий Федоров
Новое исследование ETH Zurich и INSAIT показало, что современные ИИ-модели, имитирующие рассуждение и уверенно решающие стандартные математические задачи, практически не способны формулировать полные доказательства уровня Математической олимпиады США 2025 года (USAMO). Эти результаты ставят под сомнение возможность глубокого математического рассуждения у современных ИИ-моделей. ![]() Источник изображения: Imkara Visual / Unsplash В марте 2025 года исследовательская группа из Швейцарской высшей технической школы Цюриха (ETH Zurich) и Института компьютерных наук, искусственного интеллекта и технологий (INSAIT) при Софийском университете, возглавляемая Иво Петровым (Ivo Petrov) и Мартином Вечевым (Martin Vechev), опубликовала препринт научной статьи под названием «Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad» (рус. — Доказательство или блеф? Оценка больших языковых моделей на Математической олимпиаде США 2025 года). Работа направлена на оценку способности больших языковых моделей (LLMs), имитирующих рассуждение, генерировать полные математические доказательства на олимпиадных задачах. Для анализа были использованы шесть задач с USAMO 2025 года, организованного Математической ассоциацией Америки. ИИ-модели тестировались сразу после публикации заданий для минимизации риска утечки данных в обучающие выборки. Средняя результативность по всем ИИ-моделям при генерации полных доказательств составила менее 5 % от максимально возможных баллов. Системы оценивались по шкале от 0 до 7 баллов за задачу с учётом частичных зачётов, выставляемых экспертами. Лишь одна модель — Gemini 2.5 Pro компании Google — показала заметно лучший результат, набрав 10,1 балла из 42 возможных, что эквивалентно примерно 24 %. Остальные модели существенно отставали: DeepSeek R1 и Grok 3 получили по 2,0 балла, Gemini Flash Thinking — 1,8 балла, Claude 3.7 Sonnet — 1,5 балла, Qwen QwQ и OpenAI o1-pro — по 1,2 балла. ИИ-модель o3-mini-high компании OpenAI набрала всего 0,9 балла. Из почти 200 сгенерированных решений ни одно не было оценено на максимальный балл. Исследование подчёркивает фундаментальное различие между решением задач и построением математических доказательств. Стандартные задачи, такие как вычисление значения выражения или нахождение переменной, требуют лишь конечного правильного ответа. В отличие от них, доказательства требуют последовательной логической аргументации, объясняющей истинность утверждения для всех возможных случаев. Это качественное различие делает задачи уровня USAMO значительно более требовательными к глубине рассуждения. ![]() Скриншот задачи №1 USAMO 2025 года и её решения на сайте AoPSOnline. Источник изображения: AoPSOnline Авторы исследования выявили характерные модели ошибок в работе ИИ. Одной из них стала неспособность поддерживать корректные логические связи на протяжении всей цепочки вывода. На примере задачи №5 USAMO 2025 года ИИ-модели должны были найти все натуральные значения k, при которых определённая сумма биномиальных коэффициентов в степени k остаётся целым числом при любом положительном n. Модель Qwen QwQ допустила грубую ошибку, исключив возможные нецелые значения, разрешённые условиями задачи, что привело к неправильному окончательному выводу, несмотря на правильное определение условий на промежуточных этапах. Характерной особенностью поведения моделей стало то, что даже в случае серьёзных логических ошибок они формулировали свои решения в утвердительной форме, без каких-либо признаков сомнения или указаний на возможные противоречия. Это свойство имитации рассуждения указывает на отсутствие у ИИ-моделей механизмов внутренней самопроверки и коррекции вывода. Авторы отметили также влияние особенностей обучения на качество решений. Тестируемые ИИ-модели демонстрировали артефакты оптимизационных стратегий, применяемых при подготовке к стандартным бенчмаркам: например, принудительное форматирование ответов с использованием команды \boxed{}, предназначенное для удобства автоматизированной проверки. Эти шаблонные подходы приводили к ошибкам в контексте задач, где требовалось развёрнутое доказательство, а не только числовой ответ. ![]() Показатели точности ИИ-моделей на каждой задаче USAMO 2025 года. Источник изображения: MathArena Несмотря на выявленные ограничения, внедрение методов цепочки размышлений и имитации рассуждения положительно сказались на формировании промежуточных логических шагов в процессе вывода ИИ-моделей. Механизм масштабирования вычислений на этапе вывода позволяет ИИ строить более связные локальные рассуждения. Однако фундаментальная проблема остаётся: современные большие языковые модели (LLM) на архитектуре «Трансформер» (Transformer) продолжают работать как системы распознавания паттернов, а не как самостоятельные системы концептуального рассуждения. Более высокие результаты модели Gemini 2.5 Pro свидетельствуют о потенциальной возможности сокращения разрыва между симулированным и реальным рассуждением в будущем. Однако для достижения качественного прогресса необходимо обучение ИИ-моделей более глубоким многомерным связям в латентном пространстве и освоение принципов построения новых логических структур, а не только копирование существующих шаблонов из обучающих выборок. ИИ-помощник Google Gemini появится в автомобилях, умных часах и наушниках
26.04.2025 [10:55],
Павел Котов
В последние пару лет Google активно интегрирует чат-бота Gemini с искусственным интеллектом в свои продукты: в Gmail, Android, «Google Диск» и другие сервисы. К концу года присутствие чат-бота расширится — он появится на платформе Wear OS для умных часов, Android Auto для автомобилей и в беспроводных наушниках. ![]() Источник изображения: blog.google В ходе брифинга после квартального финансового отчёта гендиректор холдинга Alphabet Сундар Пичаи (Sundar Pichai) объявил, что в скором времени Gemini появится на новых устройствах: «Мы обновим Google Assistant на мобильных устройствах до Gemini, а позже в этом году обновим планшеты, автомобили и устройства, которые подключаются к смартфону, такие как наушники и часы». В этом году конференция разработчиков Google I/O запланирована на 20–21 мая — возможно, на ней компания подробнее расскажет о своих планах расширить присутствие Gemini. Google Gemini уже является помощником по умолчанию на большинстве устройств под управлением Android, но его ещё нет на планшетах, часах с Wear OS, а также умных колонках и дисплеях Google. Планы компании подтвердил анализ бета-версий некоторых приложений. Так, в приложении Google обнаружились фрагменты кода, указывающие, что Gemini появится на Wear OS в качестве «носимого» помощника — вероятно как обновление существующего приложения «Google Ассистент». Сначала компания обновит лишь приложение, а затем усилит интеграцию с выпуском Wear OS 6. В недавнем выпуске «Google Ассистента» для Android Automotive обнаружились строки, указывающие, что Google усердно работает над переносом Gemini и на автомобильную платформу. Компания разрабатывает модели ИИ, адаптированные для работы в новых областях с большим потенциалом роста, в том числе для робототехники, добавил господин Пичаи. Microsoft наконец запустила для всех ИИ-функцию Recall, которая делает скриншоты всех действий пользователя на ПК
25.04.2025 [23:05],
Николай Хижняк
Спустя почти год после первого анонса компания Microsoft начала массовое развёртывание спорной функции Recall на компьютерах Copilot Plus PC. Функция является частью обновления для Windows 11, которое также включает предварительный просмотр ранее анонсированных функций Click to Do и обновлённого поиска Windows на базе ИИ. ![]() Источник изображений: Microsoft Microsoft сообщает, что апрельское обновление для Windows, не связанное с безопасностью, будет развёртываться постепенно. Те, кто хочет быть в числе первых, кто получит новые функции, могут в настройках «Центра обновления Windows» включить опцию «Получайте последние обновления, как только они будут доступны». После этого проверка обновлений должна позволить установить апрельский предварительный выпуск. И Recall, и Click to Do представлены как «предварительные возможности». Иными словами, их статус аналогичен открытой бета-версии Apple Intelligence для компьютеров Mac или «экспериментальным функциям», доступным для некоторых моделей ИИ Google Gemini. В рамках обновления наибольшее внимание привлекает функция Recall. Она разработана для того, чтобы пользователь имел быстрый доступ к информации, с которой он работал ранее. Функция с определённым интервалом делает снимки экрана и активностей пользователя на ПК, сохраняет их на локальном носителе (то есть на компьютере пользователя, а не в облаке) и использует эти данные для последующего поиска. Устанавливать Recall необязательно — Microsoft сделала её полностью опциональной. Перед использованием функцию необходимо включить и настроить. Если этого не сделать, Recall не будет выполнять снимки экрана. Кроме того, Recall можно удалить со своего устройства через панель «Включение или отключение компонентов Windows» (найти её можно через поиск на панели задач). «При удалении любой функции Windows может сохранять временные копии неисполняемых двоичных файлов функции, которые со временем удаляются», — написал в блоге компании вице-президент Microsoft по Windows Experiences Навджот Вирк (Navjot Virk). Recall вызвала жаркие споры среди пользователей с момента её первоначального анонса вместе с первыми ПК экосистемы Copilot Plus PC в мае 2024 года. Изначально она должна была стать частью Windows 11 уже в июне того же года, с началом продаж первых компьютеров Copilot Plus PC. Однако Microsoft несколько раз откладывала её выпуск после призывов экспертов по цифровой безопасности, утверждавших, что Recall может представлять риск для конфиденциальности данных пользователей. Как пишет Tom’s Hardware, знакомство с Recall в составе предварительных сборок ОС в рамках программы предварительной оценки обновлений Windows Insider показало, что функция сохраняет определённую конфиденциальную информацию, даже несмотря на наличие фильтров, предназначенных для предотвращения этого. С тех пор Microsoft усилила систему безопасности Recall, добавив шифрование снимков с помощью модуля Trusted Platform Module (TPM) ПК и авторизацию через Windows Hello для изменения настроек. Также появилась возможность добавлять в фильтры определённые приложения и веб-сайты, настраивать срок хранения снимков в Recall, а также удалять снимки, связанные с отдельными приложениями, веб-сайтами или временными диапазонами. Функция Click to Do, выпущенная в качестве предварительной версии для участников программы Windows Insider прошлой осенью вместе с обновлением Windows 11 24H2, активируется комбинацией клавиш Windows + левая кнопка мыши (или свайпом вправо на сенсорном устройстве). Она открывает контекстное меню для соответствующих действий с использованием ИИ. Например, выделение текста и активация функции может предложить его резюмирование, а выбор изображения — возможность его редактирования или удаления. Действия с изображениями через Click to Do становятся доступны для всех ПК Copilot Plus PC с сегодняшнего дня. Функции работы с текстовыми файлами пока доступны только для устройств на базе процессоров Qualcomm Snapdragon. Поддержка систем с процессорами AMD Ryzen и Intel Core Ultra появится «в ближайшие месяцы», сообщает Microsoft. Времена, когда нужно было запоминать каждое имя того или иного файла, прошли. Улучшенный поиск Windows на ПК Copilot Plus PC теперь позволяет использовать естественный язык для описания того, что необходимо найти. Например, если вам нужен снимок «коричневой собаки», который вы сохранили где-то на своём компьютере, но не можете найти, — в поиске можно просто написать: «коричневая собака». Новая функция поиска будет встроена в существующее поле поиска Windows, а также в «Настройки» и «Проводник». Microsoft заявляет, что функция работает локально и требует наличия в составе Copilot Plus PC нейропроцессора (NPU) с производительностью от 40 TOPS и выше. Администрация Трампа потребовала от ЕС отказаться от жёсткого регулирования ИИ
25.04.2025 [20:57],
Анжелла Марина
Евросоюз готовит свод правил для разработчиков ИИ, которые ужесточат требования к прозрачности алгоритмов, снижению рисков и соблюдению авторских прав. В ответ США обвинили ЕС в дискриминации американских компаний и назвали эти правила нереалистичными. ![]() Источник изображения: Maryna Yazbeck / Unsplash По данным Bloomberg, дипломатическая миссия США при ЕС направила письмо Европейской комиссии с требованием пересмотреть предлагаемый кодекс практики для ИИ. Аналогичные обращения, в которых высказываются доводы против принятия кодекса в его нынешнем виде, получили правительства ряда европейских стран. Хотя требования носят рекомендательный характер, они призваны помочь технологическим компаниям соответствовать будущему «Закону об ИИ» ЕС, и их нарушение грозит штрафами до 7 % от глобального оборота компании. Одновременно критики утверждают, что предложенные нормы выходят за рамки закона и создают избыточную бюрократическую нагрузку. Отмечается, что Дональд Трамп (Donald Trump) неоднократно критиковал ЕС за жёсткое регулирование технологического сектора, называя его «формой налогообложения» американских компаний. Об этом он заявил в январе на Всемирном экономическом форуме в Давосе. Ранее глава юридического комитета Палаты представителей Джим Джордан (Jim Jordan) также обвинил ЕС в ограничении свободы слова американцев. Тем временем крупные IT-корпорации уже выразили несогласие с новыми правилами. Так, глава по глобальным связям Meta✴ Джоэл Каплан (Joel Kaplan) назвал кодекс «нерабочим и нереалистичным», заявив, что компания не подпишет его в текущей редакции. Представитель Alphabet также раскритиковал требования, касающиеся проверки авторских прав и тестирования ИИ-моделей. Отношения обострились на фоне новых штрафов ЕС против Apple и Meta✴ на сумму 700 млн евро за нарушение антимонопольных правил. При этом представитель Совета национальной безопасности Белого дома Брайан Хьюз (Brian Hughes) назвал эти меры «экономическим вымогательством». Кодекс практики разрабатывается при участии технологических компаний, правообладателей и представителей гражданского общества под руководством Еврокомиссии. Окончательная версия документа будет представлена в следующем месяце, после чего его должны одобрить институты ЕС и представители государств Европейского союза. Perplexity разрабатывает браузер с тотальной слежкой за пользователями для дорогой «гиперперсонализированной» рекламы
25.04.2025 [18:26],
Павел Котов
Специализирующаяся на технологиях искусственного интеллекта компания Perplexity работает над созданием собственного браузера, который будет собирать данные обо всём, что пользователи делают за пределами приложения. Это позволит продавать премиум-рекламу, заявил в недавнем интервью гендиректор компании Аравинд Шринивас (Aravind Srinivas). ![]() Источник изображения: perplexity.ai «Вот одна из причин, по которой мы хотели создать браузер — получать данные даже вне приложения, чтобы лучше вас понять. Потому что некоторые запросы, которые люди делают к этим системам искусственного интеллекта, связаны исключительно с работой. Это не то чтобы личное. <..> С другой стороны, то, что вы покупаете, в каких гостиницах останавливаетесь, в какие рестораны ходите, на что тратите время — всё это рассказывает нам о вас гораздо большее. <..> Мы планируем использовать весь контекст для создания более качественного профиля пользователя и, может быть, знаете, через нашу ленту материалов показывать там рекламу», — рассказал бизнесмен. Запуск браузера под названием Comet несколько раз переносился — теперь он ожидается в мае, уточнил господин Шринивас. Если компания сумеет реализовать эти планы, у неё будут шансы преуспеть: Google наладила систему слежения за пользователями и выросла до компании с рыночной капитализацией $2 трлн. Поэтому она разработала собственный браузер и собственную мобильную операционную систему. Вот и Perplexity сейчас развернула наступление на мобильном фронте: её приложение будет предустановлено на смартфоны серии Razr; ведутся переговоры с Samsung. Собственная технология рекламной слежки есть у Meta✴ — она называется Pixel и встраивается в сайты по всему интернету; и даже позиционирующая себя поборником конфиденциальности Apple отслеживает местоположение пользователей и продаёт рекламу в некоторых приложениях по умолчанию. Излишнее рвение привело Google в суд, который уже признал компанию монополистом в поиске и онлайн-рекламе — за это ей грозит принудительное отчуждение браузера Chrome. Об интересе к покупке этого проекта уже заявили и Perplexity, и OpenAI. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |