Опрос
|
реклама
Быстрый переход
Аукцион «Кристис» объявил о проведении выставки картин, созданных при помощи ИИ
10.02.2025 [04:54],
Анжелла Марина
Лондонский аукционный дом Christie's объявил о своей первой выставке-аукционе, полностью посвящённой произведениям искусства, созданным с использованием искусственного интеллекта. Выставка, получившая название Augmented Intelligence (Дополненный интеллект), вызвала неоднозначную реакцию в художественном сообществе. Многие против. ![]() Источник изображения: Copilot Анонс вызвал споры, так как критики выразили обеспокоенность этическими аспектами использования нейросетей в искусстве. Среди работ будут представлены произведения таких художников, как Мат Драйхерст (Mat Dryhurst), являющийся основателем стартапа Spawning AI, специализирующегося на искусственном интеллекте (ИИ). Но центральным экспонатом выставки станет робот, рисующий в режиме реального времени, сообщает TechCrunch. Несмотря на то, что организаторы подчёркивают, что аукцион «призван продемонстрировать, как ИИ способен расширить возможности художников и открыть новые горизонты в творчестве», реакция пользователей была незамедлительной и вовсе не позитивной. В социальных сетях многие указали на то, что генеративные ИИ-модели, например, DALL-E, Midjourney и Stable Diffusion, обучались на произведениях художников без их согласия, а «Кристис», возводя эти работы в культ, игнорирует права и интересы художников. В ответ на критику, представитель аукционного дома заявил: «Картины, представленные на этих торгах, имеют сильные и признанные художественные практики в различных жанрах, некоторые из них представлены в ведущих музейных коллекциях». Он также добавил, что работы на этом аукционе используют искусственный интеллект для расширения художественного арсенала, и в большинстве случаев ИИ-модели были обучены на собственных материалах. Meta✴ разработала бесконтактный нейроинтерфейс, который считывает нажатия клавиш из мозга пользователя
09.02.2025 [22:28],
Дмитрий Федоров
Учёные компании Meta✴ разработали систему, способную интерпретировать мозговые сигналы и определять, какие клавиши нажимает человек, не прибегая к прямому наблюдению. В ходе эксперимента, проведённого с участием 35 добровольцев, алгоритм на основе глубокой нейронной сети оказался способен достигать 80 % точности при распознавании букв. Однако эта технология остаётся исключительно лабораторной. Несмотря на все ограничения, Meta✴ рассматривает этот проект как стратегическое направление, способное пролить свет на механизмы человеческого мышления и способствовать развитию ИИ. ![]() Источник изображений: ai.meta.com В далёком 2017 году Марк Цукерберг (Mark Zuckerberg) объявил, что Facebook✴ работает над технологией, которая позволит «набирать текст прямо из мозга». Тогда компания планировала создать компактное устройство — например, шапку или повязку, способную считывать мозговые сигналы и преобразовывать их в текст без необходимости вживления имплантов. Однако реализация этой идеи столкнулась с серьёзными техническими ограничениями, и спустя четыре года Facebook✴ отказался от разработки потребительской версии устройства. Несмотря на сворачивание коммерческого проекта, Meta✴ продолжила финансировать фундаментальные исследования в области нейронаук. В новой работе, результаты которой изложены в двух препринтах и в блоге компании, учёные использовали метод магнитоэнцефалографии (MEG) — технологию, фиксирующую слабые магнитные поля, создаваемые нейронной активностью. Полученные сигналы подвергались обработке глубокой нейронной сетью, что позволило анализировать мозговую активность человека и сопоставлять её с конкретными нажатиями клавиш. Жан-Реми Кинг (Jean-Rémi King), руководитель исследовательской группы Meta✴ «Brain & AI», подчёркивает, что главной целью проекта является не создание конечного продукта, а изучение фундаментальных принципов интеллекта. По его словам, понимание архитектуры и механизмов работы человеческого мозга может открыть новые пути в разработке ИИ-систем. В ходе эксперимента система продемонстрировала способность с точностью до 80 % распознавать буквы, которые набирает опытный пользователь, анализируя только мозговые сигналы. Такой уровень точности позволил исследователям воссоздавать целые предложения на основе зарегистрированных нейросигналов. «Попытка понять точную архитектуру или принципы работы человеческого мозга может стать ключом к развитию машинного интеллекта. Именно этот путь мы и исследуем», — утверждает Кинг. ![]() Эксперимент с 35 участниками использовал EEG/MEG и модель Brain2Qwerty для декодирования текста из мозговых сигналов человека Однако даже несмотря на впечатляющие результаты, технология остаётся далёкой от практического применения. В эксперименте использовался громоздкий магнитоэнцефалографический сканер стоимостью более $2 млн. Его работа требует помещения с мощной магнитной защитой, поскольку естественное магнитное поле Земли превосходит мозговые сигналы в триллион раз, создавая сильные помехи. К тому же система чрезвычайно чувствительна к движениям: малейшее смещение головы испытуемого приводит к потере сигнала. Кинг подчёркивает, что такие ограничения делают проект непригодным для коммерциализации. Исследование проводилось на базе Баскского центра познания, мозга и языка (BCBL) в Испании. В нём приняли участие 35 добровольцев, каждый из которых провёл около 20 часов в сканере, набирая текст на испанском языке. Среди вводимых фраз были предложения, например: «el procesador ejecuta la instrucción» («процессор выполняет инструкцию»). Разработанная Meta✴ система, получившая название Brain2Qwerty, анализировала мозговые сигналы участников и сопоставляла их с соответствующими нажатиями клавиш. На первом этапе обучения алгоритму требовалось проанализировать тысячи введённых символов, прежде чем он мог начать предсказывать буквы, основываясь на зарегистрированных мозговых сигналах. Средний уровень ошибок составил 32 % — почти одна неверно определённая буква на каждые три. Несмотря на это, Meta✴ называет достигнутую точность самой высокой среди всех известных неинвазивных методов набора текста, использующих полный алфавит. В то время как Meta✴ делает ставку на неинвазивные методы, в области нейроинтерфейсов активно развиваются инвазивные технологии, основанные на вживлении электродов. В 2023 году пациентка с боковым амиотрофическим склерозом (БАС), утратившая способность говорить, вновь обрела возможность общаться благодаря нейроинтерфейсу, передающему её мысли в синтезатор речи. Компания Neuralink, основанная Илоном Маском (Elon Musk), разрабатывает имплантируемые устройства, позволяющие парализованным пациентам управлять курсором компьютера. Хотя такие технологии обеспечивают значительно более точное считывание сигналов, они требуют хирургического вмешательства и связаны с рисками. Meta✴ не занимается разработкой медицинских устройств и делает ставку на фундаментальную науку. В отличие от электродных интерфейсов, магнитоэнцефалографический сканер не может фиксировать активность отдельных нейронов, но даёт исследователям возможность анализировать работу мозга в целом. Этот метод позволяет отслеживать сложные процессы, охватывающие сразу несколько областей мозга, что особенно важно для изучения когнитивных функций и языкового мышления. Во втором исследовании, проведённом на тех же данных, учёные Meta✴ изучили, каким образом мозг структурирует языковую информацию. Они подтвердили гипотезу о том, что процесс идёт иерархически: сначала формируется общая мысль, затем активируются области, отвечающие за отдельные слова, затем за слоги, и только в последнюю очередь мозг генерирует сигналы, соответствующие конкретным буквам. Хотя эта концепция не является новой, Meta✴ предоставила дополнительные данные о взаимодействии этих уровней и их динамике. Хотя разработанная система далека от практического применения, её результаты могут оказать влияние на развитие нейроинтерфейсов и ИИ. Современные языковые модели уже используют алгоритмы, имитирующие обработку информации в человеческом мозге, но более глубокое понимание когнитивных процессов, связанных с формированием языка, может стать ключом к созданию по-настоящему интеллектуальных систем. Лидеры крупнейших технологических компаний увидели в DeepSeek не угрозу, а прорыв
09.02.2025 [15:19],
Дмитрий Федоров
Сезон корпоративной отчётности крупнейших технологических компаний завершился, выявив неожиданную тенденцию: руководители ведущих IT-гигантов не рассматривают китайский ИИ-стартап DeepSeek как угрозу. Этот ранее малоизвестный проект разработал прорывную ИИ-модель, затратив на её обучение довольно небольшую сумму и используя менее мощные чипы, чем его конкуренты. Однако, вопреки опасениям инвесторов, большинство лидеров индустрии увидели в DeepSeek не вызов, а источник вдохновения и новые возможности для собственных разработок. ![]() Источник изображения: Solen Feyissa / Unsplash Волна роста акций технологического сектора, спровоцированная сезоном корпоративной отчётности, постепенно стихает. Почти все участники американской технологической «Великолепной семёрки» уже опубликовали результаты работы за IV квартал 2024 года, за исключением Nvidia, чей отчёт запланирован на 26 февраля 2025 года. Ключевой темой этого отчётного периода стало наращивание инвестиций в ИИ: Amazon, Google, Meta✴, Microsoft и Apple демонстрируют стремительный рост затрат на ИИ-разработки. Отчёт Amazon оказался неоднозначным: показатели прибыли на акцию и выручки превзошли прогнозы Уолл-стрит, но неуверенный прогноз на будущее всё же разочаровал инвесторов, что привело к падению акций компании. Аналитик Evercore назвал это коррекцией ожиданий, подчеркнув, что речь идёт не о фундаментальных проблемах, а о переоценке перспектив. Помимо квартальной отчётности, неожиданное внимание привлёк китайский ИИ-стартап DeepSeek, ранее неизвестный широкой аудитории. В конце января 2025 года он представил ИИ-модель, разработанную за рекордно низкую сумму — $5,6 млн. Более того, в её обучении использовались менее мощные чипы, чем те, что традиционно применяются лидерами индустрии. Это стало катализатором переполоха на фондовом рынке: инвесторы опасаются, что удешевление вычислений может снизить зависимость ИИ-разработок от высокопроизводительных графических процессоров (GPU). В результате акции Nvidia и других производителей полупроводников резко упали. До публикации финансовых отчётов некоторых экспертов волновал вопрос: замедлят ли технологические гиганты темпы инвестиций в ИИ, осознав потенциал DeepSeek? Однако представленные данные и заверения генеральных директоров американских техногигантов показали обратное. ИИ остаётся их стратегическим приоритетом, а инвестиции в это направление продолжают расти. Как отметил один из аналитиков, цифры говорят сами за себя — гипотеза о возможном снижении интереса к ИИ не подтвердилась. Напротив, руководители Meta✴, Microsoft, Amazon и Google не только не рассматривают DeepSeek как угрозу, но и проявляют заинтересованность в интеграции его наработок. Генеральный директор Meta✴ Марк Цукерберг (Mark Zuckerberg) в ходе квартального созвона с инвесторами признался, что компания всё ещё «переваривает» увиденное в DeepSeek R1. Он отметил, что в китайской ИИ-модели применён ряд новаторских решений, которые Meta✴ намерена детально изучить. По его словам, некоторые подходы могут оказаться полезными для совершенствования собственных ИИ-разработок. Кроме того, открытый исходный код DeepSeek делает его технологию доступной для изучения и адаптации в индустрии. Глава Amazon Энди Джасси (Andy Jassy) выразил восхищение некоторыми методами обучения, применёнными в DeepSeek, добавив, что ИИ представляет собой «бизнес-возможность, которая выпадает раз в жизни». Этот комментарий подчёркивает стратегическую значимость технологий машинного обучения для будущего компании. Генеральный директор Alphabet Сундар Пичаи (Sundar Pichai) похвалил команду DeepSeek, назвав её выдающейся. Однако отметил, что не видит в новом китайском ИИ серьёзного конкурента для Google, поскольку ИИ-модели семейства Gemini обладают схожей эффективностью и уже демонстрируют высокий уровень оптимизации. В свою очередь, генеральный директор Apple Тим Кук (Tim Cook) заявил, что инновации, повышающие эффективность, — это всегда позитив. По мнению аналитиков, DeepSeek R1 может сыграть важную роль в будущем мобильных ИИ-решений, поскольку его подход позволяет запускать ИИ-модели прямо на смартфонах, минимизируя зависимость от мощных облачных серверов. Исполнительный директор Microsoft Сатья Наделла (Satya Nadella) сравнил инновации DeepSeek с традиционными циклами развития вычислительной техники, подчеркнув, что компания наблюдает за проектом и считает его примером реальных инноваций. На фоне общего интереса крупнейших IT-компаний к DeepSeek генеральный директор Tesla и xAI Илон Маск (Elon Musk) воздержался от комментариев. Хотя он активно развивает собственный ИИ-проект, его публичные высказывания о DeepSeek остаются неоднозначными. Кроме того, Маск в последнее время сосредоточен на своей деятельности в недавно созданном Департаменте правительственной эффективности США (DOGE). Некоторые его инициативы уже вызвали вопросы со стороны общественности и правозащитников, поскольку их оценивают как потенциально незаконные и неэтичные. Независимые эксперты в области ИИ высоко оценивают значимость DeepSeek. Генеральный директор Evident Insights Александра Мусавизаде (Alexandra Mousavizadeh) назвала этот проект крупным прорывом в сфере больших языковых моделей (LLM), который существенно снижает стоимость генеративного ИИ для пользователей. По её мнению, открытый исходный код неизбежно приведёт к тому, что другие разработчики будут изучать подход DeepSeek и адаптировать его в собственных ИИ-моделях. Это подтверждает, что влияние китайского стартапа на индустрию только начинает набирать силу. Новая ИИ-модель от DeepMind смогла бы получить «золото» на Международной математической олимпиаде
08.02.2025 [19:23],
Владимир Мироненко
DeepMind, дочернее предприятие Google, специализирующееся на исследованиях в сфере искусственного интеллекта (ИИ), сообщило о новых достижениях ИИ-модели AlphaGeometry2 в решении геометрических задач. В недавно опубликованном исследовании DeepMind сообщается, что AlphaGeometry2 успешно решила 84 % задач (42 из 50) Международной математической олимпиады (IMO) с 2000 по 2024 год, набрав средний балл золотого медалиста (40,9). ![]() Источник изображения: Google AlphaGeometry2 является улучшенной версией ИИ-системы AlphaGeometry, вышедшей в январе прошлого года. В июле прошлого года DeepMind продемонстрировала возможности системы, объединившей ИИ-модели AlphaProof и AlphaGeometry2, которой удалось решить 4 из 6 задач IMO. AlphaGeometry2, используя лингвистическую модель на основе архитектуры Gemini и усовершенствованный механизм символической дедукции способна определять стратегии решения задач с точностью, превосходящей возможности большинства экспертов-людей. Принятый подход объединяет два основных компонента: лингвистическую модель, способную генерировать предложения на основе подробного геометрического описания, и символический механизм DDAR (Deductive Database Arithmetic Reasoning), который проверяет логическую связность предлагаемых решений, создавая дедуктивное замыкание на основе доступной информации. Проще говоря, модель Gemini AlphaGeometry2 предлагает символическому механизму шаги и конструкции на формальном математическом языке, и механизм, следуя определённым правилам, проверяет эти шаги на логическую согласованность. Ключевым элементом, который позволил AlphaGeometry2 превзойти по скорости предшественника AlphaGeometry, является алгоритм SKEST (Shared Knowledge Ensemble of Search Trees), который реализует итеративную стратегию поиска, основанную на обмене знаниями между несколькими параллельными деревьями поиска. Это позволяет одновременно исследовать несколько путей решения, увеличивая скорость обработки и улучшая качество сгенерированных доказательств. Эффективность системы удалось значительно повысить с новой реализацией DDAR на C++, что в 300 раз увеличило её скорость по сравнению с версией, написанной на Python. Вместе с тем из-за технических особенностей AlphaGeometry2 пока ограничена в возможности решать задачи с переменным числом точек, нелинейными уравнениями или неравенствами. Поэтому DeepMind изучает новые стратегии, такие как разбиение сложных задач на подзадачи и применение обучения с подкреплением для выхода ИИ на новый уровень в решении сложных математических задач. Как сообщается, AlphaGeometry2 технически не является первой ИИ-системой, достигшей уровня золотого медалиста по геометрии, но она первая, достигшая этого с набором задач такого размера. При этом AlphaGeometry2 использует гибридный подход, поскольку модель Gemini имеет архитектуру нейронной сети, в то время как её символический механизм основан на правилах. Сторонники использования нейронных сетей утверждают, что интеллектуальных действий, от распознавания речи до генерации изображений, можно добиться только благодаря использованию огромных объёмов данных и вычислений. В отличие от символических систем ИИ, которые решают задачи, определяя наборы правил манипуляции символами, предназначенных для определённых задач, нейронные сети пытаются решать задачи посредством статистической аппроксимации (замены одних результатов другими, близкими к исходным) и обучения на примерах. В свою очередь, сторонники символического ИИ считают, что он более подходит для эффективного кодирования глобальных знаний. В DeepMind считают, что поиск новых способов решения сложных геометрических задач, особенно в евклидовой геометрии, может стать ключом к расширению возможностей ИИ. Решение задач требует логического рассуждения и способности выбирать правильный шаг из нескольких возможных. По мнению DeepMind, эти способности будут иметь решающее значение для будущего универсальных моделей ИИ. Крупнейшие IT-компании США потратят более $300 млрд на развитие ИИ в 2025 году
08.02.2025 [06:00],
Анжелла Марина
Ведущие технологические компании США продолжают наращивать расходы на развитие искусственного интеллекта (ИИ), несмотря на рыночные риски. Капитальные затраты в 2024 году Microsoft, Alphabet, Amazon и Meta✴ достигли в совокупности рекорда в $246 млрд, что на 63 % больше, чем годом ранее. В 2025 году эти вложения могут превысить $320 млрд. ![]() Источник изображения: Copilot Основные средства будут направлены на строительство дата-центров и закупку специализированных чипов для разработки больших языковых моделей (LLM), а лидером по объёму инвестиций станет компания Amazon, которая запланировала вложить на эти цели более $100 млрд, сообщает Financial Times. Однако увеличение расходов на ИИ вызвало обеспокоенность инвесторов. Рынок отреагировал на масштабные инвестиционные планы, объявленные наряду с финансовыми результатами за четвёртый квартал. После публикации отчётов о более слабом, чем ожидалось, росте облачных подразделений и увеличении капитальных расходов, рыночная стоимость Microsoft и Alphabet (материнская компания Google) снизилась у каждой на $200 млрд. Инвесторы выражают обеспокоенность тем, что удвоение расходов на ИИ без соразмерного увеличения доходов может привести к сокращению капитала, который мог бы быть направлен на выкуп акций и выплату дивидендов, а также к недофинансированию других направлений бизнеса. Тем более, что компании пока не предоставили чётких данных о доходах от новых ИИ-продуктов, например, таких как Gemini и Copilot. При этом, появление инновационной и недорогой ИИ-модели R1 китайского стартапа DeepSeek в начале января ещё сильнее усилило опасения инвесторов. Заявление DeepSeek о создании модели, сопоставимой по возможностям с продуктами Google и OpenAI, но при этом значительно более дешёвой, моментально привело к падению акций производителя чипов Nvidia на 17 %. Несмотря на давление со стороны акционеров, генеральные директора крупнейших IT-компаний продолжают отстаивать свои стратегии. Так, Сундар Пичаи (Sundar Pichai) из Google заявил, что планирует увеличить расходы компании на 42 % вплоть до $75 млрд в 2025 году, назвав ИИ «возможностью столетия». Глава Microsoft Сатья Наделла (Satya Nadella) подтвердил намерение вложить $80 млрд в развитие облачного сервиса Azure, а генеральный директор Amazon Энди Джесси (Andy Jassy) объявил, что компания инвестирует в ИИ более $100 млрд. Meta✴, напротив, получила положительную реакцию рынка. Её акции выросли, несмотря на обещание Марка Цукерберга (Mark Zuckerberg) вложить «сотни миллиардов» долларов в ИИ. Отмечается, что успех компании связан с тем, что её технологии уже приносят хорошую отдачу — например, при использование ИИ для улучшения таргетинга рекламы на Facebook✴ и Instagram✴. Для сравнения, Google наоборот сталкивается с трудностями в интеграции ИИ в свой поисковик, где новые функции, такие как «ИИ-обзоры», потенциально, по мнению экспертов, вредят традиционной рекламной модели компании. Стоит сказать, что ажиотаж вокруг ИИ не ограничивается публичными компаниями. Сэм Альтман (Sam Altman) из OpenAI заключил партнёрство с SoftBank и Oracle для инвестирования $100 млрд в инфраструктуру, связанную с ИИ в США, с потенциальным увеличением до полутриллиона долларов в будущем. «Может ли в какой-то момент наступить зима ИИ? Конечно, — сказал Риши Джалурия (Rishi Jaluria), аналитик из RBC Capital Markets. — Но если вы находитесь в положении лидера, вы просто не можете сбавлять обороты». DeepSeek набрал 20 млн активных пользователей — больше только у ChatGPT
08.02.2025 [01:11],
Анжелла Марина
Китайский стартап DeepSeek, разработавший бюджетную ИИ-модель, стал настоящей сенсацией в мире технологий. Всего за 20 дней после своего запуска приложение привлекло 20 млн активных пользователей. По данным TrendForce, DeepSeek занял второе место среди самых популярных приложений в мире, уступив лишь ChatGPT. На третьем месте оказалась нейросеть Doubao от ByteDance. ![]() Источник изображения: Solen Feyissa / Unsplash Приложение DeepSeek, запущенное 11 января, уже к 31 января достигло 22,15 млн активных пользователей в день. Это составляет 41,6% от аудитории ChatGPT, которая в тот же период насчитывала 53,23 млн ежедневных пользователей. Ранее лидером китайского рынка был Doubao с 17 млн пользователей, но DeepSeek удалось обойти его по популярности. Успех DeepSeek также прослеживается и в рейтингах Apple App Store, где приложение поднялось на первое место в 157 странах, включая США. Кроме того, по данным сервиса SimilarWeb, сайт DeepSeek обошёл по посещаемости Google Gemini всего за неделю. Так, на момент 31 января DeepSeek посетили 2,4 млн пользователей из США, тогда как для Gemini эта цифра составила 1,5 млн. Отметим, что стремительная популярность DeepSeek привела к активной реакции со стороны крупных китайских компаний. Tencent, Baidu и Alibaba уже объявили о планах интеграции модели DeepSeek в свои облачные платформы. Кроме того, четыре ведущих производителя GPU из Китая, такие как Huawei Ascend, Moore Threads, iluvatar и MetaX, выразили готовность поддерживать развитие стартапа. Google проводит внутреннее тестирование режима искусственного интеллекта в поисковике
07.02.2025 [22:27],
Геннадий Детинич
Покупателей рекламы в Google и владельцев сайтов, которые ожидают переходов по ссылкам после запросов в поисковике, может ожидать неприятный сюрприз в виде снижения посещаемости, который способен принести с собой режим искусственного интеллекта после его интеграции в поисковик компании или в приложения Google. Как раз такой проходит внутреннее тестирование, на что указала утечка из Google. Скриншотом с результатами работы ИИ после заданного пользователем вопроса в поисковике поделился сайт 9to5Google. Исходя из увиденного, можно сделать вывод, что ИИ даёт готовый ответ на заданный вопрос без необходимости переходить на странички и самостоятельно собирать разбросанную по сайтам информацию. Более того, вопрос может быть не до конца сформирован, оставляя ИИ возможность додумать самостоятельно, что ещё может понадобиться пользователю. Если процитировать выдержку из внутренней переписки Google, режим искусственного интеллекта описывается как «интеллектуальный поиск информации для вас — организация информации в удобную для восприятия разбивку со ссылками для изучения контента в интернете». Но после просмотра реферата или выжимки, многие ли пойдут искать первоисточник? А ведь ИИ способен галлюцинировать, и первоисточниками пренебрегать нельзя. Впрочем, есть категория запросов, где ИИ-ответ поисковика будет определённо востребован при недостатке времени на самостоятельный поиск. Это сравнения, советы, обобщения и ряд других, а также реализация возможности задать уточняющий вопрос по теме. Всё это, похоже, или уже есть и тестируется, или будет создано. Также исходя из некоторых деталей на скриншоте, можно заподозрить, что поиск основывается на модели Gemini 2.0. В частности, в примере показан ответ ИИ на вопрос, сколько нужно упаковок спагетти, чтобы накормить 6 взрослых и 10 детей и чтобы хватило для добавки. ИИ подробно отвечает на вопрос с примерным расчетом порций. Также интересны ответы ИИ в поисковике на вопросы «Что мне нужно, чтобы начать заниматься акваскейпингом — дизайном интерьера аквариумов», а также вслед за этим задаётся вопрос о ближайшем магазине с товарами для этого хобби. С таким ИИ-помощником не придётся ходить по ссылкам и смотреть рекламу, а также далеко не все сайты попадут в сводку. Но Google вынуждена следовать за конкурентами в таком начинании, иначе просто потеряет аудиторию. Meta✴ в партнёрстве с ЮНЕСКО запускает новую программу сбора данных для улучшения речи и перевода ИИ
07.02.2025 [18:49],
Сергей Сурабекянц
LTPP (Language Technology Partner Program — партнёрская программа по языковым технологиям) — совместная инициатива ЮНЕСКО и Meta✴ по поиску авторов, которые могут предоставить более 10 часов записей речи с транскрипциями, большие объёмы письменного текста и наборы переведённых текстов на разных языках. В дальнейшем эти данные будут интегрированы в ИИ-модели с открытым исходным кодом для распознавания речи и перевода. Усилия LTPP будут сосредоточены на недостаточно обслуживаемых языках для поддержки работы, уже проводимой в этом направлении ЮНЕСКО. «В конечном итоге наша цель — создать интеллектуальные системы, которые могут понимать и реагировать на сложные потребности человека, независимо от языка или культурного происхождения», — заявил представитель Meta✴. В дополнение к новой инициативе Meta✴ опубликовала открытый исходный код программы для оценки производительности моделей языкового перевода. Тест, состоящий из предложений, созданных лингвистами, поддерживает семь языков, и доступен на платформе разработки ИИ Hugging Face. Meta✴ продолжает расширять количество языков, поддерживаемых её ИИ-моделями и развивать функции автоматического перевода для создателей контента. В сентябре прошлого года компания начала тестирование инструмента для перевода голосов в Instagram✴ Reels, который дублирует речь создателя на другом языке с автоматическим липсинком. На сегодняшний день обработка на платформах Meta✴ контента на языках, отличных от английского, далека от совершенства. По некоторым данным, в соцсети Facebook✴ 79 % дезинформации о COVID на итальянском и испанском языках не были распознаны и отмечены системой, по сравнению с 29 % на английском языке. А сообщения на арабском языке, наоборот, часто ошибочно помечаются как разжигающие ненависть. Meta✴ заявила, что принимает меры по улучшению своих технологий перевода и модерации. И, хотя компания позиционирует обе свои языковые инициативы как филантропические, нет никаких сомнений, что главным бенефициаром этих программ станет именно Meta✴, которая сможет существенно улучшить качество распознавания речи и перевода. Для мелких производителей ИИ-чипов DeepSeek оказалась не угрозой, а шансом
07.02.2025 [18:35],
Павел Котов
DeepSeek потрясла мировой рынок искусственного интеллекта во главе с американскими компаниями — один только производитель ИИ-ускорителей Nvidia потерял несколько сотен миллиардов долларов капитализации. И пока лидеры рынка пытаются преодолеть последствия, мелкие производители видят в случившемся шанс нарастить масштабы деятельности, пишет CNBC. ![]() Источник изображения: Solen Feyissa / unsplash.com «Разработчики очень хотят заменить дорогие и закрытые модели OpenAI моделями с открытым исходным кодом, такими как DeepSeek R1», — считает Эндрю Фельдман (Andrew Feldman), гендиректор стартапа Cerebras Systems, выпускающего чипы для ИИ. Компания выступает конкурентом Nvidia и предлагает облачные сервисы в собственных кластерах. Выход DeepSeek R1 спровоцировал один из крупнейших всплесков спроса на услуги компании за всю её историю, и по словам её главы, показал, что рост рынка ИИ не будет связан с доминированием всего одной компании, потому что открытые модели не привязаны к определённым оборудованию или ПО. DeepSeek утверждает, что её рассуждающая модель потребляет меньше вычислительных ресурсов, чем американские аналоги, и обучается без передовых ускорителей. Китайский стартап способен ускорить процесс развёртывания новых технологий в области ИИ-ускорителей, охватив и обучение моделей, и их запуск. Nvidia занимает доминирующее положение на рынке оборудования для обучения ИИ, и многие её конкуренты считают, что у них есть возможность расширить своё присутствие в области запуска уже обученных моделей, обещая клиентам более высокую эффективность за меньшие деньги. Обучение ИИ требует значительных вычислительных ресурсов, но для работы уже обученной системы достаточно и менее мощного оборудования, ограниченного более узким кругом задач. И здесь разработчики альтернативных ускорителей отмечают рост спроса, потому что многие клиенты готовы решать свои задачи на основе уже обученных моделей DeepSeek. Аналитики и отраслевые эксперты уверены, что китайская лаборатория, которая понизила планку на обучение и запуск систем ИИ, окажет влияние на развитие всей отрасли: если услуги запуска уже обученных моделей станут дешевле, технологии ИИ начнут внедряться активнее, потому что снижение затрат приводит к повышению спроса — это явление называется парадоксом Джевона. Рост спроса подтвердили представители специализирующихся на разработке ускорителей стартапов d-Matrix и Etched. «Благодаря широкой доступности моделей малого размера они послужили катализатором эпохи вывода [ИИ]», — рассказали в d-Matrix. «Компании переводят свои затраты с обучающих кластеров на кластеры вывода», — добавили в Etched, к которой с момента выхода DeepSeek R1 обратились уже десятки корпоративных клиентов. Наконец, следует помнить, что небезграничны и ресурсы Nvidia — даже технологический гигант её масштаба физически не сможет удовлетворить весь мировой спрос на ИИ-ускорители. А значит, у мелких игроков действительно есть шанс. Topaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видео
07.02.2025 [18:32],
Владимир Мироненко
Компания Topaz Labs, специализирующая на разработке программного обеспечения для редактирования фотографий и видео, представила модель ИИ Project Starlight для повышения качества старых кадров из домашней видеоколлекции или архивного контента, качество которого могло со временем ухудшиться в ходе хранения на традиционных носителях. ![]() Источник изображения: Topaz Labs По словам разработчика, это первая в истории диффузионная модель, созданная для этих целей, и ей не требуется ручной ввод данных для исправления видео. Сообщается, что Project Starlight была создана с нуля с использованием новой архитектуры модели с более чем 6 млрд параметров, и её работа поддерживается передовыми ускорителями NVIDIA. Для сравнения, вышедшая в мае 2024 года большая языковая модель GPT-4o от OpenAI с возможностью обработки текста, аудио, изображений и видео в качестве входных данных, изначально имела 8 млрд параметров. Topaz Labs утверждает, что модель «точно восстанавливает детали» и обеспечивает «непревзойдённое восстановление деталей в сочетании с непревзойдённой временной согласованностью». По словам компании, именно в этом и заключается суть её новой модели: улучшение нескольких кадров для достижения высококачественных результатов восстановления без артефактов движения или несоответствий между кадрами и объектами. Project Starlight также автоматически удаляет шумы, устраняет размытость, масштабирует и сглаживает кадры по запросу. Для работы с этой ИИ-моделью вовсе не требуется наличие специальных знаний в области обработки видео. Возвращение старого видео к жизни включает в себя несколько процессов, в том числе масштабирование, цветокоррекцию и сортировку, интерполяцию кадров, устранение повреждений и восстановление звука. Для каждого из этих вариантов восстановления уже созданы инструменты на базе ИИ, но для достижения наилучших результатов всем процессом в настоящее время должны управлять люди. Topaz Labs сообщила, что пользователи могут с помощью её ИИ-модели бесплатно восстанавливать видео длительностью до 10 с, в то время как клипы продолжительностью до 5 минут будут иметь максимальное разрешение 1080p и для этого потребуются кредиты. Версия для корпоративных пользователей поддерживает восстановление более продолжительных видео и с более высоким разрешением. Пока неизвестно, будет ли Project Starlight работать локально или будет интегрирована в другие приложения компании. Главный европейский конкурент OpenAI выпустил ИИ-ассистента Mistral Le Chat для iOS и Android
07.02.2025 [08:34],
Анжелла Марина
Французский стартап Mistral объявил о крупном обновлении своего ИИ-ассистента Le Chat. В борьбе за внимание пользователей разработчики не только значительно улучшили веб-интерфейс, добавили веб-поиск и генерацию изображений по текстовым запросам, но и только что выпустили мобильное приложение для устройств iOS и Android. ![]() Источник изображения: Copilot Одним из ключевых преимуществ Le Chat является скорость работы. Компания утверждает, что использует «самые быстрые на планете алгоритмы принятия решений» и её чат-бот может обрабатывать до 1000 слов в секунду. Кроме того, как пишет TechCrunch, Mistral заявляет о превосходном качестве генерируемых изображений благодаря использованию модели Flux Ultra, разработанной немецкой компанией Black Forest Labs. Разрабатывая собственные большие языковые модели (LLM), Mistral активно выпускает модели с открытым исходным кодом под лицензией Apache 2.0, а также предлагает коммерческое использование своих флагманских версий ИИ, таких как Mistral Large и Pixtral Large, через API или облачных партнёров, включая Azure AI Studio, Amazon Bedrock и Google Vertex AI. Что касается мобильного приложения, то его выпуск является стратегическим для компании шагом, направленным на повышение доступности и удобства использования ИИ-бота, которому можно задавать вопросы и получать ответы в формате интерактивного общения в чате. Отмечается, что за последние месяцы Le Chat претерпел значительные улучшения, превратившись в «компетентного ИИ-помощника». Недавно была добавлена поддержка веб-поиска с указанием источников, а также возможность генерировать изображения и взаимодействовать с платформой для редактирования текста или кода. Стоит также сказать, что компания подписала соглашение с Agence France-Presse (AFP), чтобы обеспечить надёжность и достоверность информации, предоставляемой её ИИ-моделями. Для пользователей, которым требуется больше возможностей, Mistral предлагает Pro-подписку на Le Chat стоимостью $15 в месяц. Pro-подписчики получают доступ к самой производительной модели, повышенные лимиты и улучшенную конфиденциальность. Помимо потребительского сегмента, компания активно развивает корпоративные услуги, с возможностью развёртывания Le Chat в локальной среде с использованием пользовательских моделей (ИИ-агентов) и интерфейсов. Это особенно важно для организаций, работающих в сфере обороны или финансов, где требуется повышенный уровень безопасности и контроля над данными, что, по словам Mistral, «не представляется возможным в настоящее время с ChatGPT Enterprise или Claude Enterprise». Amazon потратит в этом году на развитие вычислительной инфраструктуры $100 млрд — больше Google и Microsoft
07.02.2025 [08:32],
Алексей Разин
Интернет-гигант Amazon оказался последним среди крупнейших игроков рынка облачных вычислений, выступивших в этом квартале с отчётами за предыдущий. Капитальные затраты компании в этом году планируется увеличить с $83 до $100 млрд, тем самым обойдя конкурентов в лице Microsoft, Google и Meta✴ Platforms. ![]() Источник изображения: Amazon Напомним, последняя собирается в текущем году на развитие своей инфраструктуры потратить от $60 до $65 млрд, холдинг Alphabet (Google) выделил $75 млрд, а являющаяся главным акционером OpenAI корпорация Microsoft расщедрилась на $80 млрд. Как видим, AWS готова возглавить этот рейтинг с большим отрывом. По словам генерального директора Энди Джесси (Andy Jassy), основная часть капитальных затрат Amazon в текущем году будет направлена на развитие инфраструктуры ИИ подразделения AWS. Глава Amazon попытался убедить инвесторов, что увеличение капитальных затрат стоит того, назвав текущий момент «бизнес-возможностью, которая даётся раз в жизни». Подобное решение отвечает интересам как бизнеса, так и клиентов Amazon, равно как и акционеров компании, по словам её руководителя. Некоторая часть капитальных затрат всё же будет направлена на развитие торгового бизнеса, чтобы увеличить скорость доставки и снизить стоимость обслуживания клиентов. Сооснователь OpenAI Джон Шульман не проработал в Anthropic и полугода
07.02.2025 [06:40],
Алексей Разин
Бурное развитие систем искусственного интеллекта происходило в последние пару лет при непосредственном участии американского стартапа OpenAI, создавшего нашумевший ChatGPT, но его кадровый состав успел изрядно измениться. В конкурирующую Anthropic менее полугода назад перешёл работать один из основателей первой из компаний Джон Шульман (John Schulman), но долго там не продержался. ![]() Источник изображения: сайт Джона Шульмана В коллектив Anthropic один из главных разработчиков ChatGPT влился в августе прошлого года. Своё решение он тогда обосновал стремлением больше времени уделять регулированию работы искусственного интеллекта и сосредоточиться на технической части подобной деятельности. По его словам, работа в Anthropic позволяла ему развиваться в окружении единомышленников и заниматься теми вещами, которые ему были наиболее интересны. Непосредственно Шульман о своём уходе из Anthropic официально ничего не сообщил, как и не обозначил своих дальнейших намерений. Представители Anthropic в комментариях Bloomberg подтвердили уход Джона Шульмана из компании и выразили своё сожаление по этому поводу, хотя и поддержали стремление бывшего коллеги искать новые возможности для самореализации. Стремительно развивающийся рынок систем искусственного интеллекта даёт неплохие карьерные перспективы тем, кто уже успел себя зарекомендовать в качестве ценного специалиста или руководителя. Google начнёт помечать фотографии пользователей, в которые «вмешался» ИИ
07.02.2025 [05:11],
Анжелла Марина
Приложение «Google Фото» начнёт использовать цифровые водяные знаки SynthID для фотографий, отредактированных с помощью генеративного искусственного интеллекта (ИИ). По заявлению Google, новая функция предназначена для облегчения идентификации изображений, которые были изменены с помощью инструмента Reimagine в Magic Editor. ![]() Источник изображений: Google Magic Editor позволяет легко редактировать фотографии через текстовые запросы, добавляя или удаляя различные детали. Хотя сами по себе ИИ-инструменты не представляют угрозы, Magic Editor может создавать неправомерные компиляции, например разбившиеся вертолёты, сцены аварий, причём без явных меток, указывающих на то, что изображение было изменено. Водяные знаки призваны решить эту проблему. Однако SynthID визуально не изменяет изображение и чтобы понять, что оно было отредактировано ИИ, придётся дополнительно использовать функцию проверки «Об изображении». Более того, Google признаёт, что некоторые небольшие изменения, выполненные через Magic Editor, могут быть настолько незначительными, что SynthID не сможет идентифицировать эти изменения и применить маркировку. Эксперты отмечают, что хотя водяные знаки могут помочь в идентификации компиляций, этой технологии недостаточно для масштабной проверки контента, созданного нейросетями. Для надёжности потребуется использовать целый комплекс подходов и программных средств. Отметим, что система водяных знаков используется в нейросети Google Imagen AI, которая генерирует изображения на основе текста. Аналогичные инструменты были разработаны и другими компаниями, например, функция Content Credentials компании Adobe защищает от несанкционированного доступа к метаданным и позволяет авторам добавлять информацию о себе. Технология SynthID была разработана командой DeepMind и представляет собой цифровой метатег, встроенный в изображения, видео, аудио или текст. Этот тег позволяет идентифицировать, были ли файлы созданы или изменены с помощью ИИ. Исследователи обучили конкурента OpenAI o1 менее чем за полчаса и $50
07.02.2025 [05:06],
Анжелла Марина
Исследователи из Стэнфорда и Университета Вашингтона создали ИИ-модель, которая превосходит OpenAI в решении математических задач. Модель, получившая название s1, была обучена на ограниченном наборе данных из 1000 вопросов методом дистилляции. Это позволило достичь высокой эффективности при минимальных ресурсах и доказать, что крупным компаниям, таким как OpenAI, Microsoft, Meta✴ и Google, возможно не придётся строить огромные дата-центры, заполняя их тысячами графических процессоров Nvidia. ![]() Источник изображения: Growtika / Unsplash Метод дистилляции, который применили учёные, стал ключевым решением в эксперименте. Этот подход позволяет небольшим моделям обучаться на ответах, предоставленных более крупными ИИ-моделями. В данном случае, как пишет The Verge, s1 быстро улучшала свои способности, используя ответы, полученные от модели искусственного интеллекта Gemini 2.0 Flash Thinking Experimental, разработанной компанией Google. Модель s1 была создана на основе проекта Qwen2.5 от Alibaba (подразделение Cloud) с открытым исходным кодом. Первоначально исследователи использовали набор данных из 59 000 вопросов, но в ходе экспериментов пришли к выводу, что увеличение объёма данных не даёт значимых улучшений, и для финального обучения использовали лишь небольшой набор из 1000 вопросов. При этом было использовано всего 16 GPU Nvidia H100 в облаке, за использование которых пришлось заплатить менее $50. В s1 была также применена техника под названием «масштабирование времени тестирования», которая позволяет модели «поразмышлять» перед генерацией ответа. Также исследователи стимулировали модель к перепроверке своих выводов путём добавления команды в виде слова «Wait» («Жди»), что заставляло ИИ продолжать рассуждение и исправлять ошибки в своих ответах. Утверждается, что модель s1 показала впечатляющие результаты и смогла превзойти OpenAI o1-preview на 27 % при решении математических задач. Недавно нашумевшая модель R1 от DeepSeek также использовала аналогичный подход и за сравнительно небольшие деньги. Правда, теперь OpenAI обвиняет DeepSeek в извлечении информации из своих моделей в нарушение условий обслуживания. Стоит сказать, что и в условиях использования Google Gemini указано, что её API запрещено применять для создания конкурирующих чат-ботов. Рост количества меньших и более дешёвых моделей может, по словам экспертов, перевернуть всю отрасль и доказать, что нет необходимости инвестировать миллиарды долларов на обучение ИИ, строить огромные центры обработки данных и закупать в большом количестве GPU. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |