Сегодня 11 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → интеллект
Быстрый переход

Выгоды ИИ распределяются по миру очень неравномерно, и это обеспокоило Сэма Альтмана

Генеральный директор OpenAI Сэм Альтман (Sam Altman) опубликовал эссе, в котором попытался раскрыть проблему дисбаланса в распределении выгод от технологического прогресса. По его мнению, хотя развитие технологий способствует улучшению таких показателей, как здоровье и экономическое благосостояние общества, выгоды от ИИ распределяются неравномерно. В частности, он предложил концепцию «бюджета вычислений» наряду с другими, на первый взгляд, странными идеями, призванными обеспечить всеобщий доступ к передовым ИИ-технологиям и предотвратить дисбаланс между капиталом и трудом, а как следствие — социально-экономические сдвиги.

 Источник изображения: Growtika / Unsplash

Источник изображения: Growtika / Unsplash

Реализация предложенных мер, включая концепцию «бюджета вычислений», направленную на обеспечение доступа всех жителей Земли к значительным вычислительным ресурсам, что, в свою очередь, должно сделать распределение выгод от технологий более справедливым, сталкивается с серьёзными практическими трудностями. Уже сегодня влияние ИИ на рынок труда выражается в сокращении рабочих мест и реструктуризации отделов в большинстве компаний по всему миру. Эксперты предупреждают, что при отсутствии надлежащих государственных мер, таких как программы переподготовки и повышения квалификации, может возникнуть ситуация массовой безработицы, которая лишь усугубит социальное неравенство.

Альтман также акцентировал внимание на приближении сильного ИИ (Artificial General Intelligence или AGI) — системы, способной решать всё более сложные задачи на уровне человека в различных областях. Он предостерёг, что, несмотря на высокую эффективность в отдельных сферах, такие ИИ-системы будут нуждаться в постоянном человеческом контроле и, по его словам, не станут источником самых передовых идей. По мнению Альтмана, именно их масштабное развертывание обеспечит реальную ценность AGI и позволит создавать тысячи, а возможно, и миллионы гиперэффективных систем для решения задач в каждой области интеллектуальной деятельности.

 Источник изображения: OpenAI Forum

Источник изображения: OpenAI Forum

В финансовом аспекте развития ИИ Альтман обратил внимание на масштаб инвестиций и динамику снижения затрат. По имеющимся данным, OpenAI ведёт переговоры о привлечении инвестиций в размере до $40 млрд, а также планирует совместно с партнёрами инвестировать до $500 млрд в создание обширной сети данных. Он также подчеркнул, что стоимость использования «определённого уровня ИИ» снижается в 10 раз каждые 12 месяцев. Это означает, что, хотя расширение границ ИИ-технологий не приведёт к снижению их стоимости, пользователи смогут получать доступ к всё более совершенным ИИ-системам за те же деньги.

Параллельно с развитием технологий OpenAI переходит от некоммерческой модели к традиционной корпоративной структуре. Компания стремится достичь выручки в $100 млрд уже к 2029 году, что сопоставимо с годовыми продажами таких корпораций, как Target и Nestle. Альтман отметил, что для обеспечения безопасности при создании AGI могут потребоваться жёсткие ограничения, которые, вероятно, вызовут критику. Он подчеркнул, что целью OpenAI при разработке AGI является расширение прав и возможностей человека, а также предотвращение использования ИИ авторитарными режимами для контроля над населением посредством массовой слежки. Недавно Альтман заявил, что, по его мнению, OpenAI заняла неправильную позицию в вопросе открытости своих технологий. Хотя в прошлом компания предоставляла открытые решения, в целом она придерживалась проприетарного, закрытого подхода к разработке.

Можно констатировать, что изложенные Альтманом идеи отражают сложную динамику развития ИИ, где технологический прогресс сопряжён с существенными социальными и экономическими вызовами. Масштабные инвестиции, динамичное снижение затрат на вычислительные ресурсы и необходимость строгих мер безопасности свидетельствуют о том, что будущее ИИ требует комплексного и продуманного подхода. При этом стратегическое партнёрство OpenAI с Microsoft остаётся ключевым, а предстоящий AI Action Summit в Париже подчёркивает актуальность обсуждаемых вопросов.

Meta✴ разработала бесконтактный нейроинтерфейс, который считывает нажатия клавиш из мозга пользователя

Учёные компании Meta разработали систему, способную интерпретировать мозговые сигналы и определять, какие клавиши нажимает человек, не прибегая к прямому наблюдению. В ходе эксперимента, проведённого с участием 35 добровольцев, алгоритм на основе глубокой нейронной сети оказался способен достигать 80 % точности при распознавании букв. Однако эта технология остаётся исключительно лабораторной. Несмотря на все ограничения, Meta рассматривает этот проект как стратегическое направление, способное пролить свет на механизмы человеческого мышления и способствовать развитию ИИ.

 Источник изображений: ai.***.com

Источник изображений: ai.meta.com

В далёком 2017 году Марк Цукерберг (Mark Zuckerberg) объявил, что Facebook работает над технологией, которая позволит «набирать текст прямо из мозга». Тогда компания планировала создать компактное устройство — например, шапку или повязку, способную считывать мозговые сигналы и преобразовывать их в текст без необходимости вживления имплантов. Однако реализация этой идеи столкнулась с серьёзными техническими ограничениями, и спустя четыре года Facebook отказался от разработки потребительской версии устройства.

Несмотря на сворачивание коммерческого проекта, Meta продолжила финансировать фундаментальные исследования в области нейронаук. В новой работе, результаты которой изложены в двух препринтах и в блоге компании, учёные использовали метод магнитоэнцефалографии (MEG) — технологию, фиксирующую слабые магнитные поля, создаваемые нейронной активностью. Полученные сигналы подвергались обработке глубокой нейронной сетью, что позволило анализировать мозговую активность человека и сопоставлять её с конкретными нажатиями клавиш.

Жан-Реми Кинг (Jean-Rémi King), руководитель исследовательской группы Meta «Brain & AI», подчёркивает, что главной целью проекта является не создание конечного продукта, а изучение фундаментальных принципов интеллекта. По его словам, понимание архитектуры и механизмов работы человеческого мозга может открыть новые пути в разработке ИИ-систем. В ходе эксперимента система продемонстрировала способность с точностью до 80 % распознавать буквы, которые набирает опытный пользователь, анализируя только мозговые сигналы. Такой уровень точности позволил исследователям воссоздавать целые предложения на основе зарегистрированных нейросигналов. «Попытка понять точную архитектуру или принципы работы человеческого мозга может стать ключом к развитию машинного интеллекта. Именно этот путь мы и исследуем», — утверждает Кинг.

 Эксперимент с 35 участниками использовал EEG/MEG и модель Brain2Qwerty для декодирования текста из мозговых сигналов человека

Эксперимент с 35 участниками использовал EEG/MEG и модель Brain2Qwerty для декодирования текста из мозговых сигналов человека

Однако даже несмотря на впечатляющие результаты, технология остаётся далёкой от практического применения. В эксперименте использовался громоздкий магнитоэнцефалографический сканер стоимостью более $2 млн. Его работа требует помещения с мощной магнитной защитой, поскольку естественное магнитное поле Земли превосходит мозговые сигналы в триллион раз, создавая сильные помехи. К тому же система чрезвычайно чувствительна к движениям: малейшее смещение головы испытуемого приводит к потере сигнала. Кинг подчёркивает, что такие ограничения делают проект непригодным для коммерциализации.

Исследование проводилось на базе Баскского центра познания, мозга и языка (BCBL) в Испании. В нём приняли участие 35 добровольцев, каждый из которых провёл около 20 часов в сканере, набирая текст на испанском языке. Среди вводимых фраз были предложения, например: «el procesador ejecuta la instrucción» («процессор выполняет инструкцию»). Разработанная Meta система, получившая название Brain2Qwerty, анализировала мозговые сигналы участников и сопоставляла их с соответствующими нажатиями клавиш.

На первом этапе обучения алгоритму требовалось проанализировать тысячи введённых символов, прежде чем он мог начать предсказывать буквы, основываясь на зарегистрированных мозговых сигналах. Средний уровень ошибок составил 32 % — почти одна неверно определённая буква на каждые три. Несмотря на это, Meta называет достигнутую точность самой высокой среди всех известных неинвазивных методов набора текста, использующих полный алфавит.

В то время как Meta делает ставку на неинвазивные методы, в области нейроинтерфейсов активно развиваются инвазивные технологии, основанные на вживлении электродов. В 2023 году пациентка с боковым амиотрофическим склерозом (БАС), утратившая способность говорить, вновь обрела возможность общаться благодаря нейроинтерфейсу, передающему её мысли в синтезатор речи. Компания Neuralink, основанная Илоном Маском (Elon Musk), разрабатывает имплантируемые устройства, позволяющие парализованным пациентам управлять курсором компьютера. Хотя такие технологии обеспечивают значительно более точное считывание сигналов, они требуют хирургического вмешательства и связаны с рисками.

Meta не занимается разработкой медицинских устройств и делает ставку на фундаментальную науку. В отличие от электродных интерфейсов, магнитоэнцефалографический сканер не может фиксировать активность отдельных нейронов, но даёт исследователям возможность анализировать работу мозга в целом. Этот метод позволяет отслеживать сложные процессы, охватывающие сразу несколько областей мозга, что особенно важно для изучения когнитивных функций и языкового мышления.

Во втором исследовании, проведённом на тех же данных, учёные Meta изучили, каким образом мозг структурирует языковую информацию. Они подтвердили гипотезу о том, что процесс идёт иерархически: сначала формируется общая мысль, затем активируются области, отвечающие за отдельные слова, затем за слоги, и только в последнюю очередь мозг генерирует сигналы, соответствующие конкретным буквам. Хотя эта концепция не является новой, Meta предоставила дополнительные данные о взаимодействии этих уровней и их динамике.

Хотя разработанная система далека от практического применения, её результаты могут оказать влияние на развитие нейроинтерфейсов и ИИ. Современные языковые модели уже используют алгоритмы, имитирующие обработку информации в человеческом мозге, но более глубокое понимание когнитивных процессов, связанных с формированием языка, может стать ключом к созданию по-настоящему интеллектуальных систем.

Лидеры крупнейших технологических компаний увидели в DeepSeek не угрозу, а прорыв

Сезон корпоративной отчётности крупнейших технологических компаний завершился, выявив неожиданную тенденцию: руководители ведущих IT-гигантов не рассматривают китайский ИИ-стартап DeepSeek как угрозу. Этот ранее малоизвестный проект разработал прорывную ИИ-модель, затратив на её обучение довольно небольшую сумму и используя менее мощные чипы, чем его конкуренты. Однако, вопреки опасениям инвесторов, большинство лидеров индустрии увидели в DeepSeek не вызов, а источник вдохновения и новые возможности для собственных разработок.

 Источник изображения: Solen Feyissa / Unsplash

Источник изображения: Solen Feyissa / Unsplash

Волна роста акций технологического сектора, спровоцированная сезоном корпоративной отчётности, постепенно стихает. Почти все участники американской технологической «Великолепной семёрки» уже опубликовали результаты работы за IV квартал 2024 года, за исключением Nvidia, чей отчёт запланирован на 26 февраля 2025 года. Ключевой темой этого отчётного периода стало наращивание инвестиций в ИИ: Amazon, Google, Meta, Microsoft и Apple демонстрируют стремительный рост затрат на ИИ-разработки.

Отчёт Amazon оказался неоднозначным: показатели прибыли на акцию и выручки превзошли прогнозы Уолл-стрит, но неуверенный прогноз на будущее всё же разочаровал инвесторов, что привело к падению акций компании. Аналитик Evercore назвал это коррекцией ожиданий, подчеркнув, что речь идёт не о фундаментальных проблемах, а о переоценке перспектив.

Помимо квартальной отчётности, неожиданное внимание привлёк китайский ИИ-стартап DeepSeek, ранее неизвестный широкой аудитории. В конце января 2025 года он представил ИИ-модель, разработанную за рекордно низкую сумму — $5,6 млн. Более того, в её обучении использовались менее мощные чипы, чем те, что традиционно применяются лидерами индустрии. Это стало катализатором переполоха на фондовом рынке: инвесторы опасаются, что удешевление вычислений может снизить зависимость ИИ-разработок от высокопроизводительных графических процессоров (GPU). В результате акции Nvidia и других производителей полупроводников резко упали.

До публикации финансовых отчётов некоторых экспертов волновал вопрос: замедлят ли технологические гиганты темпы инвестиций в ИИ, осознав потенциал DeepSeek? Однако представленные данные и заверения генеральных директоров американских техногигантов показали обратное. ИИ остаётся их стратегическим приоритетом, а инвестиции в это направление продолжают расти. Как отметил один из аналитиков, цифры говорят сами за себя — гипотеза о возможном снижении интереса к ИИ не подтвердилась. Напротив, руководители Meta, Microsoft, Amazon и Google не только не рассматривают DeepSeek как угрозу, но и проявляют заинтересованность в интеграции его наработок.

Генеральный директор Meta Марк Цукерберг (Mark Zuckerberg) в ходе квартального созвона с инвесторами признался, что компания всё ещё «переваривает» увиденное в DeepSeek R1. Он отметил, что в китайской ИИ-модели применён ряд новаторских решений, которые Meta намерена детально изучить. По его словам, некоторые подходы могут оказаться полезными для совершенствования собственных ИИ-разработок. Кроме того, открытый исходный код DeepSeek делает его технологию доступной для изучения и адаптации в индустрии.

Глава Amazon Энди Джасси (Andy Jassy) выразил восхищение некоторыми методами обучения, применёнными в DeepSeek, добавив, что ИИ представляет собой «бизнес-возможность, которая выпадает раз в жизни». Этот комментарий подчёркивает стратегическую значимость технологий машинного обучения для будущего компании. Генеральный директор Alphabet Сундар Пичаи (Sundar Pichai) похвалил команду DeepSeek, назвав её выдающейся. Однако отметил, что не видит в новом китайском ИИ серьёзного конкурента для Google, поскольку ИИ-модели семейства Gemini обладают схожей эффективностью и уже демонстрируют высокий уровень оптимизации.

В свою очередь, генеральный директор Apple Тим Кук (Tim Cook) заявил, что инновации, повышающие эффективность, — это всегда позитив. По мнению аналитиков, DeepSeek R1 может сыграть важную роль в будущем мобильных ИИ-решений, поскольку его подход позволяет запускать ИИ-модели прямо на смартфонах, минимизируя зависимость от мощных облачных серверов. Исполнительный директор Microsoft Сатья Наделла (Satya Nadella) сравнил инновации DeepSeek с традиционными циклами развития вычислительной техники, подчеркнув, что компания наблюдает за проектом и считает его примером реальных инноваций.

На фоне общего интереса крупнейших IT-компаний к DeepSeek генеральный директор Tesla и xAI Илон Маск (Elon Musk) воздержался от комментариев. Хотя он активно развивает собственный ИИ-проект, его публичные высказывания о DeepSeek остаются неоднозначными. Кроме того, Маск в последнее время сосредоточен на своей деятельности в недавно созданном Департаменте правительственной эффективности США (DOGE). Некоторые его инициативы уже вызвали вопросы со стороны общественности и правозащитников, поскольку их оценивают как потенциально незаконные и неэтичные.

Независимые эксперты в области ИИ высоко оценивают значимость DeepSeek. Генеральный директор Evident Insights Александра Мусавизаде (Alexandra Mousavizadeh) назвала этот проект крупным прорывом в сфере больших языковых моделей (LLM), который существенно снижает стоимость генеративного ИИ для пользователей. По её мнению, открытый исходный код неизбежно приведёт к тому, что другие разработчики будут изучать подход DeepSeek и адаптировать его в собственных ИИ-моделях. Это подтверждает, что влияние китайского стартапа на индустрию только начинает набирать силу.

Новая ИИ-модель от DeepMind смогла бы получить «золото» на Международной математической олимпиаде

DeepMind, дочернее предприятие Google, специализирующееся на исследованиях в сфере искусственного интеллекта (ИИ), сообщило о новых достижениях ИИ-модели AlphaGeometry2 в решении геометрических задач. В недавно опубликованном исследовании DeepMind сообщается, что AlphaGeometry2 успешно решила 84 % задач (42 из 50) Международной математической олимпиады (IMO) с 2000 по 2024 год, набрав средний балл золотого медалиста (40,9).

 Источник изображения: Google

Источник изображения: Google

AlphaGeometry2 является улучшенной версией ИИ-системы AlphaGeometry, вышедшей в январе прошлого года. В июле прошлого года DeepMind продемонстрировала возможности системы, объединившей ИИ-модели AlphaProof и AlphaGeometry2, которой удалось решить 4 из 6 задач IMO.

AlphaGeometry2, используя лингвистическую модель на основе архитектуры Gemini и усовершенствованный механизм символической дедукции способна определять стратегии решения задач с точностью, превосходящей возможности большинства экспертов-людей.

Принятый подход объединяет два основных компонента: лингвистическую модель, способную генерировать предложения на основе подробного геометрического описания, и символический механизм DDAR (Deductive Database Arithmetic Reasoning), который проверяет логическую связность предлагаемых решений, создавая дедуктивное замыкание на основе доступной информации.

Проще говоря, модель Gemini AlphaGeometry2 предлагает символическому механизму шаги и конструкции на формальном математическом языке, и механизм, следуя определённым правилам, проверяет эти шаги на логическую согласованность.

Ключевым элементом, который позволил AlphaGeometry2 превзойти по скорости предшественника AlphaGeometry, является алгоритм SKEST (Shared Knowledge Ensemble of Search Trees), который реализует итеративную стратегию поиска, основанную на обмене знаниями между несколькими параллельными деревьями поиска. Это позволяет одновременно исследовать несколько путей решения, увеличивая скорость обработки и улучшая качество сгенерированных доказательств.

Эффективность системы удалось значительно повысить с новой реализацией DDAR на C++, что в 300 раз увеличило её скорость по сравнению с версией, написанной на Python.

Вместе с тем из-за технических особенностей AlphaGeometry2 пока ограничена в возможности решать задачи с переменным числом точек, нелинейными уравнениями или неравенствами. Поэтому DeepMind изучает новые стратегии, такие как разбиение сложных задач на подзадачи и применение обучения с подкреплением для выхода ИИ на новый уровень в решении сложных математических задач.

Как сообщается, AlphaGeometry2 технически не является первой ИИ-системой, достигшей уровня золотого медалиста по геометрии, но она первая, достигшая этого с набором задач такого размера.

При этом AlphaGeometry2 использует гибридный подход, поскольку модель Gemini имеет архитектуру нейронной сети, в то время как её символический механизм основан на правилах.

Сторонники использования нейронных сетей утверждают, что интеллектуальных действий, от распознавания речи до генерации изображений, можно добиться только благодаря использованию огромных объёмов данных и вычислений. В отличие от символических систем ИИ, которые решают задачи, определяя наборы правил манипуляции символами, предназначенных для определённых задач, нейронные сети пытаются решать задачи посредством статистической аппроксимации (замены одних результатов другими, близкими к исходным) и обучения на примерах. В свою очередь, сторонники символического ИИ считают, что он более подходит для эффективного кодирования глобальных знаний.

В DeepMind считают, что поиск новых способов решения сложных геометрических задач, особенно в евклидовой геометрии, может стать ключом к расширению возможностей ИИ. Решение задач требует логического рассуждения и способности выбирать правильный шаг из нескольких возможных. По мнению DeepMind, эти способности будут иметь решающее значение для будущего универсальных моделей ИИ.

Google проводит внутреннее тестирование режима искусственного интеллекта в поисковике

Покупателей рекламы в Google и владельцев сайтов, которые ожидают переходов по ссылкам после запросов в поисковике, может ожидать неприятный сюрприз в виде снижения посещаемости, который способен принести с собой режим искусственного интеллекта после его интеграции в поисковик компании или в приложения Google. Как раз такой проходит внутреннее тестирование, на что указала утечка из Google.

 Источник изображения: 9to5Google

Источник изображения: 9to5Google

Скриншотом с результатами работы ИИ после заданного пользователем вопроса в поисковике поделился сайт 9to5Google. Исходя из увиденного, можно сделать вывод, что ИИ даёт готовый ответ на заданный вопрос без необходимости переходить на странички и самостоятельно собирать разбросанную по сайтам информацию. Более того, вопрос может быть не до конца сформирован, оставляя ИИ возможность додумать самостоятельно, что ещё может понадобиться пользователю.

Если процитировать выдержку из внутренней переписки Google, режим искусственного интеллекта описывается как «интеллектуальный поиск информации для вас — организация информации в удобную для восприятия разбивку со ссылками для изучения контента в интернете». Но после просмотра реферата или выжимки, многие ли пойдут искать первоисточник? А ведь ИИ способен галлюцинировать, и первоисточниками пренебрегать нельзя.

Впрочем, есть категория запросов, где ИИ-ответ поисковика будет определённо востребован при недостатке времени на самостоятельный поиск. Это сравнения, советы, обобщения и ряд других, а также реализация возможности задать уточняющий вопрос по теме. Всё это, похоже, или уже есть и тестируется, или будет создано.

Также исходя из некоторых деталей на скриншоте, можно заподозрить, что поиск основывается на модели Gemini 2.0.

В частности, в примере показан ответ ИИ на вопрос, сколько нужно упаковок спагетти, чтобы накормить 6 взрослых и 10 детей и чтобы хватило для добавки. ИИ подробно отвечает на вопрос с примерным расчетом порций. Также интересны ответы ИИ в поисковике на вопросы «Что мне нужно, чтобы начать заниматься акваскейпингом — дизайном интерьера аквариумов», а также вслед за этим задаётся вопрос о ближайшем магазине с товарами для этого хобби.

С таким ИИ-помощником не придётся ходить по ссылкам и смотреть рекламу, а также далеко не все сайты попадут в сводку. Но Google вынуждена следовать за конкурентами в таком начинании, иначе просто потеряет аудиторию.

Meta✴ в партнёрстве с ЮНЕСКО запускает новую программу сбора данных для улучшения речи и перевода ИИ

LTPP (Language Technology Partner Program — партнёрская программа по языковым технологиям) — совместная инициатива ЮНЕСКО и Meta по поиску авторов, которые могут предоставить более 10 часов записей речи с транскрипциями, большие объёмы письменного текста и наборы переведённых текстов на разных языках. В дальнейшем эти данные будут интегрированы в ИИ-модели с открытым исходным кодом для распознавания речи и перевода.

 Источник изображения: dailysabah.com

Источник изображения: UNESCO

Усилия LTPP будут сосредоточены на недостаточно обслуживаемых языках для поддержки работы, уже проводимой в этом направлении ЮНЕСКО. «В конечном итоге наша цель — создать интеллектуальные системы, которые могут понимать и реагировать на сложные потребности человека, независимо от языка или культурного происхождения», — заявил представитель Meta.

В дополнение к новой инициативе Meta опубликовала открытый исходный код программы для оценки производительности моделей языкового перевода. Тест, состоящий из предложений, созданных лингвистами, поддерживает семь языков, и доступен на платформе разработки ИИ Hugging Face.

Meta продолжает расширять количество языков, поддерживаемых её ИИ-моделями и развивать функции автоматического перевода для создателей контента. В сентябре прошлого года компания начала тестирование инструмента для перевода голосов в Instagram Reels, который дублирует речь создателя на другом языке с автоматическим липсинком.

На сегодняшний день обработка на платформах Meta контента на языках, отличных от английского, далека от совершенства. По некоторым данным, в соцсети Facebook 79 % дезинформации о COVID на итальянском и испанском языках не были распознаны и отмечены системой, по сравнению с 29 % на английском языке. А сообщения на арабском языке, наоборот, часто ошибочно помечаются как разжигающие ненависть.

Meta заявила, что принимает меры по улучшению своих технологий перевода и модерации. И, хотя компания позиционирует обе свои языковые инициативы как филантропические, нет никаких сомнений, что главным бенефициаром этих программ станет именно Meta, которая сможет существенно улучшить качество распознавания речи и перевода.

Topaz Labs представила диффузную ИИ-модель, которая автоматически улучшает старые видео

Компания Topaz Labs, специализирующая на разработке программного обеспечения для редактирования фотографий и видео, представила модель ИИ Project Starlight для повышения качества старых кадров из домашней видеоколлекции или архивного контента, качество которого могло со временем ухудшиться в ходе хранения на традиционных носителях.

 Источник изображения: Topaz Labs

Источник изображения: Topaz Labs

По словам разработчика, это первая в истории диффузионная модель, созданная для этих целей, и ей не требуется ручной ввод данных для исправления видео. Сообщается, что Project Starlight была создана с нуля с использованием новой архитектуры модели с более чем 6 млрд параметров, и её работа поддерживается передовыми ускорителями NVIDIA. Для сравнения, вышедшая в мае 2024 года большая языковая модель GPT-4o от OpenAI с возможностью обработки текста, аудио, изображений и видео в качестве входных данных, изначально имела 8 млрд параметров.

Topaz Labs утверждает, что модель «точно восстанавливает детали» и обеспечивает «непревзойдённое восстановление деталей в сочетании с непревзойдённой временной согласованностью». По словам компании, именно в этом и заключается суть её новой модели: улучшение нескольких кадров для достижения высококачественных результатов восстановления без артефактов движения или несоответствий между кадрами и объектами.

Project Starlight также автоматически удаляет шумы, устраняет размытость, масштабирует и сглаживает кадры по запросу. Для работы с этой ИИ-моделью вовсе не требуется наличие специальных знаний в области обработки видео.

Возвращение старого видео к жизни включает в себя несколько процессов, в том числе масштабирование, цветокоррекцию и сортировку, интерполяцию кадров, устранение повреждений и восстановление звука. Для каждого из этих вариантов восстановления уже созданы инструменты на базе ИИ, но для достижения наилучших результатов всем процессом в настоящее время должны управлять люди.

Topaz Labs сообщила, что пользователи могут с помощью её ИИ-модели бесплатно восстанавливать видео длительностью до 10 с, в то время как клипы продолжительностью до 5 минут будут иметь максимальное разрешение 1080p и для этого потребуются кредиты. Версия для корпоративных пользователей поддерживает восстановление более продолжительных видео и с более высоким разрешением. Пока неизвестно, будет ли Project Starlight работать локально или будет интегрирована в другие приложения компании.

Представлен робот iDEAR для быстрого извлечения из компьютера всех ценных компонентов

Электронные устройства устаревают с пугающей скоростью, и проблема их утилизации становится все более актуальной. К 2030 году мировое производство электронных отходов достигнет 82 миллионов тонн в год, а нынешнее состояние их переработки очень далеко от идеального. Для исправления ситуации немецкие исследователи из института Фраунгофера разработали автоматизированную систему интеллектуальной разборки электроники iDEAR на основе ИИ.

 Источник изображений: techspot.com

Источник изображений: techspot.com

Проблему электронных отходов трудно переоценить. Только Евросоюз произвёл около пяти миллионов тонн электронных отходов в 2022 году. США генерируют от 6,9 до 7,6 миллионов тонн электронных отходов ежегодно, что составляет около 21 кг на человека в год. По прогнозам, к 2030 году мировое производство электронных отходов увеличится до 74,7–82 миллионов тонн.

Нынешнее состояние переработки электронных отходов далеко от идеального. Производственные процессы в электронной промышленности ставят во главу угла экономическую эффективность, что приводит к выпуску устройств, которые плохо поддаются переработке в конце своего жизненного цикла. Традиционные методы часто подразумевают ручную разборку, которая является дорогостоящей и неэффективной. А многие устройства в конечном итоге просто измельчаются, что ограничивает возможность извлечения ценных компонентов.

Для решения проблемы переработки и утилизации электроники исследователи из института Фраунгофера в Магдебурге, Германия, разработали iDEAR (Intelligent Disassembly of Electronics for Remanufacturing and Recycling — интеллектуальная разборка электроники для восстановления и переработки). iDEAR кардинально повышает эффективность переработки электронных отходов и потенциально обеспечивает извлечение многих видов ценного сырья. На сегодняшний день iDEAR уже успешно справляется с извлечением материнских плат из корпусов ПК.

Процесс интеллектуальной разборки iDEAR начинается с этапа идентификации и диагностики. 3D-камеры и оптические сенсорные системы на базе ИИ сканируют электронные отходы, собирая ​​информацию о производителе, типе продукта и его серийном номере. Происходит обнаружение и сканирование этикеток и других надписей. Одновременно оценивается состояние компонентов и соединительных элементов, таких как винты и заклёпки. Алгоритмы машинного обучения в режиме реального времени идентифицируют и классифицируют состав устройства. iDEAR без проблем справляется с определением потайного и заржавевшего крепежа.

Ключевым нововведением в проекте iDEAR является создание цифрового «двойника разборки» для каждого продукта, включая информацию о его компонентах и ​​любой предыдущей операции с ним. После тщательного анализа устройства система определяет последовательности разборки с помощью специализированного ПО. Принимается решение, следует ли производить полную или частичную разборку, причём приоритет отдаётся извлечению ценных компонентов. Затем робот получает сгенерированную последовательность инструкций, включая откручивание винтов, вскрытие корпусов и извлечение компонентов.

Хотя в настоящее время проект iDEAR сосредоточен на переработке ПК, у исследователей амбициозные планы на будущее. Они работают над универсальной системой, которая сможет самостоятельно адаптироваться к широкому спектру электронных устройств — от микроволновых печей до крупных бытовых приборов — с минимальными инженерными усилиями.

Российские специалисты из Smart Engines расшифровали рукописи Пушкина при помощи ИИ

Специалисты российской компании Smart Engines расшифровали зачёркнутые фрагменты черновых рукописей Александра Пушкина с помощью разработанной ими системы искусственного интеллекта «Да Винчи». Нейросетевая архитектура «Да Винчи» широко используется для распознавания документов, в частности российских паспортов, вне зависимости от угла и условий съёмки.

 Источник изображения: Wikipedia, «Литературные места России»

Источник изображения: Wikipedia, «Литературные места России»

В процессе обучения ИИ запомнил, какие движения пера в незачёркнутых словах характерны для почерка великого русского поэта, а затем восстановил утраченные места, пользуясь созданной моделью движений его руки. Таким способом удалось идентифицировать несколько неопределяемых ранее слов из черновых рукописей Пушкина. Эти находки внесли существенный вклад в понимание творческого процесса поэта.

Узнать, какие слова пришлись Пушкину не по душе, удалось с помощью нейросетевой архитектуры «Да Винчи», разработанной специалистами Smart Engines для удаления линий разграфки, затрудняющих распознавание рукописных данных в официальных документах. Эта технология позволяет автоматически определять геометрию документа и распознавать данные вне зависимости от его расположения в кадре, наличия помех и искажений. Технология одинаково успешно справляется как со сканами, так и с фотографиями документов, в том числе в зеркальном отражении.

Алгоритмы Smart Engines уже интегрированы в решения для мгновенного распознавания данных паспорта и других документов. Распознавание паспорта РФ при помощи камеры смартфона требует всего 0,15 секунды. Серверные решения позволяют распознавать до 55 паспортов в секунду на процессор без использования GPU.

 Источник изображения: Smart Engines

Источник изображения: Smart Engines

«Проведённый нами эксперимент по расшифровке ранее нечитаемых слов в рукописях Александра Пушкина подтвердил колоссальный потенциал нейросетей в самых разных областях науки. Мы видим, что искусственный интеллект может стать надёжным инструментом для исследователя […] Предложенный метод снятия зачёркиваний при помощи ИИ может быть применён не только к рукописям Пушкина, но и к архивным записям других известных авторов, а также историческим документам. Это открывает новые возможности для изучения творческого процесса написания знаменитых литературных произведений», — уверен генеральный директор Smart Engines Владимир Арлазаров.

Остаётся неясным лишь одно: если великий русский поэт какие-то слова зачёркивал, возможно, он не хотел, чтобы кто-нибудь их прочитал, в том числе и искусственный интеллект?

DeepSeek не справилась с популярностью — доступ к ИИ-моделям теперь ограничен

Китайский стартап DeepSeek, вызвавший шок в Кремниевой долине своей моделью ИИ R1, способной к рассуждениям, из-за достижения высокого результата с использованием гораздо меньших ресурсов и средств, объявил об ограничении доступа к своему сервису API из-за нехватки серверных мощностей, пишет Bloomberg.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

На веб-сайте DeepSeek сообщается о приостановке возможности клиентов пополнять свои API-кредиты, чтобы избежать негативных последствий для сервисов компании. Все существующие сохранённые значения не будут затронуты, добавила DeepSeek. «Текущая сумма пополнения может продолжать использоваться, просим вашего понимания!» — заявила компания.

Также DeepSeek, чьи крайне низкие тарифы встревожили некоторых конкурентов, указала в сообщении, что скидки на доступ к её ИИ-модели прекратятся 8 февраля. Далее доступ к чат-боту на основе ИИ будет оплачиваться из расчёта 2 юаня ($0,27) за 1 млн входящих токенов и 8 юаней ($1,10) за 1 млн исходящих токенов. При запуске в Сети модели со способностью к рассуждениям тарифы составят 4 юаня ($0,55) за 1 млн входящих токенов и 16 юаней ($2,19) за 1 млн исходящих токенов.

Из-за высокого спроса сервисы DeepSeek работают с повышенной нагрузкой с конца января после того, как был представлен чат-бот AI Assistant на основе искусственного интеллекта, который, по словам компании, способен конкурировать с чат-ботом ChatGPT от OpenAI, и на его разработку ушло гораздо меньше средств, чем у конкурентов. Это утверждение вызвало сомнение в США, и сейчас американские чиновники выясняют, не приобрела ли DeepSeek передовые ИИ-ускорители Nvidia через третьих лиц в Сингапуре, обойдя экспортные ограничения на поставки полупроводников в Китай.

ИИ-боту ChatGPT теперь можно отправлять голосовые сообщения и фото через WhatsApp

Разработчики генеративных нейросетей, которые могут создавать контент на основе текстовых или иных подсказок, продолжают расширять доступность своих алгоритмов через интеграцию с другими популярными сервисами. В декабре OpenAI позволила связываться с чат-ботом ChatGPT через WhatsApp, а теперь расширила функциональность этого сервиса.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Для взаимодействия с чат-ботом в мессенджере нужно добавить в контакты номер 1(800)CHAT-GPT или 1(800)242-84-78. Ранее у пользователей была возможность взаимодействовать с ИИ-ботом только посредством текстовых сообщений, а теперь алгоритм научился обрабатывать изображения и голосовые сообщения, которые можно направлять в чат «Talk to ChatGPT». После обработки сообщения от пользователя алгоритм выдаст текстовый ответ на заданный голосом вопрос.

В дополнение к этому пользователи могут привязать к своему аккаунту в мессенджере действующий тарифный план ChatGPT Plus или Pro, чтобы активнее пользоваться ИИ-ботом прямо в сервисе Meta. Напомним, об интеграции ChatGPT с мессенджером WhatsApp было объявлено в декабре прошлого года. Собственный чат-бота Meta на базе нейросети также доступен в приложении.

Добавим, что также в декабре OpenAI запустила возможность связаться с ChatGPT по телефону, даже стационарному — достаточно лишь набрать упомянутый выше номер. Услуга доступна для жителей США. Бесплатно можно пообщаться с ИИ в течение 15 минут.

Поиск Google изменится в 2025 году — компания хочет сделать его более похожим на ИИ-помощника

Поисковая система Google находится в процессе «путешествия» вокруг искусственного интеллекта, заявил генеральный директор компании Сундар Пичаи (Sundar Pichai) во время подведения финансовых итогов на этой неделе. Началом этого путешествия стали ИИ-сводки — спорный, но существенный сдвиг в том, как Google предоставляет информацию миллиардам пользователей своего поисковика.

 Источник изображения: Firmbee.com/unsplash.com

Источник изображения: Firmbee.com/unsplash.com

Компания не намерена останавливаться на достигнутом. «Поскольку искусственный интеллект расширяет спектр запросов, которые могут задавать люди, 2025 год станет одним из самых важных для поисковых инноваций», — заявил Пичаи. Во время выступления он рассказал о следующем этапе плана Google по наполнению поисковика ИИ-функциями, которые разработаны специалистами DeepMind.

Согласно плану Google, поисковик постепенно должен стать более похожим на ИИ-помощника, который вместо пользователя просматривает веб-страницы, анализирует информацию и выдаёт обобщённый ответ. Эта концепция далека от поисковика, который просто выдаёт ссылки в ответ на запросы. Google не первый год идёт по этому пути, поскольку в конце 2022 года поисковый гигант был застигнут врасплох появлением ChatGPT от OpenAI. Однако предстоящие изменения в поисковой системе будут иметь серьёзные последствия для сайтов, зависящих от трафика Google, а также компаний, покупающих рекламу в поисковике Google.

Отвечая на вопрос о будущем ИИ и поисковика, Пичаи сказал, что будущее можно представить, глядя на Project Astra, имея ввиду мультимодальную ИИ-систему от DeepMind. Этот алгоритм может обрабатывать видео в режиме онлайн с камеры или экрана компьютера, отвечая на вопросы о происходящем на экране. У Google большие планы на Project Astra и в других сферах бизнеса. Например, Google хочет сделать мультимодальную ИИ-систему основой очков дополненной реальности.

Пичаи также упомянул так называемого ИИ-агента Gemini Deep Research, который способен проводить более детальные исследования, в течение нескольких минут анализируя информацию из разных источников и подготавливая обобщённый ответ на запрос пользователя. По мнению Пичаи, это решение поможет автоматизировать процессы, которые люди традиционно выполняют с помощью поисковика компании.

«Вы действительно значительно расширяете варианты использования поисковой системы, задавая вопросы, на которые не всегда можно получить мгновенный ответ, но решить их можно, потратив некоторое время. Все это в области исследований, и вы увидите, как в течение 2025 года мы будем предлагать пользователям новые возможности», — сказал Пичаи во время выступления.

В дополнение к этому глава компании упомянул, что у компании есть «чёткое представление» о возможностях поиска, и их расширении с помощью другого ИИ-агента Project Mariner. Он сможет взаимодействовать с интерфейсом веб-сайтов от имени пользователя, что избавит людей от необходимости работы с сайтами. Пичаи также упомянул, что компания может сделать интерфейс поисковика более похожим на чат-бота, но не стал вдаваться в подробности этого.

Google отказалась от обещания не использовать ИИ в военных и шпионских целях

Компания Google пересмотрела свою позицию в области безопасности искусственного интеллекта (ИИ), убрав обещание не применять ИИ для военных и разведывательных целей. Прежние правила, введённые в 2018 году, были обновлены и опубликованы в официальном блоге компании, сообщает The Washington Post.

 Источник изображения: Copilot

Источник изображения: Copilot

Ранее компания заявляла, что не будет заниматься четырьмя категориями применения ИИ: оружием, слежкой, технологиями, «способными нанести вред», и проектами, нарушающими международное право и права человека. Эти ограничения делали Google исключением среди лидеров рынка ИИ. Например, Microsoft и Amazon давно сотрудничают с Пентагоном. Их примеру последовали OpenAI и Anthropic, которые сотрудничают с оборонными подрядчиками США, такими как Anduril и Palantir.

По словам экспертов, решение Google отражает растущее значение ИИ для национальной обороны США. Профессор политологии Майкл Горовиц (Michael Horowitz) из Пенсильванского университета отметил, что это логичный шаг, поскольку технологии ИИ становятся всё более важными для американской армии. «Заявление Google является ещё одним доказательством того, что отношения между технологическим сектором США и Министерством обороны продолжают становиться всё теснее, включая ведущие компании в области ИИ», — сказал Горовиц.

Однако критики, такие как Лилли Ирани (Lilly Irani), бывший сотрудник Google и профессор Калифорнийского университета в Сан-Диего, считают, что «обещания компании соблюдать международные законы и права человека часто оказываются пустыми словами».

Напомним, Google впервые ввела этические принципы после протестов сотрудников против контракта с Пентагоном, известного как Project Maven. Этот проект предполагал использование алгоритмов компьютерного зрения для анализа данных с дронов. Тогда тысячи работников подписали петицию, требуя прекратить участие компании в военных проектах, что Google и сделала, отказавшись не только от контракта, но и пообещав не участвовать в разработке оружия. Однако новое изменение политики свидетельствует о том, что приоритеты компании изменились.

ЕС выпустил руководство по использованию ИИ, запрещенного «Законом об ИИ»

В Евросоюзе вступили в силу первые правила, предусмотренные Законом об искусственном интеллекте (AI Act), который направлен на регулирование использования ИИ в соответствии с уровнем риска. Этот закон запрещает определённые сценарии применения технологий, представляющие «неприемлемый риск», включая манипуляции с использованием техник, воздействующих на подсознание, а также социальный скоринг, который может привести к дискриминации людей.

 Источник изображения: Growtika/Unsplash

Источник изображения: Growtika/Unsplash

По сообщению TechCrunch, исполнительный орган ЕС во вторник опубликовал руководство, разъясняющее разработчикам, как соответствовать необходимым требованиям. Эти рекомендации касаются запретов на определённые сценарии применения ИИ, нарушение которых может привести к крупным штрафам — вплоть до 7 % глобального оборота компании или €35 млн (в зависимости от того, что больше).

«Рекомендации разработаны для обеспечения единообразного и эффективного применения AI Act на всей территории Европейского союза», — говорится в заявлении Комиссии. При этом отмечается, что рекомендации не являются юридически обязательными и окончательное толкование и применение закона останется за регуляторами и судами.

Комиссия уточнила, что документ включает юридические разъяснения и практические примеры, которые помогут заинтересованным сторонам понять и выполнить требования закона. На текущий момент рекомендации опубликованы в черновом варианте и будут окончательно утверждены после перевода на все официальные языки ЕС.

Хотя «Закон об ИИ» вступил в силу ещё в прошлом году, его реализация продолжается. В ближайшие месяцы и годы вступят в силу дополнительные положения закона. При этом надзор за выполнением правил будет вводиться поэтапно: до 2 августа государства-члены ЕС должны назначить органы, которые будут следить за соблюдением норм.

Adobe Acrobat получил переводчик с юридического языка на человеческий

Программный пакет Adobe Acrobat для работы с PDF-файлами получил новые инструменты для своего ИИ-ассистента, которые помогут пользователям лучше понимать контракты и сложные соглашения. Новые возможности «интеллекта контрактов» позволяют встроенному в Acrobat чат-боту автоматически распознавать файлы и отсканированные документы, содержащие замысловатые юридические формулировки, и перерабатывать их сложный стиль, делая более понятными для пользователей.

 Источник изображений: Adobe

Источник изображений: Adobe

Adobe полагает, что «интеллект контрактов» сэкономит время пользователей, которое они в противном случае потратили бы на попытки понять длинные и сложные документы. Компания ссылается на недавний опрос, который показал, что 70 % потребителей подписывали соглашения, не зная всех их условий.

По утверждению Adobe, новая функция умеет находить и отображать ключевые юридические термины, генерировать цитаты и рекомендуемые вопросы для определённых документов, а также сравнивать изменения в десяти различных версиях контракта для проверки согласованности и несоответствий. Это облегчит обнаружение в длинных контрактах таких данных, как важные даты, конкретные политики и расходы, которые иначе могли остаться незамеченными из-за сложности и объёмности документа. А ещё от взора ИИ не скроется мелкий шрифт.

Обновлённый ИИ-помощник доступен в виде дополнения за $4,99 в месяц для пользователей Acrobat с бесплатными или платными индивидуальными учётными записями. Обновление «интеллекта контрактов» доступно по всему миру с сегодняшнего дня на настольных компьютерах, мобильных устройствах и в веб-сервисах. Пока инструмент поддерживает только английский язык, но в дальнейшем Adobe обещает добавить и другие.

«Клиенты открывают миллиарды контрактов в Adobe Acrobat каждый месяц, и ИИ может стать решающим фактором, упрощая их опыт», — считает руководитель Adobe Document Cloud Абхигьян Моди (Abhigyan Modi).


window-new
Soft
Hard
Тренды 🔥
Nvidia представила технологию сжатия текстур на основе ИИ, позволяющую экономить использование VRAM до 95 % 7 мин.
Google обновила ИИ-блокнот NotebookLM и включила его в подписку One AI Premium 29 мин.
Франция вложит в ИИ €109 млрд, чтобы догнать и перегнать OpenAI, DeepSeek и прочих 5 ч.
В Steam начался фестиваль локальных кооперативов со скидками на игры, которые проверяют дружбу на прочность 6 ч.
Автор самого популярного мода для Elden Ring добавит бесшовный кооператив в Dark Souls 3 — первая демонстрация 7 ч.
Над Microsoft нависла угроза крупного штрафа во Франции — её заподозрили в нечестной конкуренции с помощью Bing 8 ч.
В разгар слухов о февральской State of Play магазин Xbox «засветил» дату выхода Hell is Us — мрачного боевика от команды арт-директора последних Deus Ex 9 ч.
«Вы обесцениваете весь опыт»: соавтор Diablo объяснил, в чём главная проблема современных ARPG 10 ч.
Cloud.ru заморозит цены на облака для новых клиентов на три года 11 ч.
Релиз «Альт Сервер» 10.4: новые инструменты для администраторов и улучшенный контроллер доменов 15 ч.
Агрегатор обмена криптовалюты BestChange опять попал под блокировку Роскомнадзора 27 мин.
Маск предложил купить OpenAI за $97,4 млрд, чтобы вернуть её на сторону добра 4 ч.
Новая статья: Обзор тройного складного смартфона HUAWEI Mate XT Ultimate Design: особенный 5 ч.
В России поступили в продажу обновлённые ноутбуки HONOR MagicBook X16 (2025) и MagicBook X14 (2025) 5 ч.
В Россию официально начнут завозить электромобили Xiaomi 6 ч.
Макрон объявил о французском ответе на американский ИИ-мегапроект Stargate с инвестициями на €109 млрд 7 ч.
Groq развернула в Саудовской Аравии почти 20 тыс. ИИ-ускорителей LPU 10 ч.
У китайской BOE снова проблемы с качеством дисплеев для iPhone — от этого выиграет Samsung 11 ч.
OpenAI завершит разработку и запустит производство своего ИИ-чипа уже в 2025 году — это первый шаг к снижению зависимости от Nvidia 12 ч.
Госпрограмму «Космическая деятельность России» продлили до 2036 года 12 ч.