Сегодня 14 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → google
Быстрый переход

Google не удалось оспорить в России третий оборотный штраф на 4,6 млрд рублей

Мосгорсуд признал законным решение Таганского районного суда Москвы взыскать с Google 4,6 млрд рублей за систематическое неудаление недостоверных сведений о спецоперации на Украине и другой запрещённой в России информации.

 Источник изображения: Mitchell Luo / unsplash.com

Источник изображения: Mitchell Luo / unsplash.com

Это был третий оборотный штраф, назначенный Google LLC. Первый, в размере 7,2 млрд рублей, компания получила в декабре 2021 года, второй, уже на 21,07 млрд рублей, — в июле 2022 года. Чуть позже ООО «Гугл» обратилось в суд для признания компании банкротом, однако судебные приставы отчитались, что полностью взыскали оборотные штрафы.

По материалам дела, поводом для протокола в отношении Google послужили ролики на YouTube с недостоверной информацией о потерях российской армии на СВО, жертвах среди мирного населения и планах применения ядерного оружия. В других роликах присутствовала пропаганда нетрадиционных сексуальных отношений и материалы экстремистского характера. На повторное требование Роскомнадзора удалить видеоматериалы компания не отреагировала.

ИИ-инструменты для редактирования в «Google Фото» станут бесплатными для всех

Сегодня Google объявила, что некоторые расширенные функции редактирования фотографий в «Google Фото», ранее доступные лишь на смартфонах Pixel и пользователям с платной подпиской Google One, с мая станут доступны бесплатно всем пользователям. В том числе бесплатным станет основанный на искусственном интеллекте инструмент Magic Editor для сложного редактирования фотографий.

 Источник изображений: Google

Источник изображений: Google

Бесплатными станут Google Magic Eraser для удаления лишних объектов с фото, Photo Unblur для повышения чёткоcти размытых изображений, Portrait Light для изменения источника освещения на портретах и другие инструменты. Развёртывание обновления начнётся 15 мая, после чего в течение нескольких недель новые возможности откроются всем пользователям «Google Фото». Однако есть некоторые ограничения: вам потребуется смартфон под управлением Android 8.0 или iOS 15 или более свежими ОС, либо Chromebook с минимум 3 Гбайт оперативной памяти и ChromeOS начиная с версии 118.

Один из самых заметных инструментов — представленный с Pixel 8 в прошлом году Magic Editor. Он позволяет воспользоваться возможностями ИИ для сложного редактирования фотографий, например, заполнения пустот, изменения положения объекта съёмки, правки переднего и заднего плана и так далее. Magic Editor позволяет сделать серое небо голубым, удалить людей с заднего плана и многое другое. Этот инструмент станет доступен на всех смартфонах Pixel и удовлетворяющих требованиям устройствах на Android и iOS — на последних, правда, можно будет сохранить лишь 10 обработанных фото в месяц, а дальше придётся приобрести подписку Google One Premium.

Другие инструменты доступны без ограничений: Magic Eraser, Photo Unblur, Color Pop, HDR-эффекты, Portrait Blur, Portrait Light, Cinematic Photos, стили в Collage Editor и Video Effects.

Остальные функции вроде объединяющей несколько похожих фото в одно лучшего качества Best Take по-прежнему будут доступны лишь на Pixel 8 и Pixel 8 Pro.

«Яндекс» заявил, что победил Google в России на всех платформах

В интервью изданию «Коммерсантъ» глава поискового бизнеса «Яндекса» Дмитрий Масюк рассказал о победе над Google «на всех площадках» в отечественном рынке. Доля «Яндекса» на российском поисковом рынке продолжает расти — в четвёртом квартале прошлого года она составляла в среднем 63,8 %.

 Источник изображения: Yandex

Источник изображения: Yandex

«Мы в целом стали значительно более зрелыми и победили, например, Google в России в конкурентных условиях абсолютно на всех площадках. В 2023 году на iPhone, где Google стоит по умолчанию, мы превысили долю в 50 %. При том, что человек может пользоваться любым поисковиком, больше половины iPhone в РФ — устройства с "Яндексом", люди его выбирают. Россия — единственная страна в мире, где люди могут свободно пользоваться и Google, и локальным поисковиком, и при этом показатели локального поисковика больше», — сказал Дмитрий Масюк.

Масюк подчеркнул, что рост популярности «Яндекса» не связан с уходом Google из России, поскольку в таком случае был бы заметен резкий скачок, однако, по его словам, этого не произошло.

Ответил топ-менеджер и на опасения многих создателей оригинального контента, что поиск с ИИ окончательно отберёт у их площадок поисковый трафик, ведь люди получат необходимые сведения прямо в поисковой выдаче. По словам Масюка, этого не случится, поскольку ИИ всегда даст ссылку на источник, а краткий пересказ не заменит полного материала и уж тем более не заставит людей отказаться от чтения любимых авторов — таким образом, ценность оригинального контента даже повысится.

«На выходных я читал один новостной сайт, и пришла в голову хорошая аналогия нашего продукта с тем, что уже давно происходит в журналистике — когда одно издание ссылается на другое и делает выжимку из материалов первого: "по информации "Коммерсанта" и так далее. Мы прибегаем к той же практике — в сгенерированных YandexGPT "быстрых ответах" в поиске обязательно есть ссылка на первоисточник», — сказал он.

DMA в действии: малоизвестные браузеры начали завоёвывать европейскую аудиторию

Независимые разработчики браузеров наблюдают всплеск числа пользователей — этому способствовали вступившие в силу всего месяц назад новые нормы ЕС, заставившие Google, Microsoft и Apple облегчить пользователям выбор конкурирующих решений. Об этом сообщает Reuters со ссылкой на данные, полученные от шести компаний.

 Источник изображения: NoName_13 / pixabay.com

Источник изображения: NoName_13 / pixabay.com

Европейский «Закон о цифровых рынках» (DMA) вступил в силу 7 марта. Он направлен на устранение недобросовестной конкуренции: крупным технологическим компаниям предписали дать пользователям возможность выбирать из списка доступных веб-браузеров на отдельном экране. На мобильных устройствах под управлением Android по умолчанию устанавливается Google Chrome, на iPhone — Apple Safari, что делает их доминирующими браузерами на рынке.

Тем временем кипрская компания Aloha Browser доложила, что в марте число пользователей её браузера из ЕС выросло на 250 %. Основанная в 2016 году компания Aloha позиционирует свой продукт как ориентированную на конфиденциальность альтернативу браузерам крупных технологических компаний. Число его пользователей в месяц составляет в среднем 10 млн — компания зарабатывает за счёт платных подписок, а не продаж рекламы путём слежки за пользователями.

Рост числа пользователей из ЕС отметили норвежская Vivaldi, немецкая Ecosia и американская Brave. Об аналогичной тенденции свидетельствуют и известные игроки: американская DuckDuckGo с аудиторией в 100 млн пользователей и ещё более крупная Opera — при этом они утверждают, что процесс развёртывания экрана выбора ещё не завершён.

Новые правила ЕС предписывают разработчикам программных платформ показывать при настройке устройств экран, на котором пользователи могут выбрать браузер, поисковую систему и виртуального помощника — ранее Apple и Google поставляли устройства с настройками по умолчанию, в которых были выбраны их собственные продукты. Закон потребовал изменить эти настройки. Сейчас Apple предлагает до 11 браузеров в дополнение к собственному Safari, подобранных индивидуально для каждой из 27 стран ЕС — экран выбора будет обновляться раз в год. Во всех странах ЕС Apple предлагает DuckDuckGo и Opera; Aloha — в 26 странах, Ecosia — 13, Vivaldi — в 8.

Google пока предлагает выбор браузера только на устройствах собственного производства и обещает обеспечить выбор на гаджетах других брендов в ближайшие месяцы. Поскольку доля iPhone в Европе больше, чем доля телефонов от Google, присутствие «малых» браузеров растёт преимущественно за счёт Safari — это подтвердили и в Opera.

Разработчики браузеров, однако, продолжают критиковать Apple и Google за формат и скорость внедрения новых функций — эти меры замедляют миграцию мобильных пользователей на новые варианты браузеров. В Mozilla, ответственной за браузер Firefox, сообщили, что пока лишь 19 % европейских пользователей получили соответствующее обновление iPhone, хотя ранее Apple обновляла свои устройства намного оперативнее. Экран выбора браузера на iPhone появляется только при попытке открыть Safari, а список браузеров показывается без дополнительной информации, указывает гендиректор Vivaldi Йон Стефенсон фон Течнер (Jon Stephenson von Tetzchner). По его словам, процесс выбора настолько запутан, что пользователям проще остаться на Safari или выбрать другой известный бренд. Еврокомиссия уже инициировала проверку с намерением выяснить, действительно ли Apple препятствует свободному выбору пользователей.

ИИ в Gmail научат понимать голосовые команды и облагораживать письма, а в «Документах» появятся вкладки

Сегодня на конференции Cloud Next в Лас-Вегасе компания Google сообщила, что подписчики Google Workspace вскоре смогут при помощи голосовых запросов пользоваться ИИ-инструментом «Помоги мне написать», чтобы, к примеру, составить письмо в Gmail «на ходу». Google также анонсировала в Gmail для Workspace новую функцию на основе искусственного интеллекта, которая мгновенно умеет «облагораживать» черновики писем.

 Исчтоник изображения: Google

Источник изображений: Google

Представленные инструменты в первую очередь станут доступны платным подписчикам. По словам представителя Google, компания имеет «долгую историю создания действительно полезных и универсальных функций с искусственным интеллектом для всех наших пользователей, включая умный ответ и умное составление сообщения». После получения отзывов от платных подписчиков, которые, получается, выступят в качестве бета-тестеров, Google «рассмотрит возможность распространения их [функций ИИ] на всех пользователей».

В дополнение к новым функциям ИИ Google добавила в пакет Workspace несколько других возможностей, среди которых «Уведомления» для «Таблиц», присылающие настраиваемое оповещение, например, при изменении определённого поля. Кроме того, в «Таблицах» появятся новые шаблоны, которые должны упростить создание новой электронной таблицы.

«Документы» получат поддержку вкладок, так что пользователь «сможет организовывать информацию в одном документе вместо того, чтобы ссылаться на несколько документов». Эта функция может оказаться весьма полезной при работе с большими документами со сложным форматированием. В «Документах» появилась возможность создавать макеты обложек без полей.

Google Chat теперь может обслуживать до 500 000 участников, кроме того, добавлена поддержка обмена сообщениями со Slack и Teams.

По данным Google, Workspace используют около 3 миллиардов пользователей, из которых более 10 миллионов составляют платные подписчики.

Google представила Gemini Code Assist — ИИ-помощника программиста, который потягается с GitHub Copilot

На мероприятии Cloud Next компания Google представила Gemini Code Assist — систему на основе искусственного интеллекта для помощи в написании программного кода с функцией завершения строк.

 Источник изображения: StockSnap / pixabay.com

Источник изображения: StockSnap / pixabay.com

Ранее подобные возможности Google предлагала под брендом Duet AI — этот сервис стал общедоступным в конце 2023 года, и уже тогда в компании намекнули, что в ближайшей перспективе сервис с завершением строк кода будет переведён с модели Codey на более современную Gemini. Выпуск Code Assist — это одновременно крупное обновление и ребрендинг старого сервиса. Code Assist будет доступен в формате плагинов для наиболее популярных сред VS Code и JetBrains.

Code Assist даже в больше степени, чем его предыдущая версия Duet AI, является прямым конкурентом GitHub Copilot Enterprise, а не его базовой версии с названием Copilot. В частности, Gemini 1.5 Pro имеет контекстное окно в миллион токенов — это позволяет системе предлагать свои варианты кода с более высокой точностью, а также анализировать и изменять большие его фрагменты. Code Assist, как и GitHub Copilot Enterprise, можно дополнительно настроить на основе внутренней базы кода компании — пока эта функция находится в предварительной версии. Code Assist позволяет поддерживать код в различных репозиториях, включая GitLab, GitHub и Atlassian BitBucket, и проекты, распределённые на нескольких платформах — и этого конкурирующие сервисы предложить уже не могут.

Дополнительно Google представила CodeGemma — открытую модель семейства Gemma, настроенную для генерации и редактирования кода. CodeGemma доступна на облачной платформе Vertex AI. Компания также анонсировала службу Gemini Cloud Assist, которая поможет «облачным подразделениям разрабатывать, эксплуатировать и оптимизировать приложения на протяжении их жизненного цикла». Инструмент позволяет генерировать конфигурации архитектуры, адаптированные к потребностям компании, диагностировать проблемы и выявлять их причины, а также оптимизировать использование компанией облачных ресурсов для снижения затрат или повышения производительности. Cloud Assist будет доступен в интерфейсе чата или в формате функций, встроенных в другие продукты Google Cloud.

Google представила Vids — продвинутый ИИ для создания и редактирования видео

На конференции в Лас-Вегасе компания Google представила Vids — инструмент для создания видео с использованием искусственного интеллекта. Идея продукта заключается в том, чтобы создавать и редактировать файлы с другими людьми, подобно тому, как это реализовано в других приложениях Google Workspace, например, «Документах» и «Таблицах».

 Источник изображений: Google Cloud

Источник изображений: Google Cloud

«Я хочу представить нечто по-настоящему новое. В Google Cloud Next появился Vids — совершенно новый инструмент для создания видео при помощи искусственного интеллекта, — сказала вице-президент и генеральный директор Google Workspace Апарна Паппу (Aparna Pappu). — Это универсальный помощник по редактированию и созданию видеороликов. Мы поможем превратить ваши материалы — рекламные тексты, изображения и так далее — в убедительное видео. Вам не придётся пересылать друг другу файлы по электронной почте. Вы можете работать над сюжетом вместе, используя те же средства контроля и безопасности, что и в других инструментах Workspace».

Как и с другими ИИ-инструментами, работа в Google Vids начинается с подсказок, описывающих суть будущего видеролика. Затем можно добавить файлы с «Диска» или стоковые материалы, а затем ИИ представит раскадровку будущего видео на основе текстового описания. Следующим шагом можно изменить порядок отдельных частей видеоролика, добавить переходы, вставить звуковую дорожку и так далее. Коллеги могут комментировать внесённые правки или добавлять свои.

Сейчас инструмент находится в закрытом тестировании. В июне к нему присоединятся дополнительные тестировщики, а затем Vids войдёт в подписку на Gemini для Google Workspace.

Microsoft инвестирует $2,9 млрд в развитие ИИ и облачной инфраструктуры в Японии

Microsoft планирует в течение двух лет инвестировать $2,9 млрд в расширение своей японской облачной и ИИ-инфраструктуры и создание лаборатории Microsoft Research Asia в Токио. Крупнейшие за 46 лет работы компании в Японии инвестиции также обеспечат обучение трёх миллионов человек использованию искусственного интеллекта.

Microsoft Azure, подразделение Alphabet Google Cloud и Amazon Web Services входят в тройку крупнейших операторов облачных вычислений в мире. Компании ускоренными темпами расширяют свои центры обработки данных и развивают активы облачных вычислений по всему миру, чтобы поддержать бум приложений и рабочих нагрузок искусственного интеллекта, начавшийся после запуска ChatGPT в конце 2022 года.

Облачное подразделение Amazon инвестирует $10 млрд в строительство центра обработки данных в Миссисипи и $5,3 млрд на аналогичную структуру в Саудовской Аравии. Google в настоящее время также строит новый центр обработки данных недалеко от Лондона стоимостью один миллиард долларов.

ИИ-генератор Google Imagen 2 научился создавать 4-секундные анимированные изображения

Google сообщила, что генератор изображений Imagen 2 получил с очередным обновлением возможность создавать анимированные 4-секундные ролики. Модель также научилась по текстовым запросам редактировать готовые изображения, добавляя на них новые объекты или убирая их; а все новые картинки помечаются невидимыми цифровыми водяными знаками.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

На мероприятии Google Cloud Next разработчик сообщил, что Imagen 2 теперь генерирует 4-секундные анимированные ролики с разрешением 360 × 640 пикселей и частотой 24 кадра в секунду. Google также пообещала в этом направлении «постоянные усовершенствования». «Если взглянуть, вместо картинки объекта, например, статического изображения автомобиля, можно увидеть короткий ролик, например, движущейся машины. Многим организациям, особенно в таких областях как СМИ и реклама, это интересно, потому что это улучшает взаимодействие с пользователем», — пояснил гендиректор Google Cloud Томас Куриан (Thomas Kurian).

Генератор Imagen 2 создаёт изображения, используя различные ракурсы и движения камеры, «при этом сохраняя согласованность всей последовательности». Модель предлагает фильтры безопасности, которые предотвращают создание недопустимых материалов, и цифровые водяные знаки SynthID, позволяющие отслеживать созданные ИИ произведения. Imagen 2 также научился редактировать изображения, добавляя или удаляя элементы по текстовому запросу, и расширять границы изображения для увеличения обзора. Все эти возможности доступны на облачной платформе Vertex AI.

Google представила Axion — свой первый Arm-процессор

Компания Google анонсировала свой первый Arm-процессор — он получил название Axion и предназначается для использования в серверных системах для ЦОД. В своём пресс-релизе Google заявляет, что Axion обеспечивает лидирующие в отрасли показатели производительности и энергоэффективности.

 Источник изображения: Google Cloud

Источник изображения: Google Cloud

Подробного описания процессора компания не приводит. Известно, что в основе Axion используются ядра Arm Neoverse V2 с архитектурой ArmV9 и привычным для неё набором инструкций. Также в составе чипа применяются специализированные микроконтроллеры Titanium, на которые возлагаются задачи, связанные с сетевыми подключениями и безопасностью. Кроме того, Titanium перекладывает операции обработки ввода-вывода хранилища на Hyperdisk, службы сетевого блочного хранения данных в Google Cloud.

По словам Google, Axion обеспечивает на 30 % более высокую производительность по сравнению с самыми быстрыми инструментами общего назначения на базе Arm в облаке, а также до 50 % больше производительности и до 60 % больше энергоэффективности по сравнению с сопоставимыми решениями на базе x86-совместимых процессоров. Наглядные примеры сравнений Google не приводит.

В компании отмечают, что уже начали переводить свои сервисы BigTable, Spanner, BigQuery, Blobstore, Pub/Sub, Google Earth Engine и YouTube Ads на системы с процессорами Axion.

В пресс-релизе Google Cloud также указано, что Axion построен на открытой основе, поэтому клиенты смогут переносить свои существующие рабочие нагрузки Arm в Google Cloud на новую платформу без каких-либо существенных изменений, используя программу SystemReady Virtual Environment (VE). Axion можно будет использовать во многих облачных сервисах Google, включая Google Compute Engine, Google Kubernetes Engine, Dataproc, Dataflow, Cloud Batch и других.

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Нейросеть Google Gemini Pro поможет создавать Android-приложения — ИИ встроили в Android Studio

Google обновила интегрированную среду разработки (IDE) Android Studio, добавив в неё новейшего ИИ-помощника для генерации кода на основе ИИ-модели Gemini Pro, что обещает разработчикам более высокую эффективность и новые возможности в процессе создания приложений.

 Источник изображений: Google

Источник изображений: Google

Android Studio выступает не просто как текстовый редактор для написания кода, но и предлагает разработчикам целый набор инструментов, включая эмулятор, позволяющий запускать виртуальные Android-смартфоны на машине с Windows и использовать их для тестирования и отладки приложений.

В мае прошлого года Google внедрила в свою IDE-среду генеративный искусственный интеллект Studio Bot, созданный на базе большой языковой модели (LLM) PaLM 2, которую поисковый гигант анонсировал в том же месяце. Через шесть месяцев после дебюта PaLM 2 Google представила линейку флагманских LLM — Gemini, в которую вошли три модели с разным набором функций и аппаратными требованиями.

Обновлённый чат-бот в Android Studio работает на Gemini 1.0 Pro — средней ИИ-модели серии, оптимизированной для сочетания высокого качества ответов и эффективности использования аппаратных ресурсов. Google также анонсировала её обновление до версии Gemini 1.5 Pro, которая, согласно внутренним тестам компании, превосходит свою предшественницу по 87 % бенчмарков, успешно обрабатывая задачи с более чем 100 000 строками кода.

Сандхия Мохан (Sandhya Mohan), менеджер по продукту Android Studio, сообщила, что использование Studio Bot в канале Canary уже позволяло ощутить полезность и мощь этой технологии. Теперь же, с переходом чат-бота на Gemini Pro, пользователи увидят существенное улучшение качества ответов.

Чат-бот способен отвечать на общие вопросы об Android, например, о том, как интегрировать приложение с функцией отслеживания местоположения в операционной системе. Также он отвечает на вопросы по конкретным проектам. Например, разработчик может попросить совета, как удалить дубликаты записей из набора данных, который приложение использует для работы некоторых функций.

Возможности Gemini Pro в Android Studio охватывают даже более сложные задачи. По данным Google, новый ИИ-помощник умеет переписывать код на разных языках программирования, генерировать целые разделы интерфейса приложения и составлять документацию для нового кода, объясняя его функциональность и принципы работы.

Чтобы активировать Gemini, необходимо войти в систему и включить функцию в настройках. Большинство возможностей доступны без отправки контекста кода, при этом ответы чат-бота базируются на истории общения, предоставляя пользователям контроль над конфиденциальностью данных.

OpenAI для обучения GPT-4 расшифровала миллионы видео с YouTube — текстов в интернете не хватило. Google тоже так делает

Несколько дней назад сообщалось, что разработчики ИИ столкнулись с нехваткой данных для обучения передовых моделей, в том числе о планах Open AI обучать GPT-5 на видео с YouTube. Согласно материалу The New York Times, в погоне за новыми данными корпорации забывают об этике и морали.

 Источник изображения: freepik.com

Источник изображения: freepik.com

К концу 2021 года OpenAI столкнулась с нехваткой авторитетных англоязычных текстов в интернете для обучения новейшей модели искусственного интеллекта — ей требовалось гораздо больше данных. Тогда разработчики OpenAI создали расшифровывающую аудиозаписи из видеороликов на YouTube систему распознавания речи Whisper, которая выдаёт текст для обучения ИИ. По словам нескольких сотрудников, в компании понимали, что такой шаг может противоречить правилам использования YouTube, запрещающим использовать видеоролики «независимо» от платформы. Это не остановило OpenAI, расшифровавшую более миллиона часов видеороликов с YouTube. Полученный текст использовался для обучения GPT-4 — одной из мощнейших систем искусственного интеллекта в основе последней версии ChatGPT. В исследовании The New York Times говорится, что в гонку за данными включились все передовые разработчики ИИ, включая OpenAI, Google и Meta, причём компании зачастую игнорируют корпоративные политики, а иногда и закон.

Разработчики ИИ всё сильнее упираются в нехватку материала. Передовые чат-боты обучались на массивах цифровых текстов объёмом до трёх триллионов слов, что примерно вдвое больше объёма материалов в Бодлианской библиотеке Оксфордского университета, в том числе датирующихся ещё 1602 годом. Наибольшую ценность для обучения ИИ представляют высококачественные данные из отредактированных профессионалами книг и статей. По данным исследовательского института Epoch, такие тексты могут закончиться уже в 2026 году.

«Единственный практический способ существования таких инструментов — обучение на огромных массивах информации без разрешения её создателей. Объём необходимых данных настолько велик, что не поможет даже коллективное лицензирование», — говорит представляющий интересы венчурной компании Andreessen Horowitz Сай Дамле (Sy Damle).

OpenAI, Google и Meta не скрывают, что их модели ИИ обучаются на открытых данных, однако не все создатели соответствующего контента приветствуют данную инициативу, что уже стало причиной множества судебных разбирательств. В прошлом сама The New York Times подавала в суд на OpenAI и Microsoft за то, что компании обучали чат-ботов на защищённых авторским правом материалах без разрешения владельцев. Тогда Microsoft и OpenAI заявили, что «добросовестно используют» материалы для создания собственных работ, что не запрещено законом об авторском праве.

 Джаред Каплан. Источник: physics-astronomy.jhu.edu

Джаред Каплан. Источник: physics-astronomy.jhu.edu

В январе 2020 года физик-теоретик из Университета Джонса Хопкинса Джаред Каплан (Jared Kaplan) опубликовал работу об ИИ, которая разожгла аппетиты их разработчиков. Он высказался однозначно: чем больше данных используется для обучения языковой модели, тем лучше она работает, подобно тому, как студенты получают всё больше знаний из прочитанных книг. Языковые модели могут устанавливать закономерности и взаимосвязи, что позволяет точнее обрабатывать новую информацию.

«Все сильно удивились, что эти тенденции, или законы масштабирования, как мы их называем, не менее точны, чем физические и астрономические», — говорит ныне работающий в Anthropic Каплан.

Разработчики ИИ уже давно используют огромные массивы публичных цифровых данных, в том числе статьи из «Википедии» и Common Crawl — базы данных из более чем 250 млрд интернет-страниц, собранных с 2007 года. Прежде чем «скормить» эти данные ИИ, их тщательно фильтровали на предмет «нежелательных» материалов. Объёмы необходимых для обучения ИИ в 2020 году данных сейчас кажутся смешными, ведь тогда массив из 30 тысяч картинок с Flickr казался огромным.

Создание вышедшей в ноябре 2020 года GPT-3 ознаменовало начало эры погони за новыми данными — модель обучали на 300 млрд «токенов», представляющих отдельные слова или их фрагменты. Обучившись на этих данных, система генерировала посты в блогах, стихи и даже писала программы. В 2022 году подразделение Google Deepmind протестировало 400 ИИ-моделей, меняя объём данных для обучения и другие факторы. Оказалось, что Каплан прав, и чем больше входящих данных, тем лучше работает ИИ. Гонка продолжается: в 2023 году китайцы представили обученную ни 3,2 триллионах английских и китайских лексем модель Skywork, а PaLM 2 от Google «поглотила» 3,6 триллиона токенов.

 Сэм Альтман. Источник изображения: wikipedia.org

Сэм Альтман. Источник изображения: wikipedia.org

Позднее Сэм Альтман (Sam Altman) из OpenAI заявил, что данные рано или поздно кончатся — он знает, о чём говорит, ведь компания годами собирала данные, обрабатывала и обучали на них ИИ. Среди использованных данных был программный код с GitHub, базы данных шахматных ходов, школьные тесты и домашние задания старшеклассников. К концу 2021 года они закончились. Помимо расшифровки аудио- и видеоматериалов, рассматривалась покупка компаний, имеющих доступ к огромным объёмам цифровых данных.

Некоторые сотрудники Google знали, что OpenAI расшифровывает видео с YouTube, но бездействовали, потому что этим же занималась сама Google, а это потенциально нарушало авторские права создателей видеороликов. Подняв шумиху вокруг OpenAI, Google рискует привлечь общественное внимание и к своим разработкам. Впрочем, представители Google говорят, что правила использования сервиса позволяют использовать данные YouTube для разработки новых функций видеоплатформы. Специализирующийся на интеллектуальной собственности юрист Berger Singerman Джеффри Лоттенберг (Geoffrey Lottenberg) отмечает, что в своих правилах Google использует крайне расплывчатые формулировки. И это сделано намеренно.

Google хотела обучать свои модели на открытых данных Google Docs, Google Sheets и других продуктов. В политике конфиденциальности Google говорилось, что компания может использовать публичные данные для обучения языковых моделей Google и других продуктов вроде Google Translate. Теперь же перечень продуктов помимо Google Translate содержит упоминания Bard и «облачных ИИ». Сотрудников компании специально проинструктировали выпустить новую редакцию политики конфиденциальности перед Днём независимости США, когда мысли людей заняты предстоящими праздниками.

 Марк Цукерберг. Источник изображения: профиль в ***

Марк Цукерберг. Источник изображения: профиль в Facebook

Глава Meta Марк Цукерберг (Mark Zuckerberg) годами развивал ИИ-направление, но выход ChatGPT в конце 2022 года оставил его компанию далеко позади. Трое бывших и нынешних сотрудников Meta рассказали, что стремясь догнать OpenAI, он день и ночь донимал менеджеров и ведущих инженеров, чтобы те как можно скорее выпустили конкурирующий продукт. Но как и все остальные, Meta упёрлась лбом в стену нехватки данных.

По словам вице-президента по генеративным ИИ Ахмада Аль-Дахле (Ahmad Al-Dahle), его команда использовала почти все доступные англоязычные книги, эссе, поэмы и новостные статьи в интернете для обучения собственной ИИ-модели. В конце концов, Аль-Дахле заявил, что Meta не превзойти ChatGPT без большего количества данных. К марту-апрелю 2023 года руководство Meta обсуждало эту проблему почти ежедневно. В частности, высказывалось предложение платить по $10 за полное лицензирование каждой книги или приобрести издательство Simon & Schuster, сотрудничающее со множеством авторов, среди которых, например, Стивен Кинг. Обсуждалась и возможность использования интернет-материалов без разрешения авторов, несмотря на возможные нарушения законов об авторском праве. Цукерберг требовал решить проблему немедленно, но инженеры компании заявили, что это невозможно.

 Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

Ахмад Аль-Дахле. Источник изображения: профиль на LinkedIn

На одном из записанных совещаний руководства Meta говорилось, что компания наняла субподрядчиков из Африки для сбора защищённых авторским правом материалов. «Мы не можем не собирать их», — сказали на одном из таких совещаний. Кроме того, подчёркивалось, что OpenAI тоже не стесняется использовать защищённые авторским правом материалы без разрешения их владельцев, и получать эти разрешения «слишком долго».

Сэм Альтман предложил решить проблему с помощью «синтетических данных», то есть обучать языковые модели на материалах других языковых моделей. По его словам, раз уж ИИ научились писать человекоподобные тексты, последние можно использовать для дальнейшего развития LLM, что к тому же позволит снизить зависимость от защищённых законом авторских произведений. «Пока ваши модели достаточно продвинуты, чтобы создавать качественные синтетические данные, всё нормально», — сказал Альтман. Однако обучение на данных других ИИ тоже не панацея — большие языковые модели могут попасть в цикл обработки ошибочных данных и недостатков технологии, которые будут нарастать на каждом его витке.

«Обучать ИИ — всё равно что пробираться через джунгли. Если обучать ИИ на одних лишь синтетических данных, они заблудятся», — сказал по этому поводу бывший исследователь в OpenAI, а ныне преподаватель компьютерных наук в Университете Британской Колумбии Джефф Клун (Jeff Clune).

Google запустила обновлённую сеть Find My Device — она найдёт Android-смартфон, даже если он отключён от интернета

В прошлый четверг Google уведомила тестировщиков Google Play Services о грядущем запуске обновлённой сети поиска устройств на Android, а сегодня она начала работать. Теперь сервис Find My Device позволяет найти потерянный смартфон, даже если он отключен от интернета, и в этом помогут другие Android-устройства, которые определят его приблизительное местоположение по другим сигналам. У Google Pixel 8 эта функция ещё полезнее — она работает даже если телефон отключён.

 Источник изображения: Solen Feyissa / unsplash.com

Источник изображения: Solen Feyissa / unsplash.com

С мая к сети подключат Bluetooth-трекеры Chipolo и Pebblebee, что поможет в поиске кошельков, ключей и прочих потерянных вещей. До конца года совместимые Bluetooth-трекеры выпустят Motorola, Jio и Eufy. Как и в iOS, доступом к меткам можно будет делиться с другими пользователями. Запуск сети долго откладывался из-за возможных проблем безопасности, однако Google и Apple нашли решение. Вице-президент по безопасности и конфиденциальности Android Дэйв Клейдермахер (Dave Kleidermacher) заверил, что всё безопасно:

«Наше исследование показало, что потерянные вещи обычно лежат неподвижно. Если вы оставили ключи в кафе, то скорее всего они будут лежать на столике, за которым вы пили кофе. Применяя ограничение скорости и точности обновления информации об устройстве, мы оставляем сеть полезной для поиска утерянного в поездке багажа и ухудшаем возможности отслежения ваших перемещений в реальном времени».

 Источник изображения: Google

Источник изображения: Google

Сообщается, что наушники JBL и Sony получат специальные обновления ПО, чтобы их можно было отследить в Find My Device. Обновлённая сеть поддерживает устройства под управлением Android 9 и более поздних версий ОС. Поначалу сеть будет работать лишь в США и Канаде, а позже её действие распространится по всему миру.

Google захотела купить одного из крупных поставщиков CRM, но боится проблем с антимонопольщиками

Alphabet (материнская компания Google) планирует приобрести специализирующуюся на системах управления взаимоотношениями с клиентами (CRM) маркетинговую компанию HubSpot, однако сделка может вызвать противодействие антимонопольных органов.

 Источник изображения: Mitchell Luo / unsplash.com

Источник изображения: Mitchell Luo / unsplash.com

Рыночная стоимость HubSpot составляет $34 млрд, но куда больше Google беспокоят возможные антимонопольные иски. Пока эксперты сходятся во мнении, что приобретение HubSpot вряд ли заинтересует соответствующие органы. Дело в том, что доля HubSpot на рынке CRM составляет всего 4,9 %, при этом у ближайших конкурентов Salesforce и Adobe — по 15 %. Возможная сделка укрепит положение HubSpot за счёт вычислительных мощностей и облачных сервисов Google, позволив улучшить ценовые предложения. С другой стороны, в последнее время американские и европейские регуляторы активно выступают против укрупнения технологических гигантов за счёт поглощения компаний поменьше.

Google осторожничает не без причины — Минюст США уже подал два иска, в котором обвинил её в злоупотреблении положением лидера онлайн-поиска и монополизации рынка цифровой рекламы. В Европе у Google тоже есть проблемы — её проверяют на соответствие новому «Закону о цифровых рынках» (DMA).


window-new
Soft
Hard
Тренды 🔥
Path of Exile 2 получит масштабное обновление в конце лета — авторы намерены выпускать их каждые четыре месяца 14 ч.
Анонсирован Majogami — стильный экшен-платформер про девушку с катаной, которая режет врагов как бумагу 15 ч.
SpaceX инвестирует в разработчика ИИ-бота Grok $2 млрд 16 ч.
Вопреки слухам IBM рассчитывает на дальнейшее расширение присутствия в Китае 19 ч.
QNAP запустила облачное хранилище myQNAPcloud One для резервного копирования NAS 19 ч.
xAI извинилась за «ужасное поведение» чат-бота Grok, и винит в нём «обновление программной надстройки» 13-07 05:33
Новая статья: Dune: Awakening — песочница Лисан аль-Гаиба. Рецензия 13-07 00:04
Особые цены для особо ценных клиентов: Broadcom запросила у Telefónica Germany за поддержку VMware впятеро больше прежнего 12-07 22:50
Франция возбудила уголовное дело в отношении соцсети X по подозрению в манипулировании алгоритмами 12-07 22:24
Китайский стартап Moonshot выпустил открытую ИИ-модель Kimi K2, превосходящую GPT-4 12-07 20:34
Планирующий выступить в Китае основатель Nvidia считает, что местным военным не нужны ускорители данной марки 42 мин.
Новая статья: Обзор SSD-накопителя WD Black SN7100: альтернатива Samsung 990 Evo Plus 6 ч.
Французский разработчик фотонных ИИ-чипов Arago получил на развитие $26 млн 19 ч.
CoreWeave запустила первые общедоступные инстансы на базе NVIDIA RTX Pro 6000 Blackwell Server Edition 19 ч.
Неопределённость с тарифами Трампа вынуждает производителей чипов заморозить строительство в Малайзии 22 ч.
Электрический спорткар Hyundai Ioniq 6 N способен имитировать звук ДВС и переключение передач 23 ч.
Уход с рынка DDR4 многих конкурентов позволит Nanya покончить с убытками 23 ч.
В Китае замечен прототип спортивного кроссовера Xiaomi YU7 Ultra 24 ч.
Tesla начала развёртывание Grok AI в своих электромобилях 13-07 05:44
Intel сократит 2400 работников в своём крупнейшем центре разработки в Орегоне 12-07 17:50