Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Европейские парламентарии пришли к предварительному соглашению по «Закону об ИИ»

По итогам активных дискуссий законодателям в Брюсселе удалось достичь «предварительного соглашения» в отношении общеевропейского «Закона об искусственном интеллекте». Это будет первый в мире свод правил по управлению системами ИИ — он сможет служить ориентиром для других регионов, власти которых стремятся принять аналогичные законы.

 Источник изображения: NoName_13 / pixabay.com

Источник изображения: NoName_13 / pixabay.com

Законодатели зафиксировали обязательства, которые налагаются на разработчиков «высокоэффективных» систем ИИ общего назначения: если эти системы отвечают определенным критериям, то для них должен проводиться ряд мероприятий, в том числе оценка рисков, состязательное тестирование, составление отчётов об инцидентах и многое другое. Разработчики обеспечивают прозрачность — в частности, представляют подробный обзор используемых при обучении ИИ материалов. К примеру, ответственная за ChatGPT компания OpenAI до сих пор отказывается раскрывать эту информацию.

Граждане получат право подавать жалобы на системы ИИ и получать объяснения по поводу решений, принимаемых системами «высокого риска», если эти решения влияют на их права. Механизмы правоприменения пока не описываются, но указываются размеры штрафов: от €7,5 млн или 1,5 % от глобального оборота компании до €35 млн или 7 % глобальной выручки.

В ряде сфер применение ИИ запрещается. Например, распознавание лиц по камерам наблюдения и категоризация людей на основе «критических характеристик», таких как раса, интимные предпочтения, религиозные или политические убеждения; запрещается применение систем распознавания эмоций на рабочих местах или в учебных заведениях; запрещается создание систем «социального рейтинга». Предусмотрены гарантии и исключения для использования правоохранительными органами биометрических систем в режиме реального времени и поиска доказательств на записях.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

Первый проект европейского «Закона об ИИ» был представлен в 2021 году — тогда документ определял, что вообще считать ИИ, и был направлен на выработку единых норм регулирования этой сферы в государствах — членах ЕС. Вскоре после этого появились платформы ChatGPT и Stable Diffusion, что привело к многочисленным изменениям в законопроекте. Сейчас парламентарии достигли предварительного соглашения, и документ направится на дополнительные обсуждения, в том числе пройдёт голосование в комитетах Европарламента по внутреннему рынку и гражданским свободам. Ожидается, что окончательное соглашение будет достигнуто до конца года. Но даже в этом случае «Закон об ИИ» вступит в силу не ранее 2025 года.

Наиболее яростные дискуссии вызвали нормы регулирования анализа биометрических данных в реальном времени с помощью ИИ, а также систем ИИ общего назначения вроде ChatGPT. Европарламентарии настаивают на полном запрете применения ИИ в биометрическом наблюдении, а правительства стран добиваются исключений для военных, правоохранительных органов и органов госбезопасности. В последний момент представители Германии, Италии и Франции предложили также возможность саморегулирования для разработчиков генеративного ИИ.

Отставка главы OpenAI Сэма Альтмана была результатом накопившихся противоречий с советом директоров

В ноябре причастное к миру информационных технологий сообщество с замиранием сердца следило за событиями вокруг стартапа OpenAI, создавшего ChatGPT, поскольку конфликт совета директоров с генеральным директором Сэмом Альтманом (Sam Altman) привёл к отставке последнего, но после переговоров он был восстановлен в должности. Как можно догадаться, к отставке Альтмана привёл не единичный инцидент, а копившиеся месяцами противоречия в руководстве компании.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В этом признаются в комментариях Bloomberg источники, знакомые с ситуацией. В целом, как они поясняют, после вынужденного предания скандала огласке бывшие члены совета директоров и Сэм Альтман склонны по-разному трактовать причины, которые привели к отставке последнего. Когда уже после отставки речь зашла о возможности возвращения Альтмана в прежнюю должность, он предложил публично извиниться за то, что не совсем корректно истолковывал взгляды некоторых членов совета директоров на стратегические вопросы управления компанией. Совет директоров на тот момент счёл такие извинения неуместными, поскольку на публике это создало бы впечатление, что причиной отставки Альтмана был какой-то единичный инцидент, который удалось исчерпать с точки зрения противоречий.

Пока ведётся независимое расследование, члены совета директоров OpenAI отказались давать официальные комментарии на эту тему, но по неофициальным каналам Bloomberg удалось выяснить, что к отставке Альтмана привели месяцами копившиеся противоречия по поводу его стратегических манёвров и отсутствия прозрачности в его общении с советом директоров. Вчера председатель совета директоров OpenAI заявил, что для юридического сопровождения независимого расследования наняты адвокаты компании WilmerHale.

По неофициальным данным, совет директоров начал обсуждать возможность отставки Альтмана этой осенью, за некоторое время до ноябрьских событий. На тот момент в состав этого органа правления входили генеральный директор Сэм Альтман, его соратник и сооснователь OpenAI Грег Брокман (Greg Brockman), который занимал пост президента, а также группы из четырёх директоров, которые и были настроены на отставку генерального директора. К ним следует отнести главного научного руководителя OpenAI Илью Суцкевера (Ilya Sutskever), генерального директора Quora Адама Д’Анджело (Adam D’Angelo), научного деятеля Хелен Тонер (Helen Toner) и предпринимательницы Таши Макколи (Tasha McCauley). Фактическая власть в компании была отдана одноимённой некоммерческой организации, а совет директоров имел мало влияния на вектор её развития.

Старшие руководители рангом пониже пытались выразить своё недовольство взаимодействием с Альтманом, но боялись доносить эту информацию до совета директоров в полной мере, опасаясь его мести. После отставки Альтмана коллектив OpenAI сплотился в намерении вернуть бывшего генерального директора, и старшие руководители поддержали это решение без оглядки на прошлые разногласия.

Роль Ильи Суцкевера, который и сообщил Альтману об отставке, тоже оказалась значимой во всей этой истории. С июля он проводил реформы в компании, но к октябрю его ограничили в полномочиях из-за нараставших противоречий с Альтманом и Брокманом. Обиженный Суцкевер смог привлечь на свою сторону многих членов совета директоров. В октябре Альтман также попытался отправить в отставку Хелен Тонер, поскольку был недоволен её публичной критикой политики OpenAI в области безопасности. Хелен Тонер, в свою очередь, пыталась заручиться поддержкой других членов совета директоров.

Пытаясь наладить контакт с прочими членами совета директоров в этой ситуации, Альтман некорректно истолковал их позиции по вопросу, и ошибочно предположил, что коллеги солидарны с ним в намерениях отправить Тонер в отставку. Он даже открыто выражал уверенность, что Таша Макколи является его союзником в этой ситуации, но последняя от такой позиции открещивалась. Члены совета директоров OpenAI пришли к выводу, что Альтман манипулирует ими, и содержание их разговоров с ним существенно отличается от того, что он пытается представить на публике.

Совет директоров действительно был обеспокоен тем, что Альтман не всегда был откровенен с ними. Отставка Альтмана готовилась в такой спешке, что сотрудникам компании не было ничего разъяснено, а потому решимость основной части коллектива настаивать на возвращении генерального директора стала для совета директоров сюрпризом. После возвращения Альтмана на пост генерального директора в отставку подали и Тонер, и Макколи, из прежнего состава совета директоров в новый перекочевал лишь Адам Д’Анджело. На этом настояли те члены совета директоров, которые считали важным сохранить в его составе хотя бы одного очевидца соответствующих ноябрьских событий и сопутствующей предыстории.

Разработан ИИ, который может перехватывать пароли с точностью 95 % по звуку нажатия клавиш

Британские исследователи обучили искусственный интеллект (ИИ) точно распознавать нажатия клавиш на компьютерной клавиатуре по звуку. Таким образом можно следить за тем, что печатает человек, и даже «подслушать» его пароли. В эксперименте для проверки ИИ в качестве микрофона выступал смартфон, размещённый рядом с ноутбуком, на клавиатуре которого осуществлялся ввод.

 Источник изображения: pexels

Источник изображения: Pexels

Для обучения нейросети исследователи сопоставили звук каждой клавиши на клавиатуре с соответствующей ей буквой. Далее экспериментаторы преобразовали аудиозаписи в изображения в виде волновых диаграмм и спектрограмм и использовали их для обучения искусственного интеллекта.

Затем набирался пароль на ноутбуке, и алгоритм просили вычислить, какое слово было введено, основываясь на последовательности звуков. ИИ в этом тесте распознал пароль с точностью 95 %. Чтобы сделать подобную атаку с подбором пароля более реалистичной, экспериментаторы проверили, можно ли использовать этот метод для подбора паролей во время видеозвонка через Zoom или Skype. ИИ в этом случае продемонстрировал чуть меньшую, но всё ещё очень высокую точность распознавания: 92 % для Skype и 93 % в случае видеозвонка Zoom.

Исследователи в данном тестировании использовали MacBook Pro с чипом М1 и 16-дюймовым экраном 2021 года. Компанию ему составил iPhone 13 mini, размещённый на расстоянии 17 сантиметров от ноутбука, а также приложения для видеоконференций Zoom и Skype.

В качестве средства защиты исследователи рекомендуют пользователям применять при наборе текста десятипальцевую технику печати. В этом случае точность распознавания звука от отдельных клавиш значительно снижается. Использование верхнего и нижнего регистра букв в паролях, а также специальных символов также может усложнить задачу восстановления паролей с помощью подобного ИИ.

Однако наилучшую защиту в подобном случае обеспечит всё же менеджер паролей, который автоматически подбирает сложные пароли одним щелчком мыши. Менеджеры паролей вводят пароли с помощью комбинации клавиш, либо автоматически в поля для входа в систему. Это означает, что данные не могут быть перехвачены ИИ, применяющим распознавание звуков с клавиатуры.

Google выпустила продвинутый ИИ-блокнот NotebookLM на нейросети Gemini Pro

Google выпустила приложение NotebookLM — это блокнот на основе искусственного интеллекта, представленный в мае на конференции I/O 2023 и прежде носивший название Project Tailwind. Как и ИИ-чат-бот Bard, блокнот NotebookLM теперь полагается на нейросеть Gemini Pro. Новое приложение стало доступно жителям США, и чтобы воспользоваться им, уже не надо записываться в список ожидания.

 Источник изображений: 9to5google.com

Источник изображений: 9to5google.com

С помощью NotebookLM пользователь может обобщить несколько заметок и объединить их в одну, создать на их основе схему, учебное пособие или руководство, превратить «заметки в рассылку по электронной почте, план сценария, черновик маркетингового плана». Также есть возможность экспорта заметок в «Google Документы».

В ходе работы пользователя NotebookLM будет «динамически предлагать действия в зависимости от того, что тот делает». Если, например, пользователь выделяет отрывок во время чтения какого-либо источника (PDF или сайта), NotebookLM «автоматически предложит суммировать текст в новую заметку или поможет ему понять технический язык или сложные идеи».

Когда пользователь пишет заметку, NotebookLM предложит инструменты для улучшения стиля или соответствующие идеи из имеющихся у него источников на основе того, что пользователь только что написал.

Пользователь теперь может выбирать источники из перечисленных на боковой панели, для использования в той или иной работе. Google увеличила лимит на количество используемых источников до 100. Также в NotebookLM предусмотрена возможность скрыть источник, есть функция быстрого перехода от цитаты к источнику. Все новые возможности появятся у NotebookLM в ближайшее время с выходом Gemini Pro.

Саркастичный и раскованный ИИ-чат-бот Grok от Илона Маска стал доступен широкой аудитории

В четверг Илон Маск (Elon Musk) заявил, что его компания xAI, специализирующаяся на искусственном интеллекте, запустила для широкой аудитории своего ИИ-чат-бота Grok. Потенциальный конкурент для ChatGPT, не обременённый строгими ограничениями по ответам на провокационные вопросы, стал доступен подписчикам Premium+ социальной сети X (бывшей Twitter).

 Источник изображений: X

Источник изображений: X

Маск объявил о запуске ИИ-бота в посте в социальной сети X, не раскрывая подробностей запуска. В прошлом месяце он заявил, что как только Grok выйдет из раннего бета-тестирования, то станет доступен платным подписчикам с самым высоким уровнем Premium+ (за $16 в месяц). Вероятно, подписчики Premium получат доступ к боту несколько позже.

 Grok знает толк в счастливой семейной жизни

Grok знает толк в счастливой семейной жизни

«Grok — это искусственный интеллект, созданный по образцу путеводителя «Автостопом по галактике» и предназначенный для того, чтобы отвечать практически на всё и, что гораздо сложнее, даже подсказывать, какие вопросы задавать! Grok создан для того, чтобы остроумно отвечать на вопросы, и у него есть бунтарская жилка, поэтому, пожалуйста, не используйте его, если ненавидите юмор», — описывали разработчики своё творение в момент его анонса минувшим летом.

Чат-бот xAI визуально напоминает аналогичные боты. Для взаимодействия с ним предлагается использовать соответствующее поле для формирования запросов. По словам разработчиков, главное преимущество Grok заключается в том, что он способен ответить практически на любой вопрос благодаря доступу к данным соцсети X в режиме онлайн.

Разработка алгоритма началась с создания прототипа большой языковой модели (LLM) Grok-0 с 33 млрд параметров. Эта тестовая модель по своим возможностям сопоставима с показателями LLaMA 2 от Meta Platforms в стандартных тестах, но использует при этом только половину своих обучающих ресурсов. К моменту летнего анонса разработчики сумели добиться существенных улучшений в плане возможностей логического анализа и кодирования, что привело к созданию значительно более мощной языковой модели Grok-1.

Илон Маск запустил xAI в июле в ответ на усилия IT-гигантов в области искусственного интеллекта, которые он критиковал за чрезмерную цензуру и отсутствие адекватных мер безопасности. Крупные технологические компании, включая Microsoft и Google, торопятся запустить продукты на базе ИИ после того, как чат-бот ChatGPT от OpenAI поразил воображение компаний и пользователей по всему миру. Напомним, что Маск также являлся одним из основателей OpenAI в 2015 году, но в 2018 году вышел из состава совета директоров компании.

Поскольку всё больше рекламодателей уходят с платформы микроблогов, миллиардер сделал акцент на снижении зависимости компании от рекламы и сосредоточился на подписках. Очередная новая функция в виде саркастичного Grok должна сделать их более привлекательными. Маск также намерен превратить X в «супер приложение», предлагающее пользователям целый ряд услуг — от обмена сообщениями и общения в социальных сетях до пиринговых платежей.

Первое знакомство с революционной нейросетью Google Gemini разочаровало пользователей

Вчера компания Google представила флагманскую большую языковую модель искусственного интеллекта (ИИ) Gemini. Нейросеть предназначена для целого ряда продуктов и сервисов, включая ИИ-чат-бота Bard, конкурента ChatGPT. Однако большинство пользователей, успевших протестировать обновлённый Bard на свежей нейросети, остались недовольны результатами.

 Источник изображения: Google

Источник изображения: Google

В своих блогах и материалах для прессы Google превозносит превосходную архитектуру и возможности Gemini, утверждая, что данная модель соответствует или даже превосходит по производительности другие ведущие модели генеративного ИИ, такие как GPT-4 от OpenAI. Однако первый опыт взаимодействия некоторых пользователей свидетельствует об обратном.

Так, вчера Bard получил апгрейд в виде «облегчённой» версии модели под названием Gemini Pro. Пользователи сразу начали высказывать своё недовольство обновлением на страницах социальной сети X (бывший Twitter). К примеру, чат-бот не смог правильно предоставить простые факты, например, победителей премии «Оскар» 2023 года. При этом Gemini Pro неверно утверждает, что в прошлом году лучшим актёром стал Брендон Глисон (Brendan Gleeson), в то время как фактически победителем был Брендан Фрейзер (Brendan Fraser). При попытках пользователей задать этот же вопрос, можно в результате получить другой неправильный ответ.

 Источник изображения: Google

Источник изображения: Google

Похожая ситуация с вопросами касательно лучших фильмов: «На западном фронте без перемен» стал лучшим международным фильмом по мнению модели, «Говорят женщины» стал лучшим адаптированным сценарием, а «Пиноккио» — лучшим анимационным фильмом. Модель во всех этих примерах выдала некорректные ответы.

Кроме того, Bard на базе Gemini продемонстрировал плохую производительность при переводах. К примеру, при попытках пользователей запросить у модели слово на французском языке, состоящее из 6 букв, Gemini выдаёт вариант из 7 букв.

 Источник изображения: Google

Источник изображения: Google

А как насчёт обобщения новостей? Gemini Pro, имея в своём распоряжении «Google Поиск» и «Google Новости», очевидно, может предоставить краткий обзор новостей. Как бы не так. Похоже, Gemini Pro не желает комментировать потенциально спорные темы новостей, предлагая пользователям... погуглить самим. При этом конкурент от OpenAI ChatGPT, напротив, легко справляется с этой задачей, предоставляя краткое изложение со ссылками на новостные статьи. Хотя доступна эта функция лишь платным подписчикам — бесплатная версия ChatGPT не подключена к интернету.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как и все генеративные модели ИИ, Gemini Pro не застрахован от «взлома», то есть от запросов, которые обходят защитные фильтры, пытающиеся предотвратить обсуждение спорных тем. Используя автоматизированный метод алгоритмического изменения контекста подсказок до тех пор, пока защитные фильтры Gemini Pro не перестанут работать, исследователи ИИ-безопасности из стартапа Robust Intelligence, продающего инструменты для аудита моделей, смогли заставить Gemini Pro предложить способы аморальных действий, например, кражи у благотворительной организации.

Следует отметить, что Gemini Pro на текущий момент не является самой способной версией Gemini. Более продвинутая версия — Gemini Ultra — должна появиться на рынке в следующем году, в ИИ-чат-боте Bard и других продуктах. Поэтому сейчас Google сравнивает Gemini Pro с моделью конкурента GPT-3.5, которой уже около года, а не с последней версией GPT-4.

Тем не менее, Google пообещала, что Gemini Pro улучшит рассуждения, планирование и понимание по сравнению с предыдущей моделью, используемой в Bard, и заявила, что Gemini Pro лучше справляется с обобщением контента, мозговым штурмом и написанием текста. Пока что этого не видно.

Apple представила фреймворк MLX для разработки ИИ под компьютеры Mac

Apple объявила о выходе платформы MLX (ML Explore), предназначенной для разработки систем искусственного интеллекта, которые будут запускаться на компьютерах с её собственными процессорами Apple Silicon. Все необходимые компоненты доступны на GitHub.

 Источник изображения: apple.com

Источник изображения: apple.com

Цель проекта — упростить обучение и развёртывание моделей ИИ для исследователей, работающих на компьютерах Apple. Инструмент ориентирован не на потребителя, а на разработчиков, у которых теперь появилась мощная среда — есть похожие друг на друга API Python и API C++; поддерживается унифицированная память, то есть массивы данных находятся в общей памяти, и операции могут выполняться на центральном или графическом процессоре без копирования.

Apple также представила набор примеров того, на что способен фреймворк MLX:

  • обучение языковой модели — трансформера и его настройка с помощью LoRA;
  • генерация текста с помощью языковых моделей LLaMA и Mistral;
  • генерация изображений с помощью Stable Diffusion;
  • распознавание речи с помощью Whisper.

Apple осознала потребность в открытых и простых средах разработки систем машинного обучения — они позволят стимулировать дальнейшую работу в этой области. Важно, что MLX работает на чипах Apple, а они теперь используются во всех её продуктах, включая Mac, iPhone и iPad. Фреймворк задействует ресурсы центрального и графического процессоров, помогая добиться достаточно высокой производительности — возможно, в перспективе можно будет подключать ИИ-ускоритель Neural Engine, который также есть на этих чипах.

Представлен ИИ-генератор изображений Imagine with Meta✴

Вслед за DALL-E, Midjourney и Stable Diffusion собственный отдельный генератор изображений представила компания Meta. В основу платформы, которая создаёт картинки по текстовым командам, легла обученная работе с графикой модель искусственного интеллекта Emu. Генератор получил название Imagine with Meta — он предлагает четыре картинки по одному запросу, но пока доступен только в США.

 Источник изображений: ***

Источник изображений: Meta

«Нам было приятно получать от людей отзывы о том, как они пользуются Imagine — функцией генерации изображений по тексту Meta AI для создания забавного и креативного контента в чатах. Сегодня мы расширяем доступ к Imagine за пределы чатов. Наша платформа обмена сообщениями предназначена для озорной двусторонней переписки, а теперь можно бесплатно генерировать изображения и в веб-интерфейсе», — рассказали в блоге компании.

Пока созданные Imagine with Meta картинки маркируются видимым водяным знаком, но в перспективе разработчик пообещал заменить его на невидимый — его будет генерировать ИИ, и обнаруживать его сможет тоже соответствующая модель. Такой водяной знак будет устойчив к традиционным манипуляциям с изображениями: к обрезке, изменению размера и цвета, снятию снимков экрана, сжатию, наложению шума, стикеров и многому другому, уточнили в Meta. В перспективе компания планирует внедрять такую маркировку во многие свои продукты с изображениями, созданными ИИ.

Пока служба Imagine with Meta доступна только для пользователей из США. Ранее Meta предложила пользователям Instagram и Facebook ИИ-генератор стикеров, но пользователи соцсетей начали использовать его для создания непристойностей — фильтры сервиса оказались недостаточно надёжными.

Генеративный ИИ от Google поможет McDonald's убедиться, что картошка фри свежая, и не только

McDonald’s объявил о сотрудничестве с Google для внедрения генеративного ИИ, начиная с 2024 года. Этот шаг, направленный на технологическое обновление компании, обещает радикально преобразить операционные процессы сети, предлагая клиентам лучшее качество обслуживания и более свежую пищу.

 Источник изображения: Waid1995 / Pixabay

Источник изображения: Waid1995 / Pixabay

С 2024 года McDonald’s начнёт масштабное обновление своих ресторанов, включающее установку нового оборудования и ПО, а также использование облачных сервисов Google Cloud. Эти изменения охватят тысячи заведений по всему миру. Основная цель — использование генеративного ИИ для анализа огромных объёмов данных. Это позволит оптимизировать рабочие процессы и улучшить качество обслуживания, в том числе подачу более горячей и свежей еды.

Хотя McDonald’s пока не раскрывает подробности о специфике применения ИИ, в своем заявлении компания упоминает, что новые технологии помогут менеджерам быстрее выявлять и решать проблемы в бизнес-процессах сети, а также упростят работу персонала ресторанов и создадут новые возможности для клиентов. Компания Wendy’s, также использующая Google Cloud AI, применяет аналогичный подход. Она уже тестирует систему ИИ для приёма заказов. Эти изменения могут говорить о широком внедрении автоматизации в индустрии общественного питания.

В дополнение к этим инновациям, McDonald’s также реализует новую операционную систему, которая будет синхронизировать работу мобильного приложения и киосков для самостоятельного оформления заказов. Это обновление нацелено на создание единого и интуитивно понятного пользовательского интерфейса. Компания уверена, что такой подход упростит процесс заказа для клиентов и позволит проводить более точные тесты и разрабатывать автоматизированные решения для улучшения операционной деятельности ресторанов.

«Самое большое и лучшее обновление»: ИИ-чат-бот Google Bard перевели на нейросеть Gemini, и теперь он потягается с ChatGPT

В то время как ИИ-чат-бот ChatGPT от OpenAI стал одним из самых быстрорастущих потребительских продуктов за всю историю, популярность аналогичного бота Bard от Google гораздо ниже, а его ответы редко могут конкурировать с тем, что предлагает ChatGPT и другие боты, в основе которых лежат большие языковые модели GPT-3 и GPT-4, пишет The Verge. Но теперь всё может измениться, ведь Google перевела Bard на мощнейшую нейросеть Gemini.

 Источник изображения: Google

Источник изображения: Google

Компания сообщает, что обновлённый Bard на большой языковой модели Gemini от Google с сегодняшнего дня стал доступен в 170 странах мира, но пока только лишь на английском языке. В России, Беларуси и ряде других стран ИИ-чат-бот от Google недоступен.

Google заявляет, что Gemini соответствует и даже превосходит нейросеть GPT-4 от OpenAI во многих отношениях. Сейчас Bard использует Gemini Pro, модель среднего уровня серии Gemini. Серия также включает модель Gemini Ultra — самую большую и медлительную, но наиболее функциональную, и модель Nano — наиболее лёгкую и быструю, предназначенную для работы на Android-устройствах.

Вице-президент отдела разработки голосового помощника «Google Ассистент» и чат-бота Bard Сисси Сяо (Sissie Hsiao) заявила на брифинге для прессы, что Gemini представляет собой «самое большое и лучшее обновление» для Bard. Это должно стать заметным улучшением практически всего, что Bard уже делает: обобщение, мозговой штурм, написание текстов и тому подобное, отметила она.

Гендиректор Google Сундар Пичаи (Sundar Pichai) рассказал ресурсу The Verge, что в ходе тестирования он увидел, что это не столько новая функция, сколько общее улучшение по всем направлениям. «Я думаю, люди просто обнаружат, что продукт стал намного лучше, — говорит он. — Он лучше понимает их намерения и лучше отвечает. Это более реалистично и качественно. Если вы пытаетесь работать с кодом, это лучше».

Как сообщается, Google работает над более функциональной версией чат-бота. Компания планирует выпустить в следующем году превью чат-бота Bard Advanced на базе Gemini Ultra, которая является мультимодальной ИИ-моделью, то есть помимо текста она может принимать и создавать изображения, аудио и видео.

Google представила ИИ-модель Gemini — она должна стать главным конкурентом GPT-4

Google объявила о запуске модели искусственного интеллекта Gemini, которая станет основой ИИ-функций компании и бросит вызов конкурентам, включая ChatGPT от OpenAI. По словам гендиректора Google Сундара Пичаи (Sundar Pichai), появление нового алгоритма знаменует начало новой эры искусственного интеллекта в компании.

 Источник изображений: Google

Источник изображений: Google

«Одна из самых важных особенностей этого момента в том, что вы можете работать над одной базовой технологией и улучшать её, и это сразу будет распространяться на все наши продукты», — сказал господин Пичаи.

Гендиректор Google отметил, что запуск языковой модели Gemini является огромным шагом вперёд и в конечном счёте это окажет влияние практически на все продукты компании. Gemini представляет собой нечто большее, чем одна языковая модель. Существует более лёгкая версия ИИ-модели Gemini Nano, которая предназначена для автономной работы на устройствах с Android. Кроме того, существует более мощная версия Gemini Pro, которая в будущем станет основой многих сервисов Google, а с сегодняшнего дня является основой чат-бота Bard. В дополнение к этому Google создала ИИ-модель Gemini Ultra, которая является самой мощной языковой моделью компании и в основном предназначена для использования в центрах обработки данных и интеграции с корпоративными приложениями.

На потребительский рынок компания выводит свою ИИ-модель сразу несколькими способами. Чат-бот Bard теперь работает на основе Gemini Pro, а пользователи Pixel 8 Pro получат доступ к нескольким новым функциям благодаря интеграции с Gemini Nano. Возможность использования Gemini Ultra появится в следующем году. Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud, начиная с 13 декабря. На данный момент Gemini может обрабатывать запросы на английском языке, но, очевидно, что в дальнейшем, появится поддержка других языков.

По словам Сундара Пичаи, эта ИИ-модель в конечном счёте будет интегрирована в поисковую систему Google, рекламные продукты компании, браузер Chrome и другие сервисы. Похоже, что Google, являющаяся создателем большей части основополагающих технологий, способствовавших нынешнему буму в сфере ИИ, и уже около десяти лет называвшая себя компанией, ориентированной на искусственный интеллект, готова дать отпор запущенному год назад ChatGPT, который оказался настолько хорош, что явно заставил нервничать IT-гиганта.

В рамках презентации Gemini гендиректор Google DeepMind Демис Хассабис (Demis Hassabis) рассказал, что Google провела тщательное сравнение своей языковой модели с GPT-4, наиболее актуальной версией нейросети, лежащей в основе ChatGPT. «Мы провели очень тщательный сравнительный анализ систем. Я думаю, что мы существенно опережаем конкурента по 30 из 32 показателей», — сказал Хассабис, указывая на 32 хорошо себя зарекомендовавших теста сравнения больших языковых моделей. Он также отметил, что в некоторых тестах превосходство Gemini над GPT-4 минимально, тогда как в других оно более ощутимо.

В этих тестах наиболее явным преимуществом Gemini стала способность понимать видео и аудио, а также взаимодействовать с ними. По большому счёту, Google так и задумывала, поскольку компания не создавала отдельные ИИ-модели для обработки изображений и аудио, как сделала OpenAI, создав DALL-E и Whisper. С самого начала Google работала над созданием единой модели, способной распознавать изображения и звуки. На данный момент базовые версии Gemini поддерживают ввод и вывод текста, но более мощные версии алгоритма, такие как Gemini Ultra, могут работать с изображениями, видео и аудио. Конечно, эти модели всё ещё галлюцинируют, они не лишены предубеждений и других проблем, но со временем Google планирует улучшить их понимание окружающего мира.

Несмотря на проведённые разработчиками тесты, главную проверку Gemini проведут рядовые пользователи, которые захотят использовать алгоритм для поиска информации, создания контента, написания программного кода и многого другого. В плане генерации кода алгоритм Google использует новую систему AlphaCode 2, которая, по словам представителей компании, работает лучше по сравнению с 85 % аналогами конкурентов и на 50 % лучше по сравнению с оригинальным алгоритмом AlphaCode.

Не менее важно для Google и то, что Gemini, вероятно, является максимально эффективной моделью. Она обучалась с использованием тензорных процессоров Google, благодаря чему может работать быстрее и эффективнее, чем предыдущие алгоритмы компании, такие как PaLM. Наряду с новой языковой моделью Google представила ускорители TPU v5p, которые предназначены для использования в центрах обработки данных для обучения и запуска больших языковых моделей.

Презентация Gemini даёт понять, что Google рассматривает новый алгоритм как масштабный проект и одновременно большой шаг вперёд для всей компании. Gemini — это ИИ-модель, к которой Google шла годами, возможно, даже та, которую ей следовало выпустить до того, как мир захватил ChatGPT. Google приложили массу усилий, чтобы обеспечить безопасность и надёжность Gemini, проведя внутреннее и внешнее тестирование алгоритма, но и это, по словам руководителей компании, не гарантирует, что нейросеть будет работать безошибочно.

В течение многих лет Сундар Пичаи и другие руководители Google поэтически рассуждали о потенциале искусственного интеллекта. Сам Пичаи не раз говорил, что ИИ окажет на человечество более сильное влияние, чем огонь или электричество. Первое поколение модели Gemini, скорее всего, не изменит мир. В лучшем случае она поможет компании догнать ChatGPT, но руководство Google, уверено, что это начало чего-то большего.

Google добавила в Pixel 8 Pro локальную нейросеть Gemini Nano — в будущем она станет частью Android и будет доступна всем

Сегодня Google представила Gemini, «самую функциональную и гибкую модель искусственного интеллекта, которую компания когда-либо создавала». Gemini Nano — это работающая локально версия новой большой языковой модели Google, предназначенная для того, чтобы сделать устройство умнее и быстрее без необходимости подключения к интернету. С сегодняшнего дня она работает на Pixel 8 Pro, который также получил ряд других ИИ-функций.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В зависимости от объёма используемых данных, существует три варианта Gemini — Ultra, Pro и Nano, каждый из которых оптимизирован для работы на соответствующих устройствах — от центров обработки данных до смартфонов. Pixel 8 Pro использует возможности чипа Google Tensor G3 для предоставления расширенных ИИ-функций, таких как создание выжимок из записей звука в приложении диктофона, интеллектуальные подсказки ответов в клавиатуре Gboard. В дальнейшем Google планирует использовать Bard на базе Gemini в качестве помощника на всех новых Pixel, и расширит функциональность ИИ-модели.

На данный момент процессор Google Tensor 3, похоже, единственный, который способен работать с этой моделью ИИ. Но Google также работает над тем, чтобы встроить Gemini Nano в Android в целом: компания запустила новый системный сервис под названием AICore, который разработчики могут использовать для внедрения функций Gemini в свои приложения. Последние пару лет Google говорила о своих телефонах Pixel как об устройствах с ИИ. Благодаря чипам Tensor и взаимодействию со всеми сервисами Google они со временем должны становиться лучше и умнее. С Gemini Nano это может в конечном итоге стать реальностью для многих высококлассных Android-устройств.

Помимо генеративных моделей ИИ, устройства Pixel используют и другие инструменты на основе ИИ. Эти новые функции и другие обновления для повышения производительности и настройки начнут распространяться сегодня на смартфонах, планшетах и умных часах Pixel.

Gemini Nano теперь поддерживает функцию Summarize («Подведение итогов») в приложении Recorder на Pixel 8 Pro. Пользователю даже без подключения к Сети будет доступна сводка записанных разговоров, интервью, презентаций и многого другого. Также приложение Recorder научилось расшифровывать данные на 28 новых языках.

Pixel 8 Pro при помощи Gemini Nano предложит функцию Smart Reply («Интеллектуальный ответ») в Gboard, пока только в предварительной версии для разработчиков. Модель ИИ, встроенная в устройство, пока работает только в WhatsApp, предлагая высококачественные ответы для диалога. В следующем году поддержка Smart Reply расширится.

Используя возможности Google Tensor G3, функция Video Boost на Pixel 8 Pro загружает видео для обработки в облако, где оптимизируется цвет, освещение, стабилизация и зернистость.

Функция Night Sight позволяет снимать на Pixel 8 и Pixel 8 Pro яркие и детализированные замедленные видеоролики при слабом освещении.

Функция Photo Unblur разработана специально для получения качественных изображений домашних питомцев.

Функция Pixel Clean поможет удалить пятна и складки с отсканированных документов.

Google Ассистент на телефонах Pixel Fold, Pixel 6 и новее теперь предлагает варианты контекстных ответов прямо на экране вызова. Экран вызовов теперь также доступен на Pixel Watch, это поможет игнорировать нежелательные вызовы.

В Pixel Watch появилась новая функция, которая упрощает разблокировку телефона. Теперь Pixel Watch может разблокировать телефон Pixel, если владелец находится поблизости. Функция Google AI Clear Calling поможет снизить фоновый шум и улучшить качество голоса во время видеозвонков на Pixel Tablet. А Repair Mode («Режим восстановления») обеспечит душевное спокойствие, помогая защитить и сохранить личные данные, когда устройство находится в сервисе.

ИИ-стартап xAI Илона Маска собирается привлечь до $1 млрд инвестиций

Илон Маск (Elon Musk) стоял у истоков ставшего популярным стартапа OpenAI, но в дальнейшем разорвал свои связи с этим разработчиком систем искусственного интеллекта. В этом году американский миллиардер основал компанию xAI, которая при создании своих больших языковых моделей смогла использовать массивы данных социальной сети X. На развитие бизнеса xAI собирается привлечь до $1 млрд, как стало известно на этой неделе.

 Источник изображения: Unsplash, Xu Haiwei

Источник изображения: Unsplash, Xu Haiwei

Информация поступила из официальной заявки, которую американские компании обязаны подавать регуляторам в подобных случаях. Как выясняется, xAI с момента своего основания в текущем году уже привлекла около $135 млн, но перечень инвесторов пока не раскрывается. Теперь компания намеревается привлечь около $1 млрд. В прошлом месяце Илон Маск заявил, что существующие инвесторы социальной сети X получат в капитале стартапа xAI примерно четверть акций. Подписчикам премиального сервиса X также будет открыт доступ к чат-боту Grok, который создаётся xAI с использованием данных социальной сети, ранее известной под именем Twitter.

Заинтересованность в инвестициях на направлении систем искусственного интеллекта Илон Маск странным образом совмещает с осторожным отношением к подобным технологиям. В марте он обратился к разработчикам крупнейших языковых моделей с просьбой приостановить свою деятельность.

Microsoft переведёт ИИ-помощника Copilot на флагманскую нейросеть GPT-4 Turbo

Компания Microsoft анонсировала ряд нововведений, которые получит её ИИ-помощник Copilot. В скором времени Copilot получит поддержку флагманской нейросети GPT-4 Turbo, а также обновленную модель DALL-E 3. Также помощник получит интерпретатора программного кода, а поисковик Bing обзаведётся функцией «Глубокого поиска» на базе ИИ.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Скоро Copilot сможет отвечать на запросы, используя новейшую модель GPT-4 Turbo от OpenAI, что означает, что он сможет принять больше данных благодаря контекстному окну размером 128 тыс. символов. Увеличенное контекстное окно позволит Copilot лучше понимать запросы и предлагать более качественные ответы. «В настоящее время эта модель тестируется отдельными пользователями и будет интегрирована в Copilot в ближайшие недели», – сообщил Юсуф Медхи (Yusuf Medhi), директор по потребительскому маркетингу в Microsoft.

Пока пользователи дожидаются появления модели GPT-4 Turbo в Copilot, Microsoft уже задействовала модель DALL-E 3 в Bing Image Creator и Copilot. «Теперь вы можете использовать Copilot для создания изображений, которые будут ещё более высокого качества и более точно соответствовать запросам благодаря обновлённой модели DALL-E 3», – утверждает Медхи.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft Edge, в котором есть боковая панель Copilot, также получил возможность компоновки текста на веб-сайтах, чтобы переписывать предложения в режиме реального времени. Кроме того, теперь вы можете использовать Copilot в Microsoft Edge для конспектирования видеороликов, которые вы смотрите на YouTube.

Разработчиков же может заинтересовать новая функция интерпретатора кода, которая скоро появится в Copilot. Эта новая функция позволит пользователям Copilot получать от ИИ-чат-бота более точные расчеты, анализ данных и даже код. «Copilot будет писать код для ответа на сложные запросы на естественном языке, запускать его в изолированной среде и использовать результаты для получения более качественных ответов, – поясняют в Microsoft. – Вы также сможете загружать и скачивать файлы в Copilot и из него, чтобы работать с собственными данными и кодом, а также с результатами поиска Bing».

Что касается, собственно Bing, то Microsoft добавляет в него результаты так называемого «Глубокого поиска». «Deep Search использует возможности GPT-4 для предоставления оптимизированных результатов поиска по сложным темам, — поясняет Медхи. — Активация Deep Search расширяет поисковые запросы до более полных описаний, чтобы предоставить более релевантные результаты».

«Яндекс» запустил сервис «Нейростат» для отслеживания популярности искусственного интеллекта в России

Компания «Яндекс» объявила о запуске сервиса «Нейростат», который представляет собой инструмент для оценки уровня осведомлённости и использования генеративных нейросетей на территории России. Решение предоставляет статистические данные и позволяет следить за тем, как ИИ-алгоритмы всё глубже проникают в повседневную жизнь людей.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Статистические данные «Яндекса» указывают на то, что в настоящее время 58 % россиян в возрасте от 18 до 45 летзнают о существовании алгоритмов для генерации текстов по короткому описанию. В ноябре этого года 31 % пользователей применяли такие нейросети для создания текстов, что существенно больше 23 % пользователей, которые взаимодействовали с генераторами текста в мае.

О существовании генеративных алгоритмов, способных создавать изображения и видео по текстовому описанию, осведомлены 75 % пользователей в возрасте от 18 до 45 лет. В ноябре 31 % пользователей использовали такие алгоритмы для создания изображений.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

По данным поисковой системы «Яндекса», с начала 2022 года интерес к ИИ-алгоритмам со стороны пользователей вырос более чем в 15 раз. В настоящее время слово «нейросеть» встречается в запросах так же часто, как «фитнес», «психолог» или «пиво». Для взаимодействия с нейросетями используются «промты» или «промпты» — текстовое описание задания или инструкция. Этот термин менее распространён, сейчас о нём знают 13 % пользователей текстовых нейросетей, из которых 18 % уже ими пользуются.


window-new
Soft
Hard
Тренды 🔥
Разработчики Subnautica 2 подали в суд на бывших руководителей — в том числе за кражу 172 тысяч конфиденциальных файлов 10 мин.
«Катастрофа»: Elden Ring на Nintendo Switch 2 шокировала журналистов ужасной производительностью 43 мин.
Олдскульный хоррор на выживание Tormented Souls 2 в антураже чилийской глубинки обзавёлся датой релиза 44 мин.
В Steam стартовало открытое тестирование Militsioner — сюрреалистической игры о побеге от милиционера-великана 2 ч.
ИИ-помощник Google Gemini Live научился видеть мир через камеру смартфона — точно и без задержек 2 ч.
Национальный мессенджер Max обяжут предустанавливать на все новые смартфоны в России с 1 сентября 3 ч.
«Google Фото» научились редактировать фото по голосовым и текстовым командам 3 ч.
Приложение Copilot для Windows 11 научилось искать файлы и фото, и получило новый интерфейс 4 ч.
Майкл Майерс возвращается: по мотивам культового фильма ужасов «Хэллоуин» выйдет хоррор Halloween от авторов Friday the 13th: The Game 4 ч.
iKS-Consulting: «Базис» — лидер российского рынка ПО управления динамической ИТ-инфраструктурой 5 ч.
Автопилот оказался бесполезен в городе: его приходится подстраховывать каждые 9 минут 10 мин.
В России стало больше интернет-провайдеров после массовых сбоев мобильного интернета 31 мин.
Робопёс с крошечным человеческим мозгом научился избегать препятствий 36 мин.
Google наконец построит ЦОД в Австрии — через 17 лет после покупки земли 40 мин.
Samsung готова сбить цены, чтобы перехватить у SK hynix заказы Nvidia на память HBM 44 мин.
Google представила процессор Tensor G5 — он переехал на 3-нм техпроцесс TSMC и стал на 34 % быстрее предшественника 2 ч.
Foxconn начал привлекать китайцев на сборку iPhone 17 повышенными зарплатами 3 ч.
Oracle запитает гигантский ЦОД целиком от газовых генераторов, это будет стоить $1 млрд/год 3 ч.
NVIDIA представила ИИ-платформу Jetson AGX Thor Developer Kit с GPU Blackwell 4 ч.
TCL 57R94: один огромный 57″ монитор вместо двух 4K-дисплеев для игр, работы и развлечений 4 ч.