Сегодня 23 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Нейросеть Google Gemini 1.5 Pro обрела слух

С очередным обновлением большая языковая модель Google Gemini 1.5 Pro получила «уши»: в качестве входных данных она теперь воспринимает загружаемые аудиофайлы. Теперь ИИ может подготовить сводку пресс-конференции без её текстовой расшифровки. Новые функции добавились и в генератор изображений Imagen 2.

 Источник изображения: blog.google

Источник изображения: blog.google

В ходе мероприятия Google Next компания объявила, что Gemini 1.5 Pro станет доступной для общественности через облачную платформу Vertex AI для разработки приложений искусственного интеллекта. Сейчас большинство пользователей может работать с моделями Gemini через одноимённый чат-бот. Самая мощная из них, Gemini Ultra, доступна с платным чат-ботом Gemini Advanced — она поддерживает длинные запросы, но уступает Gemini 1.5 Pro в скорости работы.

Новые возможности также получил генератор изображений Imagen 2 — теперь он может добавлять элементы на готовые изображения или удалять их. На всех картинках, которые создаёт Imagen 2, теперь ставится цифровой водяной знак SynthID, который указывает на их происхождение при проверке специальным инструментом, но остаётся невидимым для человеческого глаза.

Google добавила, что изучает способы согласовывать ответы ИИ с выдачей поисковой системы, чтобы предоставляемая им информация была актуальной. Это не всегда возможно для больших языковых моделей, и иногда преднамеренно: компания, например, не позволяет Gemini отвечать на вопросы, связанные с выборами в США.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Каждый заслуживает постоянный доступ к играм, за которые заплатил»: Owlcat Games поддержала движение Stop Killing Games 16 мин.
В Firefox 141 исправили 18 уязвимостей и добавили сортировку вкладок силами ИИ 41 мин.
Проверенный инсайдер подтвердил дату выхода и цену Battlefield 6 на ПК и консолях, а Electronic Arts показала тизер сюжетной кампании 2 ч.
«Наконец-то достойный наследник Dead Space»: 10 минут геймплея хоррора Cronos: The New Dawn от создателей ремейка Silent Hill 2 3 ч.
ИИ способны тайно научить друг друга быть злыми и вредными, показало новое исследование 3 ч.
AWS ограничила доступ к среде разработки Kiro с ИИ из-за её чрезмерной популярности 4 ч.
Microsoft тоже посчитала стоимость The Outer Worlds 2 слишком высокой — игра будет продаваться за $70, а не за $80 4 ч.
В ChatGPT появилась функция «Совместное обучение», которая поможет подготовиться к экзаменам 5 ч.
Люди скоро совсем перестанут понимать, как ИИ рассуждает — предупредили ведущие разработчики 5 ч.
Идея создания национального аналога SAP не нашла поддержки у бизнеса 5 ч.
Ловкость рук и никакого мошенничества: Meta показала прототип браслета, который позволит управлять ПК с помощью жестов 57 мин.
Apple запустила страховку AppleCare One для трёх устройств за $20 в месяц 2 ч.
iPhone и «основные Android-смартфоны» получат поддержку беспроводной зарядки Qi2 25W, представленной сегодня 3 ч.
Том Конрад, отмывающий репутацию Sonos, стал постоянным генеральным директором компании 3 ч.
Спрос на ленточные накопители продолжает расти: поставки LTO в 2024 году приблизились к 180 Эбайт 4 ч.
AMD запустила продажи мощнейших ПК-процессоров — 96-ядерный Ryzen Threadripper Pro 9995WX стоит $11 699 4 ч.
Китай введёт системы автономного вождения в ПДД и запретит привирать в их рекламе 5 ч.
Micron выпустила первую в мире флеш-память SLC NAND для космических ЦОД — она не боится радиации, вакуума и мороза 5 ч.
50 Гбайт за 1,5 секунды: в Китае протестировали сотовую сеть 6G 5 ч.
Дешёвой DDR5 пока не будет: китайская CXMT отложила запуск массового производства чипов DDR5 5 ч.