Сегодня 13 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила ИИ-модель Gemini — она должна стать главным конкурентом GPT-4

Google объявила о запуске модели искусственного интеллекта Gemini, которая станет основой ИИ-функций компании и бросит вызов конкурентам, включая ChatGPT от OpenAI. По словам гендиректора Google Сундара Пичаи (Sundar Pichai), появление нового алгоритма знаменует начало новой эры искусственного интеллекта в компании.

 Источник изображений: Google

Источник изображений: Google

«Одна из самых важных особенностей этого момента в том, что вы можете работать над одной базовой технологией и улучшать её, и это сразу будет распространяться на все наши продукты», — сказал господин Пичаи.

Гендиректор Google отметил, что запуск языковой модели Gemini является огромным шагом вперёд и в конечном счёте это окажет влияние практически на все продукты компании. Gemini представляет собой нечто большее, чем одна языковая модель. Существует более лёгкая версия ИИ-модели Gemini Nano, которая предназначена для автономной работы на устройствах с Android. Кроме того, существует более мощная версия Gemini Pro, которая в будущем станет основой многих сервисов Google, а с сегодняшнего дня является основой чат-бота Bard. В дополнение к этому Google создала ИИ-модель Gemini Ultra, которая является самой мощной языковой моделью компании и в основном предназначена для использования в центрах обработки данных и интеграции с корпоративными приложениями.

На потребительский рынок компания выводит свою ИИ-модель сразу несколькими способами. Чат-бот Bard теперь работает на основе Gemini Pro, а пользователи Pixel 8 Pro получат доступ к нескольким новым функциям благодаря интеграции с Gemini Nano. Возможность использования Gemini Ultra появится в следующем году. Разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Google Generative AI Studio или Vertex AI в Google Cloud, начиная с 13 декабря. На данный момент Gemini может обрабатывать запросы на английском языке, но, очевидно, что в дальнейшем, появится поддержка других языков.

По словам Сундара Пичаи, эта ИИ-модель в конечном счёте будет интегрирована в поисковую систему Google, рекламные продукты компании, браузер Chrome и другие сервисы. Похоже, что Google, являющаяся создателем большей части основополагающих технологий, способствовавших нынешнему буму в сфере ИИ, и уже около десяти лет называвшая себя компанией, ориентированной на искусственный интеллект, готова дать отпор запущенному год назад ChatGPT, который оказался настолько хорош, что явно заставил нервничать IT-гиганта.

В рамках презентации Gemini гендиректор Google DeepMind Демис Хассабис (Demis Hassabis) рассказал, что Google провела тщательное сравнение своей языковой модели с GPT-4, наиболее актуальной версией нейросети, лежащей в основе ChatGPT. «Мы провели очень тщательный сравнительный анализ систем. Я думаю, что мы существенно опережаем конкурента по 30 из 32 показателей», — сказал Хассабис, указывая на 32 хорошо себя зарекомендовавших теста сравнения больших языковых моделей. Он также отметил, что в некоторых тестах превосходство Gemini над GPT-4 минимально, тогда как в других оно более ощутимо.

В этих тестах наиболее явным преимуществом Gemini стала способность понимать видео и аудио, а также взаимодействовать с ними. По большому счёту, Google так и задумывала, поскольку компания не создавала отдельные ИИ-модели для обработки изображений и аудио, как сделала OpenAI, создав DALL-E и Whisper. С самого начала Google работала над созданием единой модели, способной распознавать изображения и звуки. На данный момент базовые версии Gemini поддерживают ввод и вывод текста, но более мощные версии алгоритма, такие как Gemini Ultra, могут работать с изображениями, видео и аудио. Конечно, эти модели всё ещё галлюцинируют, они не лишены предубеждений и других проблем, но со временем Google планирует улучшить их понимание окружающего мира.

Несмотря на проведённые разработчиками тесты, главную проверку Gemini проведут рядовые пользователи, которые захотят использовать алгоритм для поиска информации, создания контента, написания программного кода и многого другого. В плане генерации кода алгоритм Google использует новую систему AlphaCode 2, которая, по словам представителей компании, работает лучше по сравнению с 85 % аналогами конкурентов и на 50 % лучше по сравнению с оригинальным алгоритмом AlphaCode.

Не менее важно для Google и то, что Gemini, вероятно, является максимально эффективной моделью. Она обучалась с использованием тензорных процессоров Google, благодаря чему может работать быстрее и эффективнее, чем предыдущие алгоритмы компании, такие как PaLM. Наряду с новой языковой моделью Google представила ускорители TPU v5p, которые предназначены для использования в центрах обработки данных для обучения и запуска больших языковых моделей.

Презентация Gemini даёт понять, что Google рассматривает новый алгоритм как масштабный проект и одновременно большой шаг вперёд для всей компании. Gemini — это ИИ-модель, к которой Google шла годами, возможно, даже та, которую ей следовало выпустить до того, как мир захватил ChatGPT. Google приложили массу усилий, чтобы обеспечить безопасность и надёжность Gemini, проведя внутреннее и внешнее тестирование алгоритма, но и это, по словам руководителей компании, не гарантирует, что нейросеть будет работать безошибочно.

В течение многих лет Сундар Пичаи и другие руководители Google поэтически рассуждали о потенциале искусственного интеллекта. Сам Пичаи не раз говорил, что ИИ окажет на человечество более сильное влияние, чем огонь или электричество. Первое поколение модели Gemini, скорее всего, не изменит мир. В лучшем случае она поможет компании догнать ChatGPT, но руководство Google, уверено, что это начало чего-то большего.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Блогер встроил «чит» прямо в руку — электростимуляция ускорила прицеливание в CS2 3 ч.
ИИ-бот Claude теперь может прочитать «Войну и мир» за раз — Anthropic увеличила контекстное меню в 5 раз 4 ч.
ИБ-платформа Security Vision 5 получила множество доработок 5 ч.
Krafton: увольнение руководителей Unknown Worlds спасло Subnautica 2 от судьбы Kerbal Space Program 2 и «непоправимого ущерба всей франшизе» 5 ч.
Chrome начнёт блокировать скрипты для слежки, но только в режиме «Инкогнито» 6 ч.
VK Tech увеличила в I полугодии 2025 года выручку в полтора раза, а количество клиентов выросло более чем втрое 6 ч.
Догоняя X: месячная аудитория Threads превысила 400 млн активных пользователей 7 ч.
Perplexity предложила выкупить Google Chrome за $34,5 млрд — сам стартап стоит почти вдвое меньше 7 ч.
Персонализация поиска Google стала по-настоящему персональной — теперь можно самому выбирать источники 9 ч.
Capcom устроит «эксклюзивный показ» Resident Evil Requiem на Gamescom: Opening Night Live 9 ч.
Новая статья: Обзор складного смартфона Samsung Galaxy Z Flip7: самая изящная раскладушка 5 ч.
Легенда со 133-летней историей собралась на свалку истории — Kodak признала, что скоро не сможет продолжать работу 7 ч.
Samsung выпустила первый телевизор с подсветкой Micro RGB и улучшенной цветопередачей 9 ч.
Учёные придумали невидимые для глаз световые водяные знаки для выявления дипфейков 10 ч.
Анонсирован смартфон Vivo V60 с оптикой Zeiss и ценой от $425 11 ч.
Мобильная графика Arm станет производительнее — в GPU встроят нейронные ускорители 11 ч.
Nvidia представила GeForce RTX 5090D V2: специальный флагман для Китая с урезанной памятью за те же деньги 12 ч.
Жаркая катка: видеокарта GeForce RTX 5090 вспыхнула во время игры в Battlefield 6 12 ч.
Supermicro представила 4U-сервер на базе NVIDIA HGX B200 с СЖО 12 ч.
Tesla запустила редкую рекламу своего автопилота, но пытается скрыть его несовершенство 12 ч.