Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google создала ИИ-модель DolphinGemma для общения с дельфинами

Дельфины считаются одними из самых умных существ на планете. Они умеют сотрудничать, обучать друг друга новым навыкам и узнавать себя в зеркале. Десятилетиями учёные пытаются понять сложный набор свистов и щелчков, которые дельфины используют для общения. Похоже, что исследователи вскоре смогут существенно продвинуться в этом вопросе при помощи новой открытой ИИ-модели от Google и смартфонов Pixel.

 Источник изображений: Google

Источник изображений: Google

В поисках новых областей для применения генеративного ИИ Google заинтересовалась сотрудничеством с проектом Wild Dolphin Project (WDP). Эта группа исследователей изучает поведение и взаимоотношения сообщества атлантических пятнистых дельфинов с 1985 года.

Одной из главных задач, стоящих перед WDP, является анализ влияния издаваемых дельфинами звуков на их социальное взаимодействие. Понимание структуры и паттернов «голосового общения» дельфинов необходимо для определения того, достигает ли оно уровня полноценного языка. «Мы не знаем, есть ли у животных слова», — говорит Дениз Херцинг (Denise Herzing) из WDP.

 Источник изображения: Wild Dolphin Project

Источник изображения: Wild Dolphin Project

Благодаря десятилетиям подводных записей исследователям удалось связать некоторые базовые действия с определёнными звуками. Например, им удалось выявить характерные свисты, которые, по-видимому, используются как имена, что позволяет двум особям находить друг друга на большом расстоянии. Дельфины также постоянно издают звуковые паттерны, названные учёными «пронзительный крик», во время конфликтов.

Конечная цель WDP — заговорить на дельфиньем языке, если он действительно существует. Это стремление привело к созданию огромного, тщательно размеченного набора данных, который слишком трудоёмок для анализа человеком, но, по словам Google, идеально подходит для обработки с помощью генеративного ИИ.

Генеративная ИИ-модель DolphinGemma основана на открытых моделях искусственного интеллекта Gemma от Google. Она использует разработанную Google аудиотехнологию SoundStream. Модель была обучена с использованием акустического архива проекта Wild Dolphin. Команда надеется, что DolphinGemma поможет выявить сложные закономерности, которые позволят создать общий словарь.

DolphinGemma работает так же, как языковые модели, ориентированные на человека: она получает запрос и предсказывает следующий токен. Учёные полагают, что эти предсказанные токены могут оказаться звуковыми последовательностями, которые будут поняты дельфинами.

Google разработала DolphinGemma с учётом исследовательского подхода WDP. Учёные используют телефоны Pixel в полевых условиях, что накладывает дополнительные требования к модели. Запуск моделей ИИ на смартфоне — сложная задача из-за ограниченных ресурсов. Чем больше и функциональнее модель, тем больше оперативной памяти и вычислительных мощностей ей требуется. DolphinGemma обучена примерно на 400 миллионах параметров, что совсем немного для типичных современных моделей, количество параметров которых исчисляется десятками миллиардов.

В течение последних нескольких лет WDP использует устройство, созданное в Технологическом институте Джорджии, под названием CHAT (Cetacean Hearing Augmentation Telemetry), на основе смартфона Pixel 6. Команда применяет CHAT для записи, прослушивания и синтеза голосов дельфинов.

 Источник изображения: Georgia Institute of Technology

Источник изображения: Georgia Institute of Technology

На летний исследовательский сезон 2025 года Google предоставит членам команды WDP смартфоны Pixel 9, что позволит CHAT одновременно запускать модели глубокого обучения и алгоритмы сопоставления шаблонов. Учёные на данном этапе не планируют передавать сгенерированные DolphinGemma звуки непосредственно в CHAT, то есть оба подхода будут использоваться параллельно.

Конечно, маловероятно, что DolphinGemma и новый CHAT мгновенно позволят людям запросто общаться с дельфинами, но есть надежда, что со временем система обеспечит хотя бы базовое взаимодействие. Как и другие модели Gemma, DolphinGemma является проектом с открытым доступом. Google сделает модель общедоступной уже этим летом. Хотя DolphinGemma была обучена на звуках атлантических пятнистых дельфинов, Google предполагает, что её можно будет адаптировать и для других видов китообразных.

В завершение трудно удержаться и не процитировать отрывок из романа Дугласа Адамса ( Douglas Noël Adams) «Автостопом по Галактике»:

«Важный и широко известный факт: не всегда то, что кажется — правда. Например, на планете Земля человек всегда считал, что он разумнее дельфинов потому, что многого достиг — придумал колесо, Нью-Йорк, войны и так далее — в то время, как дельфины только тем и занимались, что развлекались, кувыркаясь в воде. Дельфины же, со своей стороны, всегда считали, что они намного разумнее людей — именно по этой причине».

И ещё одна цитата — из книги «Человек-дельфин» знаменитого ныряльщика Жака Майоля ( Jacques Mayol):

«Что же тогда? Чего мы хотим добиться?

…А я отвечу вам : нам надо избавиться от нашего эгоизма, от этого подлого чудовища, которое в конце концов обернётся против человека и сотрёт его с лица земли к большой пользе всех других живущих видов, и прежде всего дельфина. Мы же лицемерны. Человек обожает дельфинов! Да, для своего личного удовольствия, чтобы сделать из них вассалов, домашних слуг, рабов, роботов, несущих на спине бомбы.

И он близок к этому».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Reddit заблокировала учёных за тайный эксперимент с ИИ-ботами в дискуссиях 2 ч.
OpenAI откатила обновление ChatGPT из-за подхалимского поведения ИИ 3 ч.
Mozilla Firefox представила долгожданную функцию разделения профилей, как в Chrome 4 ч.
Маск объявил скорый выход Grok 3.5 — размышляющего ИИ, который будет «создавать ответы с нуля» без интернета 9 ч.
Московский суд оштрафовал Blizzard на 600 тысяч рублей за нарушение правил работы в России 9 ч.
Electronic Arts отменила эвакуационный шутер по Titanfall и устроила новую волну сокращений в Respawn 10 ч.
Meta похвасталась, что число загрузок ИИ-моделей Llama перевалило за 1,2 млрд 10 ч.
ИИ-блокнот Google NotebookLM заговорил на русском и ещё более чем 50 языках 11 ч.
Амбициозная российская стратегия Broken Arrow о противостоянии России и США получила дату выхода — в Steam открыт предзаказ 11 ч.
Meta запустила самостоятельное ИИ-приложение для конкуренции с ChatGPT и другими ИИ-ботами 12 ч.
Ракета Firefly Alpha не смогла вывести спутник Lockheed Martin на орбиту — полезная нагрузка упала в океан 31 мин.
Прибыль Samsung в полупроводниковом секторе упала на 42 % из-за санкций и низких цен 2 ч.
TSMC приступила к строительству третьего предприятия в штате Аризона 3 ч.
Новая статья: Гид по выбору складного смартфона в 2025 году 8 ч.
Intel анонсировала техпроцесс 14A с «турбо-ячейкми» и 18A-PT с 3D-штабелированием 9 ч.
Inventec вложит до $85 млн в производство серверов в Техасе 10 ч.
Европейская ракета Vega-C вывела в космос научный спутник ESA Biomass для подсчёта лесов на планете 10 ч.
SilverStone выпустила блок питания мощностью 2500 Вт, которых хватит на трио RTX 5090 или квартет RTX 5080 10 ч.
Одних лишь фабрик чипов недостаточно: на создание полноценной цепочки поставок в США у TSMC уйдёт до 10 лет 14 ч.
Вышло новое устройство на российской ОС «РОСА Мобайл» — планшет «Р-Таб» с чипом Helio G99 15 ч.