В начале этого года Google представила MusicLM — модель искусственного интеллекта, способную создавать музыку в любом жанре. С тех пор разработчики продолжали развивать алгоритм и теперь он может создавать 5-минутные песни по небольшому текстовому описанию. Однако вероятные проблемы юридического характера вряд ли позволят компании когда-либо сделать этот инструмент общедоступным.
Взрывной рост популярности генеративных нейросетей наблюдается последние несколько месяцев. Однако алгоритмы вроде ChatGPT или DALL-E не являются первопроходцами. Так компания Open AI выпустила музыкальный ИИ-генератор Jukebox ещё в 2020 году. Возможности этого алгоритма были весьма ограничены, поэтому он не смог завоевать популярность.
Нейросеть Google MusicLM, вероятно, является значительно более продуктивной. Согласно имеющимся данным, алгоритм способен генерировать 5-минутные песни на основе текстового описания, причём конечный результат в значительно большей степени напоминает то, что мог бы написать человек. В процессе обучения алгоритма использовались 280 тыс. часов аудиозаписей.
На этапе оценки Google сравнивала MusicLM с другими музыкальными ИИ-генераторами Mubert и Riffusion, а также задействовала некоторое количество слушателей, которые оценивали качество звучания сгенерированных композиций. По данным источника, алгоритм MusicLM превзошёл аналоги по всем показателям. Несмотря на это, алгоритм всё ещё далёк от того, чтобы создавать полноценные песни, поскольку он не способен воспроизводить структуру привычных человеку музыкальных композиций, а генерируемый им вокал лишь отдалённо напоминает пение.
Источник: