ИИ-бот Gemini научился озвучивать тексты из «Google Документов»

Разработчики из Google продолжают использовать ИИ-модель Gemini для создания новых функций, которые могут оказаться полезными для пользователей. На этот раз алгоритм научился «генерировать аудиоверсии ваших документов», хранящихся в облачном сервисе «Google Документы» с возможностью их последующего воспроизведения голосом.

Источник изображения: 9to5google.com

Новая опция «Аудио» для преобразования текста в речь появилась в меню «Инструменты», которое можно увидеть в верхней части рабочего пространства при взаимодействии с документами в сервисе «Google Документы». После нажатия кнопки «Прослушать эту вкладку» на экране появится миниатюрный проигрыватель с указанной продолжительностью сгенерированного аудио. Проигрыватель можно переместить в любую часть экрана, а помимо стандартных инструментов воспроизведения в нём также реализована возможность регулировки скорости воспроизведения и интонации голоса, которым проговаривается текст документа.

В дополнение к этому в процессе редактирования можно добавить звуковую кнопку в любом месте файла, чтобы воспользоваться функцией преобразования текста в аудио позднее. Это может оказаться удобным для пользователей платформы, которые на слух лучше усваивают информацию.

В настоящее время упомянутое нововведение поддерживает только английский язык и доступно в веб-версии сервиса «Google Документы». Воспользоваться им в ближайшее время смогут подписчики Google AI Pro и Ultra, а также корпоративные клиенты компании и прочие.