Tacotronでテキストから音声を生成する

スポンサーリンク

Tacotronとは?

Tacotronは、Googleが開発してNVIDIAが実装ソースコードを公開している音声合成モデルです。

ソースコードを実行するために、GPUを選択してください。

ライブラリをインストールする

音声合成ライブラリをインストールします。

!pip install ttslearn #音声合成ライブラリ

Tacotronで音声を合成する

Tacotronを使って音声を合成します。

from ttslearn.tacotron import Tacotron2TTS
from IPython.display import Audio

engine = Tacotron2TTS()
wav, sr = engine.tts("テストです")
Audio(wav, rate=sr)

コメント

タイトルとURLをコピーしました