Posaune Blog

GANで自分の楽器の音声を再現してみた

2024/04/08

自分の楽器の音声を再現したいので、GANを利用してみました。GANとは、Generative Adversarial Networkの略で、生成モデルの一つです。生成モデルとは、データを生成するモデルのことで、GANはその中でも、生成モデルの中でも、特に画像生成において優れた性能を発揮するモデルです。今回は画像ではなく、音声を生成したいので、音声生成においてGANを利用することができるWaveGANというモデルを利用しました。WaveGANは、音声生成においてGANを利用するモデルで、音声生成において優れた性能を発揮するモデルです。

使用したモデル

以下のページを参考にして実装しました。

【音声生成+機械学習】ポケモンの鳴き声をWaveGANで生成する

感想

実際に学習させると、5000回程度学習させると、ノイズから音っぽいなにかに変わり感動した。ただ、音声自体が綺麗ではないので、もう少し学習させてみたいと思う。