歌声合成・生成ソフトを用いたボーカルの表現調整に使える方法

(写真はイメージです)

今回は、歌声合成生成ソフトを用いて作成したボーカルパート(歌メロ)の表現を、お好みに調整したいときに使える方法を少し紹介したいと思います。

こんな方に特におすすめの内容です。

  • 歌入りのカバー曲音源を制作しているが、本家音源との差を縮めたい
  • 自作曲音源を制作しているが、ボーカル表現こだわりたい

なお、本記事では、以下のような特徴を持つ歌声合成・生成ソフトを用いて、DAW上で楽曲音源制作する場合を前提とします。

  • 日本語を基本とする歌声を合成・生成
  • 譜面データを入力してオーディオファイルに出力する形で、歌声を合成・生成

それでは以下、詳しくみていきましょう!

1.音程を半音未満の単位で変えたい

譜面ソフトでは通常、対応できないため、

歌声合成・生成(オーディオ化)後に、変えたい部分に対してピッチ補正を行います。

ピッチ補正の方法例としては以下が挙げられます。

  • Melodyneを使って補正
  • DAW上で補正

なお、このピッチ補正は、以降で述べる他の調整内容でもちょくちょく必要になってきます。

2.音程の変化パターンを変えたい

具体的には、以下のようなケースが考えられます。

  • 滑らかな音程変化を入れたい
  • 滑らかな音程変化をなくしたい
  • 音程変化スピードを変えたい

2-1.滑らかな音程変化を入れたい

元の歌声でほぼ鍵盤のように音程が離散的に切り替わっているところを、連続的な音程変化にしたい場合です。

この場合、以下処置が有効です。

  1. 譜面で細かな音程変化を打ち込む(経過音のうち、特徴的なものを抜粋して打ち込む)
  2. (そのままでは満足いかない場合)上記をオーディオ化した結果に対し、DAW上でタイミング補正して調整する

2-2.滑らかな音程変化をなくしたい

先ほどとは逆のケースです。

譜面上、細かな音程変化はないが、オーディオ化すると滑らかな音程変化になっている場合、

まず、対象箇所近く(前後)に音符があるかどうかを確認します。

対象箇所近く(前後)音符がある場合、前後の音符が影響している可能性が考えられます。

この場合は、以下処置を試してみるとよいかと思います。

  1. 前後の音符を削除して、対象の音符のみにしたオーディオファイルを作成(歌声合成・生成)する
  2. DAW上で、上記結果を切り貼りして、元のメロディとうまくつなぐ

対象箇所近く(前後)音符がない場合

オーディオデータ内の対象部分を、

  • 声のエッジ部分
  • 音程変化部分
  • 音程一定部分

分け

声のエッジ部分」と「音程一定部分」をうまくつなぐ、という方法を試してみるとよいでしょう。

途中の「音程変化部分」をカットするので、そのままだと不自然になりがちですが、

以下のような処置を行うことで、不自然さ低減可能です。

  • 各部分をクロスフェードを使って滑らかにつなぐ
  • 「音程変化部分」をカットして全体として短くなった分を補うように「音程一定部分」を長くする

2-3.音程変化スピードを変えたい

これは2-1で紹介した方法と関連しますが、以下方法が有効です(併用もOK)。

  • 譜面上の音程変化パターンを変更する
  • DAW上でタイミング補正して調整する

譜面だと基本的に音符単位の調整しかできないので、よほど大きな調整でない限り、DAW上で調整する方がやりやすいと思います。

3.リズムや長さを細かい単位で変えたい

先ほどの2-3で紹介した方法とも共通しますが、以下方法が有効です(併用もOK)。

  • 譜面で細かい単位の音符を導入して調整
  • オーディオ化後にDAW上でタイミング調整

長さ調整の場合は、譜面上で長めに打ち込んでおき、DAW上で必要に応じて末尾カット&フェードアウト処理する方がよいでしょう。

4.子音だけの音にしたい

歌声生成AIのNEUTRINOの場合は、譜面で母音脱落記号「’」を使うことで対応可能です、

対応できない場合は、母音付きの発音でオーディオ化しておき、母音が聞き取れるようになる手前でカットするとよいでしょう。

5.音程感をなくしたい(シャウトなど)

ナチュラルな声質のまま行うことが難しく、また完全に音程感をなくすことも難しいですが、設定次第で音程感を弱められるエフェクト(リングモジュレーターやピッチシフターなど)があれば、以下の方法が使えます。

  1. リングモジュレーターやピッチシフターなどのエフェクトで音程感を弱める
  2. 必要に応じて、上記結果に対してピッチ補正を行う
  3. 必要に応じて、上記結果に対してEQ処理を行う

エフェクト+ピッチ補正で、音程感を弱めた声を作ることができますが、声質も大きく変わります。

ですので、例えば、鋭い声になり過ぎた場合はEQで高音を削る、といった処置を行うとよいでしょう。

ただ、EQで後処理するとはいえ、やはりナチュラルな声質にするのは難しいので、適用できる状況は限られるかと思います。

ローファイ系のロックで、ある程度いびつな歌声が許容される曲調であれば、試してみてもよいでしょう。

6.歌声の強さを変えたい

歌声合成・生成ソフトや歌声音源によって事情は異なってきますが、

例えば、高音だと弱く、低音だと強くなる場合、以下のようなアプローチが可能です。

  • 強くしたい場合は、キーを下げて出力したものをピッチ補正(上げる)
  • 弱くしたい場合は、キーを上げて出力したものをピッチ補正(下げる)

ただし、キーを大きく変更すると、その分ピッチ補正幅も大きくなり、声の違和感も大きくなりがちなので、あまり極端な変更は行わない方がよいでしょう。

また、ピッチ補正によって、声のエッジ感変わってくるので、

エッジ感保ちたい場合は、

  • エッジ部分はピッチ補正対象外とする
  • ピッチ補正前のエッジ部分を要所で切り貼りする
といったアプローチも有効です。

なお、歌声生成AIのNEUTRINOの場合は、高めのキー、あるいは低めのキーにおける歌い方でオーディオ出力可能な「StyleShift機能」もあるので、こちらも試してみる価値はあるでしょう。