10月19日、ヤマハから待ちに待ったVocaListener(ぼかりす)のダウンロード販売がスタートします。「ぼかりす」とはVOCALOIDをより人間らいしい歌い方にさせるためのソフトであり、究極の調教ツールともいうべきもの。
非常にユニークなツールであるだけに、どうやって使い、何ができるのか理解しにくいのも事実です。そこで「青いコンビニであいましょう」などで有名なミュージシャン、エハミックさんに協力をお願いし、「ぼかりす」での実演を行い、使用前・使用後のビデオなどを作製してました。これを利用しながら、「ぼかりす」とはどんなツールなのかを紹介していきましょう。
まず、「ぼかりす」について簡単に紹介すると、これは産業技術総合研究所(産総研)が開発したソフトで、人間の歌声を解析し、そこから音量の変化やピッチの変化を検出してVOCALOID用のパラメータに変換するというツールです。それをヤマハがVOCALOID3 Editor用のJobプラグインとして作り直し、今回ダウンロード形式での販売がスタートしたものです。
ご存知のとおり、VOCALOIDでノートと歌詞だけを入力するベタ打ちの場合、抑揚の少ない歌声になります。もちろん、「それがいい」という人が多いのも事実ですが、「ぼかりす」を利用することによって、かなりリアルな人間っぽい歌声に仕立て上げることができるのです。
まずは「ぼかりす」を使わず、VOCALOID3 Editorを使ってベタ打ちした曲を聴いてみてください。
この曲はエハミックさんが近くリリースする予定のCDのアルバムの中から、今回の記事用に素材提供してくれた「THAT RECORD」という曲。歌声ライブラリにはヤマハのVY1V3を使っています。おそらくみなさん想像通りのVOCALOIDの歌声だと思います。
では、ここから「ぼかりす」を使った楽曲制作の手順を紹介していくのですが、実際に「ぼかりす」を起動する前に、準備が必要になります。それは、予め人の歌声をレコーディングしておくこと。そして、このレコーディングではテンポが非常に重要になるので、メトロノームやカラオケなどを聴きながらのレコーディングが必要になります。そのため、レコーディングにおいては、そうしたことができるDAW(Digital Audio Workstation)の利用が必須となるのです。
「ぼかりす」を使う前にまず人によるボーカルをレコーディングする必要がある
今回、そのボーカルレコーディングにはエハミックさんの友人の石橋みはるさんに協力を依頼し、エハミックさんの自宅で録音しています。その収録のビデオを見ていただければ、雰囲気がよくわかると思います。
「実は、このボーカルレコーディングは1発で録っているわけではないんです。数回に分けてレコーディングしたものをつなぎ合わせて作っています」(エハミックさん)というように、「ぼかりす」を使用する場合、できるだけしっかりとしたボーカルデータを作成しておくのが大切です。一旦「ぼかりす」でパラメータ生成した後、VOCALOID3 Editor上でエディットすることも不可能ではありませんが、非常に煩雑な作業になるため、できる限り、レコーディングおよびDAW上でのエディットでキレイなボーカルデータを作成しておきます。
DAWでレコーディング、編集する際、音量が大きくなり過ぎないのもポイント
なお、この際、ボーカルの音量は目一杯にせず、やや小さめにし、MAXが-6dB程度になるように調整するのがコツ。そのために微妙にコンプレッサを掛けるのも手ですが、あまり音を潰しすぎると悪影響を与えるので、ここでも注意が必要です。
準備ができたら、いよいよ「ぼかりす」の起動です。「ぼかりす」はVOCALOID3 EditorのJobプラグインなので、VOCALOID3 Editorのメニューから起動しますが、この際、VOCALOID3側で、先ほどのようなベタ打ちの曲を用意しておく必要はありません。テンポの設定だけは必要ですが、それ以外、何もデータの入っていない空の状態から立ち上げます。
これが「ぼかりす」の画面です。ピアノロール風な画面であり、一見VOCALOID3 Editorとも似たユーザーインターフェイスになっているわけですが、この「ぼかりす」に先ほどレコーディングしておいたボーカルをWAVデータとして読み込ませます。するとしばらく解析が行われたあと、画面には波形が表示されます。ピアノロール部をよく見てみると、揺れた波形ではありますが、メロディーどおりに表示されていることが確認できると思います。
次に行うのが歌詞の流し込みです。通常VOCALOIDではVOCALOID3 Editor上で歌詞を入力していくわけですが、「ぼかりす」を利用する場合は、「ぼかりす」側で入力していくのです。
一気に1曲分の歌詞を入力することも不可能ではないのですが、やはりここはソフトウェアで処理するシステム。文字の区切りがどこであるのか、ソフト側で完全に把握するのは難しいので、1小節程度ずつ入力し、うまく行っているかを確認しながら進めていくのが効率的です。
文字と合わせた際のノートの長さがおかしい場合は、マウスを使ってドラッグすることで調整可能です。また、検出した結果の音程がおかしいケースもありますが、これについては一旦保留しておきましょう。というのは画面上の音程は譜面と違っていても、ピッチのパラメータで本来の音程と合うような調整がされているからです。
このように文字を入力する度に、「ぼかりす」が解析のための演算をするため、数秒~数十秒待たせれますが、これはマシンパワー次第ですので、ちょっと我慢です。このように入力していくと、画面上部には、「分析元歌唱」と「合成結果」という2つの波形が表示されていることに気づくでしょう。「分析元歌唱」とは、先ほどレコーディングした人のボーカル。そして、「合成結果」とはそれを分析した結果をVOCALOID用のパラメータに当てはめて歌わせたVOCALOIDによる歌声なのです。
デフォルトでは両方が同時に聴こえますが、「M」(ミュート)、「S」(ソロ)ボタンを利用して切り替えて聴いてみると、その違いがハッキリと確認できるはずです。では、その合成結果がどうなっているかを聴いてみてください。
どうですか?ベタ打ちのVY1V3とはまったく異なる、非常に人間っぽい歌になっていることが確認できたと思います。これが「ぼかりす」による合成結果なのです。「ぼかりす」側の作業が一通り終わったら、合成結果のパラメータをVOCALOID3 Editorへと書き出して「ぼかりす」を終了させます。
VOCALOID3 Editor側でDYNパラメータとPITパラメータを見てみると、明らかに人の技では描けないような波形が表示されているのが確認できます。この状態は完全にVOCALOID3 Editor上のデータであり、これを歌わせるのに「ぼかりす」は不要。もちろん、VSQXファイルで書き出したものを、他の人のVOCALOID3 Editorで読み込んでも同じように歌ってくれます。
最後に、エハミックさんが予め作っていたバッキングパートをVOCALOID3 EditorのWAV(STEREO)トラックに読み込んで再生させてみました(イントロ部分などがあるので、小節位置は調整しています)。
これで「ぼかりす」を使った歌声制作は完了です。いかがだったでしょうか?エハミックさんにも、今回「ぼかりす」を使った感想を聞いてみたところ、「ぼかりすがVOCALOIDによるボーカルデータを生成する上で非常に強力なツールであることを実感しました。譜面が読めない人やピアノロールが扱えない人も、歌うことができれば誰でもボーカルデータを作ることができるので、ぜひ歌い手さんを始め、さまざまな方がこれを機にVOCALOIDに触ってくれたら、と思います。この曲のCDリリースに向け、
ちなみに、歌声ライブラリを切り替える場合は、VOCALOID3 Editor側で予め歌手を変更しておき、改めて「ぼかりす」を起動。ここで保存しておいた「ぼかりす」のデータを読み込めば簡単に反映させることが可能です。
(※VSQXファイル化したデータを別の歌声ライブラリに切り替えると、正しい結果にならないので注意が必要です)
以上のとおり、DAWを使ってボーカルをレコーディングする必要があること、「ぼかりす」上でタイミングが合うように歌詞を流し込んでいくことなど、確かにある程度のテクニックは必要ではあります。でも、これによって従来のVOCALOID単体では不可能だった人間らしい歌声を生成することができるというのは、VOCALOID史における大革命といってもいいのではないでしょうか?ぜひ、今後多くの「ぼかりす」作品が登場してくれることを楽しみにしています。
【関連記事】
AV Watch DAL~第522回:人の歌声をボカロが真似る「ぼかりす」ついに発売
【関連情報】
ぼかりすダウンロード販売サイト(VOCALOID STORE)
VOCALOID3 Job Plugin VocaListener製品情報
VocaListener(ぼかりす): ユーザ歌唱の歌い方を真似る歌声合成パラメータを自動推定するシステム