歌声合成ソフトの代名詞的存在がヤマハのVOCALOIDですが、それとはまったく異なる技術で誕生したのが、DTMステーションでも何度か紹介してきたCeVIO(チェビオ)です。名古屋工業大学が開発した技術をベースに出来上がったソフトであり、歌声(ソング)と同時に喋り(トーク)もできるというのがユニークなところですが、2013年9月に登場して以来、歌声のキャラクタが「さとうささら」の一人だけで選択肢がほかにないとう状況が続いていました。
そこに先日、カラオケのJOYSOUNDを展開するエクシングが、「Color Voice Series」というシリーズ名で新たな歌声を製品化してきたのです。VOCALOIDでいうところの歌声ライブラリをCeVIOではソングボイスと呼んでいるのですが、その歌声を聴いてみると、VOCALOIDの歌声とはまったく雰囲気が異なります。力強い男性の声でロックを歌ったり、いかにもという年配女性の声で演歌を歌うなど、「コンピュータによる歌声合成って、こんなこともできるのか!」とちょっと驚くほどなんです。でも、なぜエクシングが歌声合成ソフトの世界に参入したのか、どうしてこんな歌い方ができるのでしょうか?エクシングでソングボイスの開発を行った石原圭悟さん、またエディタソフトであるCeVIO Creative Studioの開発を担当したブイシンクの川出陽一さんにお話を伺ってみました。
エクシングからCeVIO用のソングボイスとして「Color Voice Series」6製品が発表された
--まずは、なぜカラオケのJOYSOUNDの会社が歌声合成ソフトの世界に参入したのか、という素朴な疑問からお答えいただけますか?
石原:JOYSOUNDのカラオケのサービスの一つとして2013年秋から「ボーカルアシスト」という機能を搭載させていました。これはカラオケのガイドメロディーを歌ってくれるというもので、従来であればサックスなどで鳴らしていたものを歌で歌わせるというものです。男性ボイス、女性ボイスがありますが、ここに名古屋工業大学(以下、名工大)で開発したHMM音声合成の技術を使っていたというのが、キッカケです。
お話を伺ったエクシングの石原圭悟さん(左)、とブイシンクの川出陽一さん(右)
--2年前であれば、すでにVOCALOIDもありましたよね。
石原:以前からテクノスピーチ(名工大と連携して音声合成・音声認識に関連したシステムの研究開発する会社)とやり取りしていたというのもありますが、このHMMエンジンなら、カラオケのMIDIデータと歌詞、後は歌詞テロップの色塗り情報(歌詞において歌うところの色が変わっていく情報)を用いてタイミングを合わせるだけでできてしまう、つまり調教などの処理をせず、ベタ打ちだけで簡単にボーカルパートを自然な形で作れるというのがポイントでした。MIDIデータも歌詞データも膨大な数がありますから、ほぼ自動で変換するだけでいいというのは、当社にとって非常に大きなメリットでした。
--名工大ではSinsyなどで使っていた歌声のデータがすでにあったと思いますが、それを使ったのですか?
石原:名工大のものは、学術用に作られたものということで権利上の都合もあり、商用で用いるものは別途作る必要がありました。また、様々なカラオケ楽曲を歌わせるのに適した歌唱ボイスが必要とも思いましたので、オリジナルで男性の歌声と女性の歌声を作っています。CeVIOの話が持ち上がったのはその後だったので、「さとうささら」よりも先に作っていたんですよ。
もともとはカラオケのガイドメロディー用の歌声を作るためにHMMエンジンを採用したという石原さん
--そうした経緯、ノウハウがあったから、今回6種類ものソングボイスを発売することになったわけなんですね!
石原:その通りです。せっかくノウハウも溜まったので製品化を…ということになったのですが、すでにVOCALOIDで素晴らしい歌声ライブラリがたくさんあり、大きな世界が出来上がっています。そのVOCALOIDの世界は、可愛い女の子、アイドル的なキャラクタで広く知られているので、それとは違うものにしようと考えました。すでに発売している「赤咲 湊(あかさきみなと)」はロック、ポップス、ダンスなどを得意とした力強い歌い方をする男性キャラクタで、「緑咲 香澄(みどりざきかすみ)」はバラード、ジャズ、キッズソングなどが歌える、歌のお姉さん的なキャラクタとしています。まずは、ぜひその歌声を聴いてみてください。BGMなしで、歌声だけを聴くと、その特徴がより分かりやすいと思います。
--すごくリアリティーのある歌い方ですね。VOCALOIDとは明らかに違った雰囲気です。「さとうささら」はアイドル的キャラクタでVOCALOIDと少しぶつかる印象を持ちましたが、これらはだいぶ方向性の違う商品になりそうですね。
石原:そうですね、さらに3月19日に発売する「銀咲 大和(ぎんさきやまと)」は50代のお酒好きなダンディーなおじさんをイメージしたキャラクタで、演歌、歌謡曲、フォークなどに向けた歌声にしています。また、「金咲 小春(きんざきこはる)」は気品溢れる大人の女性ということで、やはり同じ演歌、歌謡曲、フォークなどに向く音源になっています。
--なるほど、これは明らかにVOCALOIDとは棲み分けされた、違う用途が生まれてきそうですね。
石原:ぜひ、いろいろな使い方をしていただければと思っています。もちろん、VOCALOIDを使っているようなみなさんにも、並行して使っていただけると嬉しいですし、とにかく調教なしにベタ打ちで入力できますから、これからDTMをはじめたいという方にお勧めしたいです。さらに、プロのレコーディング現場などでの仮歌用などで活用していただけるようになるといいなと思っています。
--このソングボイスの制作、どのくらいの時間がかかるものなのですか?
石原:ソングボイスを制作するにあたっては、まず声の元となる方にたくさんの歌をうたってもらい、それらを楽譜にしていくという作業があります。さらに波形データと整合性の取れているデータをテクノスピーチに送り、チューニングを行う……という一連の制作工程があるため、最初は半年以上の時間がかかりました。ただ、最近はだいぶ慣れてきたこともあり、効率も上がり4か月程度でできていますね。
--実際、中の人の歌声と、CeVIOでの歌声を比較して、どうなんでしょう?
石原:収録時の歌唱をとても良く再現されていると思います。銀咲さんにおいては、「あれ?本人か?」と思うほどの再現力で、波形のチェックをしている際に、オリジナルの歌声データを持ってきてしまったかと思ったほどです。赤咲君に関しては、レコーディング時に「声を張り上げて、ダミ声で歌ってください!」「ビブラートにしないようにできるだけ単調に!」なんて指示を出していたら、その通りの歌声になっちゃったんです。社内では「ジャイアン」なんて呼んでたんですけどね……。これでは、楽曲に乗せたときにあまりにも単調でつまらないものになってしまうため、チューニングを行なった結果、このような製品になりました。
--CeVIOの場合、ソングとトークという2つが使い分けられるので、今回発売されたキャラクタのトーク版も期待したいところですが……。
川出:確かにソフト上はソングとトークが同じように使えるようにしていますが、仕組み上はだいぶ異なるし、ボイスの制作手法も大きく違うんですよ。
石原::トークを作る場合には、たくさんの原稿を読み上げてもらい、それをデータ化していく必要があるんです。今回当社で作ったソングボイスの中の人たちは、みなさん歌手であり、声優ではないため、原稿の読み上げは少しハードルが高いんですよ。歌であれば、「同じ雰囲気で歌って」という要望に対して忠実に応えてくれますが、原稿を読む上で、同じスピード、同じトーン、同じ雰囲気で読むのは、やはりそれなりの訓練を受けた人でないと難しい為、今回まずはソングボイスからという事になりました。いずれはトークについても考えていきたいですね。
CeVIO Creative StudioのUIの開発を行ったブイシンクの川出さん
--ところで、このCeVIOでソングボイスの変更というのはどうすればいいのでしょうか?いろいろとVOCALOIDと流儀が異なるので、慣れないと難しいなぁ…と。
川出:CeVIOのUIは私が担当しているのですが、歌手の変更はトラックの先頭の「C」ボタンを押すか、キーボードショートカット「C」キーで切り替えが可能です。もっともエクシングさんのシリーズが出るまでは「さとうささら」しか存在しなかったので、切り替えそのものが不要だったわけですが…。赤咲緑咲のテスト中、初めて触れる人から切り替え方が分からないという声をいただいていたので、トップメニューや右クリックメニューの「トラックのキャスト」からも変更できるように改良しています。
トラック上で右クリックして出てくるメニューでも歌手の変更が可能
--流儀の違いという意味では、音符と歌詞の関係もVOCALOIDとはずいぶん違いますよね。
川出:HMMエンジンの仕様を画面に再現する結果、流儀や作法に違いは出ます。たとえば、1つの音符に複数の文字を入れられることも、ユーザーの皆様になかなか伝わっていないようです。4分音符に2文字入れようとして、8分音符2つにしてしまうと、それは4分音符の音ではなく、8分音符2つという歌い方になってしまうんです。CeVIOでは、最初は譜面通りの入力をしてみてください。そうすれば、何の調整なしでも意外と自然に歌ってくれるはずですよ。また先日、CeVIOサイトでも公開したのですが、これまで発表していなかったコマンドがあるんですよ。
「歌のお姉さん」という雰囲気でバラードもギッズソングもきれいに歌える緑咲香澄
--え?どんな隠しコマンドがあったんですか?
川出:隠していたというつもりはなかったのですが、全角で「’」(アポストロフィ)を入れると、そのひとつ前のカナの母音が脱落して子音だけの発音になります。たとえば、歌詞に「いぇす」と入力すると「yesu」と、最後の「す」をはっきり発声しますが、「いぇす’」と入力すると母音「u」が脱落して「yes」と、より自然な発声になります。
--それは、英語の発音をさせる上で、かなり大きな効果を発揮してくれそうですね。VOCALOIDユーザーにとっては、この流儀の違いに戸惑いそうですが、逆に初めてのユーザーなら譜面通りという意味で扱いやすいのかもしれませんね。あとは、もっとソングボイスが充実してくれるといいですね。
石原:4月23日にも、第3弾としてバラード、ジャズ、アンビエントなどを得意とする「白咲 優大(しらさきゆうだい)」、ポップス、R&B、ダンスなどが歌える「黄咲 愛里(きざきあいり)」というキャラクタの発売を予定しています。これらを利用いただくことで、さらに歌えるジャンルの幅も大きく広がると思いますので、ぜひご期待ください。
--ありがとうございました。
Color Voice Seriesシリーズ紹介ビデオ
【関連情報】
Color Voice Series製品情報
CeVIO Creative Studio製品情報
母音の脱落記号の情報(CeVIOサイト)
【ダウンロード】
「赤咲 湊」ソングボイス単体 4,320円
「緑咲 香澄」ソングボイス単体 4,320円
「赤咲 湊」+「緑咲 香澄」ソングボイスデュエットパック 7,560円
CeVIO Creative Studio 12,960円