以前、9月に正式リリースされると記事で紹介していたテクノスピーチのAI歌声合成ソフト、VoiSona(ボイソナ)が9月1日に正式リリースとなりました。WindowsおよびMacで動作するソフトであり、スタンドアロンで利用できるとともに、各種DAWのプラグインとしても使えるソフト。これまでβ版として公開されていましたが、今回正式版となり、機能もβ版からさらに進化しています。ソフト自体は無償で利用でき、標準ボイスライブラリである「知声(ちせい)」も無償で利用可能です。
また以前からアナウンスされていた「さとうささら」の追加ボイスライブラリがこのタイミングで発売となり、「CeVIO AIさとうささらソングボイス」を購入済みのユーザーは、1年間無償で利用できる、というのも以前の発表通り。さらに、本日新たなニュースとして、このVoiSonaのソングボイスとして、ゴールデンボンバーの鬼龍院翔(@kiryuintw)さん、そしてSILENT SIRENのボーカル、すぅ(@sumiredooon)さんによるものが2022年内に発売されるとの発表がありました。つまり、これらのボイスライブラリを購読すれば、鬼龍院翔さんやすぅさんの歌声をDTMによって生成できるようになる、ということなのです。これはどういうことなのか、またいくらでこうした歌声の合成が可能になるのかなど、オンラインインタビューの形でテクノスピーチの代表取締役である大浦圭一郎さん、エンタメ事業部プロデューサーである塚田恵佑さんにお話を伺ってみました。
※2022.9.1追記
サーバー障害のため、記事内記載の「さとうささら」
※2022.9.2追記
サーバー障害がまだ続いており、「さとうささら」の公開は9月5日になる模様です(Tweet情報より)
※2022.9.5追記
本日正午、「さとうささら」が公開されました。
今年2月に「WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始」という記事で、また6月には「CeVIO Pro(仮)改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応」という記事で紹介していたVoiSonaが、いよいよ正式リリースとなりました。この正式リリース版では、さらに機能向上も図られているようなので、いろいろと伺ってみました。
--6月にβ版のVoiSonaがリリースされた直後に、正式版は9月リリースという発表をされていたので、9月末ギリギリでのリリースなのかな…と思っていたら9月1日だったんですね!
塚田:9月は後半に祝日が多く、10月はボカコレやM3がありますので、少しでもお使いいただける機会を増やせれば、と。以前にもお知らせしたとおりで、追加ボイスライブラリである「さとうささら」も同時発売という形になりました。VoiSona自体や、標準ボイスライブラリの知声は、これまで通り誰でも無料でお使いいただけます。さとうささらのほうは、1年間で税込み6,600円での提供となっているほか、短期でお使いになる場合は、月額プランも用意しており、税込み880円でご利用いただけます。なお、「CeVIO AIさとうささらソングボイス」のユーザーのみなさまは、専用Webページにてアクティベート済みシリアルナンバーを入力してクレジットカードを登録することで1年間、無償でご利用いただくことが可能となります。このシリアルナンバーの入力期限は2023年8月31日となっており、入力した日から1年間ご利用いただけます。ちなみに、CeVIO AIさとうささらの歌声と、VoiSonaのさとうささらの歌声はビットパーフェクトではないものの、基本的に同じものとなります。
大浦:知声では書き出し=エクスポート時にPrototype Aという名称の波形ジェネレータが利用できるようになっており、デフォルトの波形ジェネレータとは少し違ったニュアンスの出力が可能になっていますが、これは当面、知声だけのトライなので、さとうささらには適用されません。VoiSonaさとうささらはCeVIO AIと同じ音が出ることを目的としてポーティングしておりますので、Windows環境のみのCeVIO AIさとうささらと同じ音がMacでも出せるようになったとお考えください。
--これまでCeVIO AIで作ってきたデータをVoiSonaにインポートすることはできますか?
大浦:はい。ファイルメニューのインポートからCCS/CCSTを選ぶことにより、インポート可能となっています。なお、β版のときは、まだ対応していなかったCeVIO AIの記号がありましたが、今回インポート、エクスポートともに、そうした記号に対応するようになったので、より互換性が向上しています。
--以前のインタビューの際、VSTi、AudioUnitsに加え、ARA2への対応も…という話がでていましたが、ここはどうなりましたか?
大浦:実は、ここがやや難しいところなのですが…。もともとVSTiやAUはDAWからプラグインをコントロールできるけれど、プラグインからDAWを動かす機能が実装されていません。とくにトランスポート関係、つまりVoiSonaのプレイボタンを押したら、DAW側もそれに連動して動き、VoiSonaの再生位置を動かしたらDAW側の再生位置も追従するようにしたかったのですが、VSTiやAUでは規格上それができないため、ARA2ならそれが実現できるのでは…ということで実装してみたのです。ただ、ARA2の定義がハッキリしていないようで、DAWによって仕様がマチマチなのです。そもそもARA2はオーディオトラックを操作するために作られた仕様だと思いますが、VoiSonaはインストゥルメントトラックに紐づくものなので、ARA2の正しい使い方ではないのかもしれません。その結果、DAWによって挙動が異なります。
※その話を伺って、私が主要DAWを片っ端から動かして動作チェックしてみたのが下記の表です。〇は普通にプラグインとして使えるもの、◎はVoiSonaのプレイボタンを押すとDAW側がそれに連動して再生され、VoiSonaの再生位置を動かしたらDAW側の再生位置も追従するものです。これを見ても分かる通り、どのDAWでも問題なく動作しますが、VoiSonaのトランスポート操作でDAWを動かせるのはReaperとStudio OneのWindows版のみ、ということのようでした。なおReaperのMac版ではVSTiを使った場合のみ◎で、AUを使った場合は〇という状況でした。
Windows | macOS | |
Ability Pro 4 | 〇 | - |
Ableton Live 11 Suite | 〇 | 〇 |
Bitwig Studio 4 | 〇 | 〇 |
Cubase Pro 12 | 〇 | 〇 |
Digital Performer 11 | 〇 | 〇 |
FL Studio 20 | 〇 | 〇 |
Logic Pro X 10.7 | - | 〇 |
Music Maker 2022 | 〇 | - |
Reaper v6 | ◎ | ◎ |
Studio One Professional 5 | ◎ | 〇 |
--そのほかにもβ版から正式版へのタイミングで追加されたり、強化された機能はありますか?
大浦:いろいろと強化していますが、一つ大きいのがビブラートのUIです。これまでビブラートの振幅を描くことができるタブと細かさ=周波数を描くことができるタブにわかれていましたが、このタイプのインターフェースに慣れていない方からわかりにくいという声がありました。そこで今回、2つを統合する形でビブラートのブロックを作ることができるようにするとともに、それを移動したり、範囲を広げたり、上下幅を調整することで振幅を変えることができるようにしたのです。
--言葉だとなかなか伝わりにくいですが、これ、メチャメチャ分かりやすくて便利ですね。従来あった、数多くのビブラートを調整するソフトの中で最高に扱いやすいと思います。
大浦:ありがとうございます。実はこの方式、7年前に特許を出願していて、ずっと実装したいと思っていたのです。それを今回ようやく実現することができました。とはいえ、中にはこれまでのものに慣れているので、従来のUIを使いたいという方もいらっしゃると思います。そのため、VIBタブ内においてデフォルトのSimplifiedモードであれば、この新しいモード、Detailedを選択すれば、従来のモードに切り替わるようになっています。
--そのほかにも、新機能などはありますか?
大浦:ショートカットにトランスポートを追加しています。普通スペースバーを押すとDAWの再生がスタートして、それに応じてVoiSonaも動きますが、VoiSonaだけを再生し、DAW側を動かさないためには、VoiSona内のプレイボタンを押す必要があります。また先ほどお話したとおり、ReaperやWindows版のStudio OneではVoiSonaの再生ボタンを押すとDAW側も同期するようになっています。それに対し、このショートカットでは、VoiSonaだけを動かすことができるようになっているのです。そのほか基準ピッチを調整できるようにしたのも、この正式版からです。これによって標準の440Hzだけでなく、441Hzとか442Hzといったチューニングで歌わせることが可能になっています。
--そして、今回驚いたのは、やはり鬼龍院翔さんやすぅさんの歌声の発表です。これまで歌声合成というと、声優さんがキャラクタを演じる形が多かったと思います。
塚田:以前にも少しお話をしたことがありましたが、音声合成の性能向上により、いずれ声の主である演者さんの声との区別がつかなくなったときに、音声合成が演者さんの敵になるのではなく、分身となって仕事をしてくれる相棒となるのが理想だと考えています。そうしたコンセプトや、VoiSonaで広がる創作の可能性について、鬼龍院翔さん、そしてすぅさんにお伝えしたところ、賛同をいただくことができ、今回発表させていただくことになりました。お二人のソングライブラリについては現在制作にはいったところで、年内をメドにリリースできればと思っています。
--金額的にはどうなるのでしょうか?また、鬼龍院翔さんやすぅさんの声で作成したボーカルを、商用で利用することは可能なのですか?
塚田:両ボイスライブラリとも、価格はさとうささらと同様、いずれも年額6,600円(税込)/月額880円(税込)で、これは合成音声波形利用料を含むという位置づけです。そのため、一部例外項目はございますが、基本的にはユーザーの皆様に個人利用、商用利用を問わず、また弊社へ個別の許諾申請などなしに合成音声波形をご活用頂けるようになっております。そして、この売上金額の一部が演者さんにフィードバックされる仕組みになっています。
--これまでになかった新しいビジネスモデルですよね。従来の歌声合成だと、製品開発時の収録代として演者に支払われていたと思いますが、そのキャラクタが大ヒットしたとしても、追加で支払われることはなかった。それが変わる、と。今後もラインナップは増えていくのでしょうか?
塚田:前回インタビューでも触れさせて頂いた通り、知声の英語版をリリースする予定です。また、さとうささらに続く、CeVIO AIのボイスライブラリのクロスプラットフォーム化も企画しているところです。そしてもちろん、鬼龍院翔さん、すぅさんに続くVoiSonaオリジナルのボイスライブラリについても、すでにいくつか着手しているので、ぜひ期待していてください。
--これまで歌声合成というとVOCALOIDで培われてきた文化が土壌となっていたと思いますが、著名シンガーの歌声がDTMで合成できるとなると、まったく新しい時代に入りそうで楽しみです。一方で、VoiSona自体の機能強化、性能強化という予定もあるのですか?
大浦:今回ARA2の仕組みを利用して、VoiSona側からDAWを動かせないかチャレンジしてみましたが、まだ一部のDAWでしか対応できていないので、ここはなんとかしていきたいところです。一方、現在はVSTiとAUの2つのプラグインプラットフォームですが、今後AAXへの対応もしたいと思っています。さらに、今後の展望として、VoiSonaの機能拡張をするプラグインのプラグインのようなこともできれば、と。
--プラグインのプラグインとは、どういうことですか?
大浦:VoiSona専用のプラグインのようなものを出せれば、と思っています。スクリプトなどを使って内部の機能を簡単に動かせるようにする仕組みができれば、と。たとえば、そのプラグインというかスクリプトを利用すれば、ケロるようにするとか、音痴になるとか……。VoiSonaは、より人に近い声を実現できるよう目指してきていますが、やはりケロケロボイスを出したいというニーズも一定数あるのも事実です。そうしたニーズに対し、こうした拡張機能を使い、スライダーを動かすだけで半自動的にケロケロボイスを出せるようになれば、喜ぶ方もいるのでは、と考えています。
--いろいろ楽しみなことがいっぱいですね。ぜひ、今後の展開に期待しております。
※2022.9.5追記
記事冒頭でも追記しておりましたが、追加ボイスライブラリ「さとうささら」が9月5日12:00に提供開始されました。
【関連情報】
VoiSona公式サイト
追加ボイスライブラリ「さとうささら」販売開始!(テクノスピーチ情報)
VoiSona公式Twitter @VoiSonaOfficial
【DTMステーションPlus!情報】
2022年9月13日 20:30~22:30
ゲスト:大浦圭一郎さん、塚田恵佑さん
ニコニコ生放送:https://live.nicovideo.jp/watch/lv338321013
YouTube Live :https://youtu.be/IcgFUEFrDzk