VOCALOIDを筆頭に、フリーウェアで数多くのライブラリが揃うUTAU、名古屋工業大学が開発したSinsyなど、音声合成によって歌ってくれるソフトウェアはいろいろ出てきています。そうした中、先日からちょっと試してみたいと思っていたものがあります。それが、FL STUDIOに搭載されているSpeech Synthsizerというもの。
というのも昨年「ボカロユーザーの使用率が高い!? FL STUDIO」という記事を書いた際にもちょっと触れたとおり、あのOtomaniaさん(あのネギを振るIevan Polkkaを作成した、初音ミクブームの火付け役ともいえる方)が、VOCALOID以前にSpeech Synthsizerで歌わせて遊んでいたという話を聞いていたので、気になっていたからです。
FL STUDIOのSpeech Synthsizerで日本語を歌わせることに挑戦!
そのSpeech Synthsizer、私自身もだいぶ以前から何度か触ったことはあったので、もちろん知ってはいました。これは、TTS=Text to Speechというタイプのシステムであり、文字を入力すると言葉をしゃべってくれるというもの。そのため、VOCALOIDというよりもVOICEROIDに近いシステムですね。
英語を入力すると音声に変換してくれるSpeech Synthseizer
しかもVOICEROIDと違って日本語対応ではなく、完全に英語のシステムだから、ひらがなを受け付けてくれず、英語入力なんです。また10年近く前からある古いシステムだけに、声はVOCALOIDやVOICEROIDのように、滑らかな人間の声ではなく、かなり機械的、ロボット的な音声。そのため、わざとこうした歌声の楽曲を作るのに利用するというのも面白そうに思います。一応、声質は男性、女性、ロボット、子供、虫?……といろいろな種類が用意されています。
Speech Synthsizerではいろいろな声を選択できる
Synthsizerという名が付いていることからも想像できるとおり、単なるTTSではなく、ちょっとシンセサイザ的な機構も持っており、歌わせることが可能になっているのがポイント。VOCALOIDやUTAUなどの使い方からすると、かなり原始的な操作手順ではありますが、まずは以下のビデオを見てみてください。
簡単に解説すると、まずは英語をしゃべらせています。文章としてのイントネーションは、ちょっと変ですが、単語で見るとキレイな発音ですよね。これをいくつかの声質でしゃべらせていますが、ここでは「Child」というものを選択してみました。
今回の目的は英語ではなく、日本語で歌わせるということ。ここでは「春の小川」を歌わせようと思い、冒頭の2小節をローマ字で「harunoogawawa」とベタ打ちしてみました。が、どう考えても変。そこで1文字1文字区切って「ha ru no o ga wa wa」としたものの、これでも、まともに聴こえません。
実はそこからホントにいろいろと試行錯誤をした結果、少し見えてきました。この入力文字を理解するのは日本人ではなく、英語圏の人(コンピュータ)。だから例えば「い」を「i」と入力しても、「アイ」と読んでしまうので「e」と入力すると「イー」と読んでくれる。また「ア」を「a」とだけ入れると「アッ」という感じで非常に短いので「ah」と入力するなど……。ただ「ん」をどう入力すればいいか分からないなど(「n」だと「エヌ」と読み、「nn」だと「エヌエヌ」となってしまう)、50音すべてが解明できたわけではないのですが……。
さらに「Style」の設定を、「Normal」から「Sing」にすると、しゃべる感じから歌う感じになり、イントネーションが少し消えてくれます。またパラメータを見ると、Rate、Pitchというのがあるので、これをいじるとテンポやピッチが変わってくれます。
ただ、これだけだと、ずっと一定の音程となってしまいます。そこで調べてみると単語の後ろにカッコ書きで数字を指定すると、音程が付いてくれることが判明。(1)なら半音上がり、(-2)なら1音下がるといった具合です。そこで、これを振り、
hah(4) ah(7) ru(9) no(7) oh(4) gah(7) wah(12) wah(12)
と入力した結果、そこそこ歌ってくれました。
変換するとオーディオデータになりサンプラーに読み込まれる
実は、Speech Synthsizerで入力を終え、「Accept」ボタンを押すと、すぐにこれがオーディオデータに変換されます。FL STUDIO上では生成されたオーディオはサンプラーとして扱われるため、自在にフィルターで加工したり、エンベロープをいじるなどシンセサイザとして遊ぶことができます。ただ、ここではとくにいじらないまま作業を進めますが、やろうと思えば、シンセとしていくらでも音をいじれるし、調教もかなりできそうではありますね。
さて、ここでピアノロールを開くと、入力した文字が順番に鍵盤に割り振られており、順に鳴らすことで歌っています。そう音程で並んでいるわけではないのがミソ。しかし、よく見ると、発音のタイミングが音符のタイミングとズレています。
ピアノロールで文字の順番に並んでいるがタイミングがズレている
そこで、改めて1音ずつ入力しなおすと、今度はテンポピッタリで歌ってくれるようになりました。ただ「が」=「gae」など頭が「g」だと発音が遅れるようなので、ちょっと突っ込み気味に音符を置くと多少まともになるなど、やはり試行錯誤ではありましたが。
このようにして、なんとか冒頭8小節分を作った結果が以下のビデオです。明らかに外人が日本語を歌ってるという感じなのが面白いところですが、いかがでしょうか?
今更ながらFL STUDIOにハマってしまった感じですが、また何か面白いネタがあったら、紹介してみようと思っています。
【関連記事】
FL STUDIOのデモ版の気前がよすぎる!
【関連サイト】
FL STUDIO製品情報(フックアップ)
IMAGE-LINEサイト
FL STUDIOデモ版ダウンロードページ
FL STUDIOチュートリアルビデオ
【価格チェック】
●パッケージ
◎Rock oN ⇒ FL Studio 20 Singature クロスグレード
◎Amazon ⇒ FL Studio 20 Singature クロスグレード
◎サウンドハウス ⇒ FL Studio 20 Singature クロスグレード
◎Rock oN ⇒ FL Studio 20 Singature
◎Amazon ⇒ FL Studio 20 Singature
◎サウンドハウス ⇒ FL Studio 20 Singature
◎Rock oN ⇒ FL Studio 20 Producer
◎Amazon ⇒ FL Studio 20 Producer
◎サウンドハウス ⇒ FL Studio 20 Producer
●ダウンロード
◎beatcloud.jp ⇒ FL Studio 20 All Plugins Bundle
◎beatcloud.jp ⇒ FL Studio 20 Signature Bundle
◎beatcloud.jp ⇒ FL Studio 20 Producer Edition
◎beatcloud.jp ⇒ FL Studio 20 Fruity Edition