>VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム
それによれば、VocaListenerは次の「VocaListener-front-end」「VocaListener-plus」「VocaListener-core」という技術によって構成されているようだ。
VocaListener-core
合成歌唱を目標歌唱(入力) へ近づけるコア技術
歌声分析、歌声合成、歌声合成パラメータの更新
VocaListener-plus
目標歌唱自体を編集する技術
音高変更機能、歌唱スタイル変更機能
VocaListener-front-end
それぞれで必要な要素技術
形態素解析、Viterbiアラインメント、音高推定、ビブラート検出
イマイチよくわからない…。そこで、先日公開されたMikuMikuVoiceと比較してみた。斜め読みしただけだが、次のようになるかと思われ(違っていたらご指摘よろすく)。つまり、MikuMikuVoiceを入り口として、それを強力に自動化し、より自然に聴こえるように最適化できるシステムって感じではなかろうか。興味ある人は、舐めつくすように読んでみると、おもしろいかもさ。
| 項目 | MikuMikuVoice | VocaListener |
| 元データ | WAVデータ | WAVデータ |
| 歌詞入力 | 発音を1つずつ入力 | 形態素解析で文章から自動入力 |
| 発音とWAVの対応付け | 手作業 | 開始と終端を自動解析 |
| MIDIへの変換 | 1パス | 推定を繰り返して強力に最適化 |

追記
本件について「CloseBox and OpenPod」さんが技術的に突っ込んだ考察をしているので行ってみて。
>CloseBox and OpenPod「「ぼかりす」で知った、プロとアマの違い」
追記
「すっぴん調教」の提唱者である「初音ミクに挑戦してみる。」さんが、もっと詳細に、VocaListener(ぼかりす)とMikuMikuVocieを比較しているので、興味ある人は行ってみて。
>初音ミクに挑戦してみる。「ぼかりすとMikuMikuVoice」
関連ページ
>出た!科学の限界を超えた新技術「VocaListener」による神調教ミク!
>キタ!VocaListenerの開発者が自身のWebサイトでメッセージ!





































































