タレこみ人情報
“Think-Tank on the Future of Music Search, Access and Consumption”というPDF(http://www.ifs.tuwien.ac.at/mir/pub/Chorus+_MusicThinkTank-Report_TheFutureOfMusicSearchAccessAndConsumption_final.pdf)。
今しがた発見したてで現在当方も慣れないこの英語論文を読み込んでいる最中ですが、どうやら海外の音楽系シンクタンクの論文(識者へのインタビュー記事?)で以前ヤマハに所属してボーカロイドに関する特許を2つ(日本とアメリカで)所有している(とこの論文の27ページに解説がある)Oscar Celma(オスカー・セルマと読むのだろうか?)氏が他の識者とともに未来の音楽市場などについて予測する内容のPDFを発見。例えば・・・
5.5.4 Are there special markets for new tevhnologiers ? (19ページ目)
5.5.4 The future of music creation ? (20ページ目)
本文には"VOCALOID"の文字は出てきませんが、消費者が音楽にどうかかわっていくかについてちらほら触れられています。
なお「論文」というより内容は関係識者へのシンクタンクからの質問に答えたインタビュー集と言う方が妥当な内容かもしれません。
さらにThink-Tank on the Future of Music Search, Access and Consumptionというキーワードで調べていくと、"D-Lib Magazine In Brief and In the News"(http://www.dlib.org/dlib/march11/03inbrief.html)からさらに"CHORUS+ Network of Audio-Visual Media Search"(http://avmediasearch.eu/)というブログへ辿ると、おお、オープニングページに"Masataka Goto"(産総研の後藤真孝氏と同一人物と思われる)の名前と写真が浮き出る!
>CrunchBase「Oscar Celma」
▽
>j-tokkyo「特開2003-323188」
【発明の名称】 歌唱合成方法、歌唱合成装置及び歌唱合成用プログラム
【発明者】 【氏名】嘉山 啓【氏名】オスカー セルマ【氏名】シャウメ オルトラ
【課題】自然性の高い歌唱音声を合成する。
【解決手段】音韻情報、音高(ピッチ)情報、時刻情報等を含む演奏データを入力し、この演奏データを、歌唱合成データベースに基づき、歌唱合成エンジンが理解可能な形式のデータ(歌唱合成スコア)に変換する。音韻の変化する時点の前後における音高の情報を取得し、この情報に基づき、音韻の変化する時点における音高変化曲線に傾きを加え、これにより出力される歌唱音声の自然性を高める。
【出願人】 【識別番号】000004075【氏名又は名称】ヤマハ株式会社
【出願日】 平成14年8月23日(2002.8.23)
【代理人】 【識別番号】100092820【弁理士】【氏名又は名称】
【公開番号】 特開2003-323188(P2003-323188A)
【公開日】 平成15年11月14日(2003.11.14)
【出願番号】 特願2002-244241(P2002-244241)
参考
>Wikipedia「VOCALOID」
>WIRED「植木 等」を蘇らせた「ウエキロイド」、その可能性」
>j-tokkyo「サイト内検索:劔持 秀紀」
>j-tokkyo「サイト内検索」
VOCALOIDがらみの特許については、「人生は是勉学の事」さんらが記事にしているので、メモ。ただし、上記オスカー・セルマ氏「特開2003-323188」については触れられていないもよう。
VOCALOIDの特許についての記事と対応特許1
>人生は是勉学の事「Smipsでの発表」
>「ソフトウエア製品の開発戦略~音楽製品の事例に於いて~(pdf)」(弁理士:綾木健一郎)
▽
>j-tokkyo「特開2002-202790」 (pdf)
【発明の名称】 歌唱合成装置
【発明者】 【氏名】劔持 秀紀【氏名】ザビエル セラ【氏名】ジョルディ ボナダ
【課題】高品質な歌声を合成する。
【解決手段】スペクトルモデル合成(SMS)分析合成法において、音素または2つ以上の音素連鎖についてSMS分析を行いデータベース10を作成し、合成時に必要な音素または音素連鎖のSMSデータを接続し合成することで歌声を得る。前記データベース10には、同じ音素あるいは音素連鎖につき、異なるピッチ、ダイナミクス、テンポごとに別個の素片データを記憶する。調和成分調整手段22、非調和成分調整手段23で、読み出した素片データの調和成分および非調和成分を目的のピッチに合うように調整し、継続時間調整手段24で目的のテンポに合うように音素または音素連鎖の長さを調整し、素片レベル調整手段25でレベル調整した後、各素片を接続し、所望のピッチに対応した調和成分を生成して、非調和成分と合成する。
【出願人】 【識別番号】000004075【氏名又は名称】ヤマハ株式会社
【出願日】 平成12年12月28日(2000.12.28)
【代理人】 【識別番号】100102635【弁理士】【氏名又は名称】
【公開番号】 特開2002-202790(P2002-202790A)
【公開日】 平成14年7月19日(2002.7.19)
【出願番号】 特願2000-401041(P2000-401041)
>j-tokkyo「特開2002-221978」 (pdf)
【発明の名称】 ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置
【発明者】 【氏名】劔持 秀紀
【課題】音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。
【解決手段】歌詞に対応した音節毎の発音タイミングデータを含むボーカルデータを予め記憶する。再生処理を始めると、音符「ド」に対応した音節「さ」を発声させるとき、子音「s」の発声動作を音符の発音タイミングよりも前に始め、母音「a」の発音タイミングを音符「ド」の発音タイミングに合わせる。これにより、伴奏に遅れることなく、バーチャルシンガによる自然な歌唱を可能にする。
【出願人】 【識別番号】000004075【氏名又は名称】ヤマハ株式会社
【出願日】 平成13年1月26日(2001.1.26)
【代理人】 【識別番号】100098084【弁理士】【氏名又は名称】
【公開番号】 特開2002-221978(P2002-221978A)
【公開日】 平成14年8月9日(2002.8.9)
【出願番号】 特願2001-19141(P2001-19141)
>j-tokkyo「特開2003-255998」 (pdf)
【発明の名称】 歌唱合成方法と装置及び記録媒体
【発明者】 【氏名】劔持 秀紀【氏名】ジョルディ ボナダ【氏名】アレックス ロスコス
【課題】自然な歌唱音声又は高品質の歌唱音声を合成する。
【解決手段】音素又は音素連鎖からなる音声素片に対応する音声波形を周波数分析して周波数スペクトル(A)を検出する。周波数スペクトル(A)上でP1等の局所的ピークを検知し、これらのピークを含むR1等のスペクトル分布領域を指定する。各スペクトル分布領域毎に、振幅スペクトル分布を周波数軸に関して表わす振幅スペクトルデータと、位相スペクトル分布を周波数軸に関して表わす位相スペクトルデータとを生成する。各スペクトル分布領域の振幅スペクトル分布を入力音符ピッチに応じて周波数軸上で(B)の様に移動すべく振幅スペクトルデータを修正し、この修正に対応して位相スペクトルデータを修正する。所望の音色に対応するスペクトル包絡に沿うようにスペクトル強度を調整する。修正された振幅及び位相スペクトルデータを時間領域の合成音声信号に変換する。
【出願人】 【識別番号】000004075【氏名又は名称】ヤマハ株式会社
【出願日】 平成14年2月27日(2002.2.27)
【代理人】 【識別番号】100075074【弁理士】【氏名又は名称】
【公開番号】 特開2003-255998(P2003-255998A)
【公開日】 平成15年9月10日(2003.9.10)
【出願番号】 特願2002-52006(P2002-52006)
VOCALOIDの特許についての記事と対応特許2(上記からの差分)
>人生は是勉学の事(和泉聡)「剣持氏インタビュー」
▽
>j-tokkyo「特開2004-077608」 (pdf)
【発明の名称】 合唱合成装置、合唱合成方法およびプログラム
【発明者】 【氏名】劔持 秀紀【氏名】ジョルディ ボナダ
【課題】より自然な印象を聴取者に与えることが可能な合唱音を合成する。
【解決手段】この合唱合成装置100は、各々異なる音声に基づいて作成した3つの音声試料データ群110a,110b,110cを記憶する音声試料データベース110と、3つの歌唱生成器120,121,122とを有している。3パートからなる楽曲の合唱音信号を合成する際には、合唱制御部140の制御に下、歌唱生成器120,121,122は各々パートに歌詞情報やメロディ情報に応じて歌唱音信号を生成し、各合唱音信号を合成する。この生成の際に、各歌唱生成器120,121,122は異なる音声試料データ群110a,110b,110cに含まれる音声素片試料データを用いる。
【出願人】 【識別番号】000004075
【氏名又は名称】ヤマハ株式会社
【出願日】 平成14年8月12日(2002.8.12)
【代理人】 【識別番号】100098084【弁理士】【氏名又は名称】
【公開番号】 特開2004-77608(P2004-77608A)
【公開日】 平成16年3月11日(2004.3.11)
【出願番号】 特願2002-235039(P2002-235039)
>j-tokkyo「特開2005-234337」 (pdf)
【発明の名称】 音声合成装置、音声合成方法、及び音声合成プログラム
【発明者】 【氏名】川▲原▼ 毅彦【住所又は居所】静岡県浜松市中沢町10番1号 ヤマハ株式会社内【氏名】劔持 秀紀【住所又は居所】静岡県浜松市中沢町10番1号 ヤマハ株式会社内
【課題】ハードウェア資源に大きな制約が課されている環境下においても、様々な種類の声質の合成音声を生成することができる音声合成装置等を提供する。
【解決手段】1種類の音韻データを備えた音声合成装置100に声質変更部250及び声質データベース260を設ける。声質変更部250は、テキスト解析部220から供給される声質データ番号を検索キーとして声質データベース260を検索し、声質パラメータを取得する。声質変更部250は、取得した声質パラメータに基づいて、音韻データ取得部230によって取得される音韻データに示される各音韻の声質を変更する。
【出願人】 【識別番号】000004075【氏名又は名称】ヤマハ株式会社【住所又は居所】静岡県浜松市中沢町10番1号
【出願日】 平成16年2月20日(2004.2.20)
【代理人】 【識別番号】100098084【弁理士】【氏名又は名称】
【公開番号】 特開2005-234337(P2005-234337A)
【公開日】 平成17年9月2日(2005.9.2)
【出願番号】 特願2004-44852(P2004-44852)
>j-tokkyo「特開2006-251375」 (pdf)
【発明の名称】 音声処理装置およびプログラム
【発明者】 【氏名】劔持 秀紀【氏名】吉岡 靖雄【氏名】ジョルディ ボナダ
【課題】入力音声を簡易な構成によって多人数での合唱音や合奏音に変換する。
【解決手段】ピッチ検出部12は、音声入力部61から供給される入力音声信号VinのピッチPinを検出する。エンベロープ検出部13は、入力音声信号Vinのスペクトルエンベロープを検出する。スペクトル取得手段30は、並列に発生された複数の音声を含む変換用音声の周波数スペクトルを取得する。ピッチ変換部21は、スペクトル取得手段30が取得した周波数スペクトルの各ピークの周波数をピッチPinに応じて変化させる。エンベロープ調整部22は、ピッチ変換部21による処理後の周波数スペクトルのスペクトルエンベロープをエンベロープ検出部13が検出したスペクトルエンベロープと略一致するように調整する。音声生成手段40は、エンベロープ調整部22による調整後の周波数スペクトルから出力音声信号Vnewを生成する。
【出願人】 【識別番号】000004075【氏名又は名称】ヤマハ株式会社
【出願日】 平成17年3月10日(2005.3.10)
【代理人】 【識別番号】100098084【弁理士】【氏名又は名称】
【公開番号】 特開2006-251375(P2006-251375A)
【公開日】 平成18年9月21日(2006.9.21)
【出願番号】 特願2005-67907(P2005-67907)
メモ
>ポンペウ・ファブラ大学「ザビエル・セラ」
>ポンペウ・ファブラ大学「ジョルディ・ボナダ」
>twitter「ocelma」
追記
「Voctro Labs」のレポートにザビエル セラ氏らが顔を出しているのでメモ。
>Reportaje Voctro Labs "Tinc Una Idea - TVE 2" (20/09/2012)
関連ページ
>VOCALOIDが「TED Ideas worth spreading」で取り上げられたらしい件
>Xavier Serra氏がタルーニャ州公共放送局の番組で初音ミクを紹介な件
>VOCALOID2 Editorは美人デザイナーがデザインし直したものらしい件
>出た!フィリピンで「VOCA★FUSION」なるボカロイベントが開催
