調声ならびに合成技術 - 合成音声2＠2021年01月ふたば保管庫

Name名無し20/06/26(金)22:34:09No.20748+
21年8月頃消えます調声ならびに合成技術スレ削除された記事が2件あります.見る

…No.20749+音声合成技術の系統樹見てみたいな

…No.20750+色んな人があっちこっち行ってるからババンと系統樹を示すのは少しむずかしいかも知れない
年表的に技術の推移を観察しながら具体例を見ていったほうがわかりやすいかな？

…No.20751+分野が狭くて尚且共同研究とかしていると系譜が分からない…

…No.20752+テキスト音声合成の歴史をすっごいざっくり言うと
人工音声の始まりは1779年にまで遡る
コンピュータを用いるものでは1950年代には既に研究が始まっていた
90年代まで：ルールベースのフォルマント音声合成（RPAとAIの中間みたいなの）
90年代から：コーパスベースの波形接続型音声合成（ボイロの源流）
95年頃から：コーパスベースの統計的パラメトリック音声合成（CeVIOの源流）
1999年にはCeVIOでおなじみのHMMが提案された
2010年年代初頭に深層学習が導入されて以降、AIブームに乗って多くの手法が考案されている

…No.20753+音声処理はそこそこに応用的な分野ゆえに使われている技術は最先端って感じではないことが多い
よその分野の画期的な技術をもとにブラッシュアップして実用に耐えうる品質にするという図式がほとんど
昨今のAIブームでは画像処理が最先端技術者の遊び場になっているからそこから生まれた技術で遊んでる

…No.20754+そこまで興味なければ動画編集や音楽関連の話でもいいよ
音声合成ソフトとそれに関連するツールの利用・制作の技術を柔軟な視点で多面的に観察・研究していく
つまりなんかボイロとかそういうやつに関する面白げな技術的な話などを語ったり語らなかったり

…No.20755+ボカロに代表される歌声合成とテキスト音声合成の技術的差異ってどの辺りになるの？
それとも基幹の部分は共通になっているのかな

…No.20756+

2020年は花ちゃんが中央に移動　右下に新人が増えて
琴葉姉妹も中央に移動しSynthesizerVの横軸ができる感じかまったくややこしいな

…No.20757+それぞれの分類でも波形接続型と統計型・学習型と違いがあるから一概には言えないけど
基本的には声っぽい音を出して自然につなげるって物だから根幹はとても似通ってる
より複雑な歌や喋りへの最適化の仕方で枝分かれしてると理解したほうがわかりやすいかも

…No.20758+>2020年は花ちゃんが中央に移動　右下に新人が増えて
>琴葉姉妹も中央に移動しSynthesizerVの横軸ができる感じか
>まったくややこしいな
もはやキャラレベルで分類してると追いつかないくらいには複雑化してきてるよね
AITalk系のエーアイとサード各社の関係とか消費者には相当分かりにくいでしょ

…No.20759+ボイロ4あたりでVocalShifterいらずにならんかなぁ

…No.20760+>より複雑な歌や喋りへの最適化の仕方で枝分かれしてると理解したほうがわかりやすいかも
なるほどねー

…No.20763+調声スレか
ボイロ2買ってまだほとんど触ってないからぜんぜんパラメータいじってどう変わるってのが肌でわかってなくて苦戦してるので
用動画で見る人達はすごいんだなって思ってる

…No.20764+>2020年は花ちゃんが中央に移動　右下に新人が増えて
>琴葉姉妹も中央に移動しSynthesizerVの横軸ができる感じか
>まったくややこしいな
まとまった勢力としてガイノイド勢も増えてるしね

…No.20765+動画編集の仕方とかBGMとか書体とかそういうのでもいいぞ
技術と名のつきそうなものは何でも

…No.20767+話題が結構出るようなら編集専門スレでも立てればいいしね
技術的な質問だとリブレちゃんが強いけど…

…No.20768+書き込みをした人によって削除されました

…No.20769+リブレのボイロスレはもう人いないよ…本当にいない……

…No.20770+VocalShifterとか外部ツール使った調声ってよくやる？

…No.20771+リブレのボイロスレといえばMMDからボカロまで手広くカバーしてたのに…

…No.20772+3Dでも音楽でも訊いてくれたら分かる範囲で何でも答えるであおい
技術系の情報交換で流れにくい場所ほしいなって思ってただけやから

…No.20773+技術論ではない音声合成技術の社会的射程についてもここでいいのかな

…No.20774+なんでも

…No.20775+社会学・経営学的考察や倫理的評価でもいいし新しい音声合成手法を思いついたぞってんでもいいし
フォロワーの伸ばし方とか立ち絵の使用率の上げ方とかでもいいなんでもいい

…No.20776+>社会学・経営学的考察や倫理的評価でもいいし新しい音声合成手法を思いついたぞってんでもいいし
博論いっちゃえるのでは…？

…No.20777+良いネタあったら博論でパクろ

…No.20778+Softalkの調声の受容から声優交代を考察するとかもなんか書けそうなネタだとは思うんだけど
違いが認識されたかどうかが計測できないという致命的な問題があるんだよな
あとは単純に調声が人によってバラバラなところか

…No.20779+Aquestalkは中の人が居ないが故のニュートラルなイメージが非常に使いやすい
どんな事を喋らせても適度に似合うし見る側もキャラ性という先入観を持ちにくい
キャラ売りのボイロになると多かれ少かれ前提属性は付く

…No.20780+ボイロは新世代技術で再収録が必要になったときに中の人を交代して作ることは可能だろうか
人気キャラはファンコミュニティと各種素材や文脈あるいは人格資源を豊富に抱えることになる
声優の高齢化というだけの理由で捨て去ることが不合理と言える規模にまでそれらが拡大した時
ご長寿アニメの中の人交代みたいなことが求められる可能性は十二分に考えられる

…No.20781+声変換技術は音声合成技術の兄弟みたいなもので伴って急速に発展しているから
過去の収録音源やそれによる合成音声の念入りな加工によって
声質の近い別人による中の人交代がより耳に馴染みやすい形で可能になる可能性は高い
一方口調や発音の特質といった声質以外の部分は今後暫くは本人の努力に委ねられるはず

…No.20782+ゆっくりと言っても霊夢魔理沙あたりはずいぶん声のイメージが固まってるはずだけどね
実際にはそれ以外のキャラにもゆっくりボイスを使う場面が生じてくる
そうなったときに固まりきっていないキャラだと声が解釈違いだというような問題が生じることがある
固まっていたら別の選択肢が出てこないから可視化されることがないだけだけど
合成音声が現実に連続して使用されるなかで不連続となる場面があるからそういう問題が出る
それというのは声優の交代という問題と相通じるところがあるように思うけどね

…No.20783+それでもAquestalkは他のキャラ付きに比べるとかなりイメージが自由化されてると思う
いわゆるゆっくり霊夢の声が聴こえた時に口調がそれっぽかったり立ち絵が付いてたりすればそのまま霊夢として認識できる一方で
それ以外のキャラとして用いられていた時にもそれなりに違和感なく個々のキャラとしてすんなり受け入れやすい方ではある
ボイスロイドとなるとナレならともかくボイロ以外のキャラの声をあてる機会が少ない故にそういった場合に違和感を感じる事も多い
声のニュートラルさより上層レイヤの問題としてキャラのニュートラルさの問題もある
公式設定のほぼないゆかりさんや公式設定が濃すぎて活かすことがほぼ不可能なずん子は使用者が好き勝手にキャラ性を付与できる
それなりに分かりやすく使いやすい公式設定を持ったついなちゃんは少しそういうことがしづらくハイコンテクストな存在になっている
そういう部分も含めるとAquestalkは長い独占時代を含む歴史の中で
「霊夢でもいいし霊夢じゃなくても良い」「何にでも使える存在」としてかなり便利な立ち位置を獲得するに至ったと言えると思う

…No.20784+夢中で書いてたらすっげぇ長文になっちゃったな
もっと短く端的にまとめられるようにしなきゃなぁ

…No.20785+突然興奮するアザラシ

…No.20786+そういう自分の得意分野になると早口になる気持ち悪いところ好きだよ

…No.20787+Aquestalkが自由に使われているのは確かだね
偽実況とかもその延長線上にある
当てられている声が違うとかの異議もゆっくりボイスそのものへの違和感というよりは
創作の中で固まってきたイメージとの違いに起因するものの方が多いわけだ
それに比べればボイロはキャラに束縛されているように見えるしまあそれを否定しても仕方がない
ただそれが設計の問題なのか受容の問題なのかというのは分けたほうがいいように思う
例えばイメージキャラクターが存在するがためにそれ以外に使われないという面は大きいだろう
だがそれは聞く側にとっては無視できる可能性がある類のものだ
聞き覚えのある声でも別のキャラとして演じられている以上別のキャラと扱うのがトーキーであるし
当然何も先入観のない視聴者にとっては声質がどうであるという点以外は感想を抱きようがない
中の人についても同じことが言えるはずだ
当てられるキャラについても霊夢のような元々声のないキャラだけが当てられてるわけじゃない
偽実況なんかは既に声のイメージのあるキャラに別の声をあてている
だから中の人の存在というのはあてる側あてられる側の双方において無視されうる

…No.20788+それでも現実にはボイロは声あてに使われない
理由はAquestalkの声質のニュートラルさに届かない面や価格に求めてもいいけど
ボイロが声の確立されたキャラ性の中で受容されている点も考慮すべきだろう
そもそもAItalkでも同じことができるのを考えればキャラ性の薄い素材はある
よく中の人ネタで話に挙がる桜乃そらなども声あては十分可能なはずだがそれでも見ない
ボイロ自体キャラ性が強い部分はあるがそもそも視聴者がキャラ性に乗っかっている
そしてそれは声に基盤を置いている
だからボイロで吹き替えをすると多分感想として「声が違う」よりも「キャラが違う」が先に来る
声は変わらないものだからキャラの方が変えられたと説明される
少なくとも声当てがボイロとの連続性の中で受け止められるうちはキャラの違いが先に来るだろう
言ってしまえば声がどう調声されてもボイロはボイロキャラとしてイメージされてるわけだ

…No.20791+音声合成ソフトの進化って言うと「より生の人間に近いこと」こそが取り沙汰されるけど
「キャラクター」としてはNEUTRINOきりたんですら違和感を感じた身としては
盛り上がりに同行できなくて済まないがVOICEROID2より前の声の方が好きなんだ……
多分ここですら少数派だろうけど

…No.20792+ボイロの声あてってvtuberとかで何人かいたはずだと思うけど

…No.20795+ボイロの声は強くキャラクターと結び付けられて売られてるし
消費者もそれを好んでその様に活用してるもんねぇ
さとうささらは知名度が低い頃にエイレーンが人気だったからいまでもそのイメージ持ってる人も多いみたい

…No.20796+>音声合成ソフトの進化って言うと「より生の人間に近いこと」こそが取り沙汰されるけど
>「キャラクター」としてはNEUTRINOきりたんですら違和感を感じた身としては
>盛り上がりに同行できなくて済まないがVOICEROID2より前の声の方が好きなんだ……
>多分ここですら少数派だろうけど
NEUTRINOのきりたんは「中の人の声が変わってきてる」「地声と歌声だと違う」「収録方式・合成方式ともにボイロのそれらとは大きく異る」という特有の事情があるから声がボイロのきりたんとは比較的離れている
でもボイロに関しては今後進化してもそれらの要素は大きくは変わらないし変わるとしても声質が変わらないように最大限努力することになる
だからあんまり心配しなくても大丈夫

…No.20797+UTAUのきりたんとかボカロのゆかりんとか聴くとああなるほど確かに歌声だと全然ちげえやってなるし歌と喋りでズレがあるのは多少仕方のないこと
そのズレが比較的小さくなるCeVIOですらソングとトークではそれなりに声質の違いはあるし生声でも差は出る
それにNEUTRINOのきりたんは他に比べればまだボイロのきりたんに近い方の声ではある（中の人の努力もある）
今後合成手法が進化していく中でそれらの違和感を薄める方法も発展してくると思うよ
SynthV琴葉姉妹の開発にあたってはその辺りにはかなり拘ってるはず

…No.20798+あかりちゃん感情付いてなかったしボイロ3で比較的早い段階で出そうではあるんだよなぁ
ただこの前のAHS生の「抱えてるタマ全部ゲロった」発言を信じるならばSynthVでAHS社内がてんてこ舞いでボイロ3計画が全然進んでない可能性もある

…No.20799+AHSの売り方見る限りライト層向けドメインは完全に打倒VOCALOIDで動いてるっぽいし
今後あかりちゃんやゆかりさんがSynthVで出る可能性は大いにある

…No.20800+AITalk3が出たのが2013年中頃
AITalk4が出たのが2015年中頃
AITalk4.1で関西弁対応したのが2017年中頃
AITalk5が出たのが今年2020年4月

AITalk3のVOICEROID+琴葉姉妹が出たのが2014年初頭
AITalk4.1のVOICEROID2が出たのが2017年中頃

この流れを踏まえるならばVOICEROID3が一年以内に出る可能性はある
一方でSynthV周りにAHS社の人的資源が集中しててあまりボイロ3の制作に没頭できていない可能性もある
特に次の大型アップデートではいよいよ64bit化に着手しなきゃいけないからそれなりに大改修になることは確実
しかし2020年の合成音声AI化の波に乗るためにも他社の新型商品に対抗するためにも年内にVOICEROID3を発表したいという思惑はそれなりにあるはず
見極める一つの目安としてマキ衣装コンの結果を受けてただちに新商品を発売する予定を発表するか否かという部分がある
3の開発に特に言及しない限りはおそらく2での発売となるため3の発表は当面先と予想できると思う
ただしVOICEROID2エディタのままAITalk5.0相当タイトルを発表する可能性も完全に否定できるものではなく結局の所よくわからん

…No.20801+これ以上新商品出してもユーザーのお財布が保たないからしばらく間あける気がする
でもこれまでも構わずバンバン新人出してたし普通に年末に出る気もする

…No.20803+64ビット化はほぼ完了してると思っていいと思う
六花ちゃん来るときには64ビット版も使えるようになるんじゃないかなと勝手に推測

…No.20804+えっこれからは腹いっぱいメモリ食っていいのか！！

…No.20805+>ボイロの声あてってvtuberとかで何人かいたはずだと思うけど
のらきゃっとさんがいちばん有名だよな
ゆかりねっとを使いまくって実践データかなり得てゆかりねっとがかなりアップデートされたそうだし

…No.20806+ゆかりねっとってStTの駆動部Google chrome依存じゃなかったっけ？

…No.20807+あとついなちゃんとかきりたんとか一部ボイロがAHSが販売してるボイロの利用規約として「別のキャラに声を当てるのを禁止してる」って情報は既出？

…No.20808+そこ忘れられがちで危ないよね
初音NTミクちゃんさんもそんなような条項あったような

…No.20809+IZさんの動画消しで調声講座まで消えちゃったの惜しいなぁ

…No.20810+https://www.nicovideo.jp/watch/sm35660511
力技すぎる…

…No.20812+俺も規約関連完全に覚えてないから一度見とかないと……

…No.20814+個人商用も申請さえすれば無料でやれる枠あったよな

…No.20815+>ただこの前のAHS生の「抱えてるタマ全部ゲロった」発言を信じるならば
英語版ボイロやAPI周りの話はどうなったんだろうな…

…No.20816+>ただこの前のAHS生の「抱えてるタマ全部ゲロった」発言を信じるならばSynthVでAHS社内がてんてこ舞いでボイロ3計画が全然進んでない可能性もある
>英語版ボイロやAPI周りの話はどうなったんだろうな…
てかそもそもSynthVにしてもボイロ（AItalk）にしてもボカロにしても
基幹システム作ってるのは全部余所の会社でAHS自体に開発能力ないでしょ
あそこは従業員数十数名の声優とパッケージングと販売窓口担当のキャラクターIP屋なんだから
ウナやら鳴花姉妹らAItalk組のIFがボイロとほぼ同一の時点で
開発の主導権はどこが握ってるのか分かり切った話じゃない

…No.20817+そんなもんか

…No.20819+歌ボみたいなのがもっと発展するようにSDK配布とかもしてほしいもんだけどまあそうはいかんのだろうなぁ

…No.20820+話速に抑揚付ける調声が上手く行かない
抑揚つけないよりも不自然になっちゃうんだよな

…No.20821+抑揚は全体上げるより普段下げ気味にして要所だけ上げる方が楽かも

…No.20822+抑揚付けすぎると暴れちゃって収集付かなくなるよね…

…No.20823+話速を±0.2くらい整えてリズムを良くするのよくやるけど
完全に感覚でやってるからうまいこと説明できないな…

…No.20825+結局思いつくこと全部色々やってみるのが上達への近道なんだよな…

…No.20826+AITalkってこんなに多言語対応してたのか
知らなかった・・・

…No.20827+KotonoAssist無しにはもう調声できない

…No.20828+雑音が多い場面では声を張り上げると聴き取りやすくなる（ロンバード効果）

…No.20829+ボイロ初心者だからパラメータの話は助かるなあ

…No.20830+クククもう助からないさ

…No.20831+

最近キャラ絵が付きはじめて人気出てきた子

…No.20832+

最近発情インコの声あてに使われてる子

…No.20833+>ボイロ初心者だからパラメータの話は助かるなあ
上にも出てるけどまずはKotonoAssistって補助ソフト入れるのが良いよ
スペースキー使えるようになるだけでも全然違う

…No.20834+>上にも出てるけどまずはKotonoAssistって補助ソフト入れるのが良いよ
>スペースキー使えるようになるだけでも全然違う
動画製作から逃げてたのであらためて同ガウクリの勉強にAviutilのプラグイン導入するのと一緒に今度試してみるぜ！

…No.20836+CeVIOのエディタって調声モードどれにしてる？

…No.20837+俺はざっくりアクセント調声はボイロ式
細かいところは母音と子音がくっついたやつ
こだわりたい所や変な音出させたい時は全部別れた初期のやつ

…No.20840+CeVIOの調声は一度凝りだすと半日書けても5分と進まないから沼すぎる

…No.20842+ボイロ・ガイノイド等・CeVIOで一番調声しやすいの誰？

…No.20843+個人の好みかな
調声できる項目の多さを難しさとするならCeVIOが頭一つ抜けている

…No.20844+CeVIOは感情設定がすごく触りやすい
一昔前まで調声難易度は一段上だったけど度重なるアプデで大分触りやすくなった
ONEちゃんが一番扱いやすくIAちゃんが一番むずかしい
つづみちゃんは自由度は低めだけど崩れにくいからパッと見よりやりやすい

…No.20845+

7/6 18:55 Eテレ

…No.20849+ボイスロイドとかのAITalk系列は各ボイスごとに癖が違う感じがあるから
どれが調声しやすいかってのはわりと個人差が出ると思う
あと「調声しやすい」ってのと「調声しなくても聞こえが良い」は個人的に分けて考えたい

…No.20850+CeVIOはUIが使いづらいから時間がかかるとかそういうのじゃなく
色々できてしまうから時間がかかるタイプ

…No.20852+ここでも歌声合成で出てきた「即席性」と「自由度」の対立が登場するよね
「細かいことイジらなくても簡単にいい感じになる、ただし複雑なことは出来ない」のと
「細かいところまでこだわり尽くして自分の理想形を作れる、ただしそれっぽくするのに手間がかかる」のと

即席性側であったAITalkも感情の実装などで大分いじれるようになったし
自由度側であってCeVIOもエンジンやUIの改善でベタ打ちや軽いアクセント調声はかなり楽になった
製品としての成熟度の向上につれて両方の性質をある程度両立できるようにはなってきてるよね

ただそれぞれの目指すところが逆方向っていう根っこの部分があるから
それぞれの欠点は消えても長所の方向性の違いは依然として存在するし
その得意分野を比較検討した上で目的にあったツールを選べるようにして行きたい所っすな

…No.20857+ボイスロイドの中ではゆかりさんが一番ベタ打ちで聞き取りやすいかな
人っぽさ重視ならきりたん
変なアクセントでもバレにくいから調声サボれるのは茜ちゃん
癖がなくて扱いやすいのは葵ちゃん
ちょっとしたコツで簡単にこだわり調声っぽさを実現できるのはマキマキ

…No.20858+ボイロの使い勝手について「人によって違う」で終わっちゃうのも不誠実な感じがしたから
自分なりの意見を書いてみるね…

まず「調声しなくても聞こえが良い」ボイスについてだけど
これってすなわち「アクセント調節だけすれば目的の音声に80%くらい合致した声が出る」って事だと思ってて
同時に素読みの音声と脳内イメージが近いってことだと思ってる

自分の中でこれに該当するのは
・きりたん(VOICEROID+ 東北きりたん ex)
・ゆかりさん(VOICEROID2 結月ゆかり)
・吉田くん(VOICEROID+ 鷹の爪吉田くん ex)
あたり

長すぎるって怒られたんで分けます
3レスぐらいになりそう

…No.20859+続き
きりたんはベースの声が低めなせいか多少音がずれてても許容しやすいんじゃないかと勝手に思ってる
抑揚MAXにしたときの抑揚の付き方も他のボイスより狭いらしいし
ゆかりさん2はスタイルのせいで声の幅は広いんだけど
ゆかりさんなだけあっていろんな動画で声を聞くから脳内の音声マッピングが広大で
だいたいの読み上げは「ヨシ、ゆかりさんだな！」ってなって結果的に手間が少なくなってる
きりたんも半分これに該当する
勝手な想像だけど人によっては同じような理由で琴葉姉妹を「手間がかからない」と評する人もいるんじゃないだろうか
吉田くんは吉田くんの声が欲して吉田くんに頼めば吉田くんの声が貰える感じ

それ以外の「調声しやすい」については次のレスで

…No.20860+最後「素読みが良い」以外の「調声しやすい」についてだけど
ここでは「目的の音声に近づけるためにどうパラメーターをいじれば良いか推測が容易」って言い方するけど
自分はマキマキ(VOICEROID+ 民安ともえex)がそれに当てはまるかな
高さを上げたら高さが上がるし抑揚を上げれば抑揚が上がる感じがする
(ex前期組みんなに当てはまるかもしれないけど)

この「調声しやすさ」って使用者の経験値にメチャクチャ左右される部分で
ビギナーと熟練者、熟練者同士でも評に大きく差が出るヤツだと思う

ボイロの話から外れるけど
この「どうパラメーターをいじれば良いかわかりやすい」ってのはアクセント機能が付く前のCeVIOが最強だったんじゃないかって思ってる
PITとLENで何でもできる！って感じが(感覚的なものなので実際にそうかは知らない)

長文ごめんね
読み返してみるとメチャクチャキモいなこれ

…No.20861+長文歓迎熱烈慶祝

…No.20862+確かに「調声のしやすさ」と一口に言っても
①「目的の抑揚への近づけやすさ」と
②「目的の声色・雰囲気への近づけやすさ」の二要素があるよね
しかもその2要素が個別じゃなくて絡み合って作用してる・・・

①は単純なエンジン性能やライブラリの声質、②はファンコミュニティでの実際の使われ方の影響が特に大きい感じする
ただ①に関してはエンジンの性能向上で「人間がイジらなくてもいい感じにしてくれる機能」（Officeで言うオートコンプリートのような）
が付いたことによって「イジってない余計なとこまで動く」「狙った所に動かない」といった事が起こりえるようになって
>自分はマキマキ(VOICEROID+ 民安ともえex)がそれに当てはまるかな
>高さを上げたら高さが上がるし抑揚を上げれば抑揚が上がる感じがする
のような素直さが失われてしまった部分があり
それ故に引用させて貰った部分のような感想の差が生まれてるのかなとは思う

…No.20863+ACC導入以前のCeVIOは確かに「何を動かせば何が変わる」ってのはわかりやすかった
慣れて知り尽くしてるCeVIO職人・調声オペレーターにとっては自分の四肢のように自在に操れたんだと思う
その一方「どう動かせばどう変わる（＝自分の出したい音を出すにはどうすればいい）」という部分が慣れと経験に頼る他なく
音韻的観察力や調声論理的思考力の未発達な初心者や短時間でパパッとやっちまいたい人にとっては厄介な部分だった

…No.20864+「どの音素のピッチとボリュームをどの程度弄るとどんなアクセントになるか」を理解している人にとっては
「上げるべき音素を上げ下げるべき音素を下げるだけで狙ったアクセントになる」ものであり
そういった日本語の音韻構造を理解していない人にとっては
「ひたすらそれっぽい箇所の音素を上げ下げして組み合わせ変えながら狙った音が出るまでガチャ」
「ボイロのアクセントグラフやOJADを参考に台詞を無限に口ずさみながらピッチ弄る」
という作業が必要なものだった
（その結果として音韻に対する理解が深まりより精密な理論に基づく調声へのステップアップが可能であり
能力開発・実技型体系的学習としての側面があったことは否定できないが
民生用音声合成ソフトとしてそのような性質が求められるとは少し言いにくい）

ACC機能という機械的アシストによって失われた明朗会計さよりも得られた直感的操作の価値が大きく
かつ多少明示的ではなくなったとはいえかつてのパラメータも存続できてると思うから
あの変更は即席性と自由度の両立に一歩近づいたものとして結構評価してる

…No.20866+存在が異質であんまり使われてないけど実はかなり高品質な吉田くんいいよね…

…No.20867+そういえばついなちゃんとかそらさんって基本的未調整ベタ打ちを前提に作ってる気はする
ただ調整に関しては感情ありボイロ２の方が圧倒有利なんだけど
ある程度はプリセットでなんとかなりそうな気もする

…No.20868+最終的にはプリセットの選択だけで殆どの工程が回るようなクオリティにしたいのかもねぇ
CeVIOでも性質は違えどプリセットは重要というかプリセット一個一個の持つ価値がボイロ以上に高くて長く使い続けたユーザーだけが持つ特別な創作資産になってる感じ

…No.20869+G検定法律関係多くない？

…No.20876+AR技術みたいな感じでキャラクターの声が流れるとアバターが見えるような事出来ないのかね
音を可視化するカメラとか網膜に埋め込むレンズとかそういうので

…No.20878+イマジナリーボイロは現実に戻れなくなるぞ

…No.20879+>最終的にはプリセットの選択だけで殆どの工程が回るようなクオリティにしたいのかもねぇ
CeVIOみたいな研究畑からの製品だとプリセット選択が理想なのかと予想はする
人工声帯や難読症の読み上げに対してセリフごとの調声を施すのは現実的ではないし
好みのプリセットを作成すれば調声なしに利用できる方が好まれるのかな

…No.20880+調声する楽しみと簡単にいい調子の声を出せることの両立か
調声そのものはCeVIOは前者に分があってボイロは後者に分があるけど
プリセット機能だけを見るとその優位性は逆転するかもなあ

…No.20882+ボイロ一個作るのってどれくらい金かかるんだろう
声優は個人売りでファンもいっぱい居るから1000万くらいなら簡単に回収できるんじゃないか

…No.20883+ボイロ化するための波形特性の適性とかあるから自由自在にってわけにはいかなさそう

…No.20885+クラウドファンディングの最低目標額は600くらいだっけ

…No.20895+金さえあればできるもんでもないからなぁ

…No.20898+コーパスベース系だと繋ぎが荒れるから音素収録の間にぶれてはダメ
みたいに声優としての技量も大事と聞いた

…No.20899+学習系にしてもよっぽど大規模な教師データにするんでもない限りブレはなるべく減らさなきゃいけないしねぇ
しかも学習系だと複数人でラベル付けしなきゃいけないってダルさもある
「複数人で手分け」じゃなくて「複数人でそれぞれ全部」だから超手間

…No.20907+ちょっとスレの趣旨と違うかもしれんが確認したい
ボイロとウナちゃんのアクティベートの解除はインターネット接続状態でアインストールが必須
PCの不具合でそれらができない状況に陥った場合買い直し以外に手段は無い…でいいんだよね？
PCのクリーンインストールもダメって認識でいいよな？

…No.20908+>No.20907
自分の知識は
「ライセンスごとにアクティベーション回数が定められていてアンインストールで回復しない
　回復させるにはライセンス管理会社側でのアクティベーション回数の回復措置が必要」
ってのが最新だなあ
たしかボイロは3回までアクティベーションできてそれを超える場合は
例え過去にインストールしたPCからアンインストール済みであっても
AHSに連絡して回復措置をしてもらう必要があるってやつ

…No.20909+>>No.20907
ありがとう
う～ん…故障からのクリーンインストールでも大丈夫なのかねぇ
特にウナ吉関連もわからん事だらけだし…
レアケース過ぎてわからん

…No.20910+書き込みをした人によって削除されました

…No.20913+追記ネットワーク環境下出ないとアクティベートが有効にならない？

…No.20914+ボイロならネットワーク接続がない環境向けのオフラインアクティベートツール的なの入ってるけど
ウナはわからないな…

…No.20916+ディアクティベートをどうするかの問題に直面してて
PC初期化しかもう手立てが無いんだけど…
ネットワークつながってない状態で初期化してもアクティベートできるかなって
人柱になるつもり

…No.20917+先に問い合わせたほうが安全じゃない？

…No.20918+だよなぁ
イタコ姉さま以外DL版でサポートキーどうするか
もしくはなんとかインターネットだけでも回復させて復活させるか…

…No.20919+サインイン後黒画面カーソルのみ
タスクマネージャーも開ける
別アカウント作ってログイン出来たけどコンソールパネルとネットワークに繋げられない…
ウイルス感染かそれともSSDの寿命処理落ちか分からんけど初期化すりゃ治りそう…
復帰ポイントやリカバリディスク作っとくべきだったなぁ

…No.20920+さすがにスレチ続きなんで頑張れとしか言えん

…No.20921+だな
失礼した

…No.20926+こいつら本格的にヤマハ殺しにかかってんな
というか結月ゆかりはSynthVじゃなくて良いのか
さてはユーザーの相互移動を活発にすることで「顧客奪い合うライバル関係」から「共同して顧客を獲得し共有する」共闘関係への移行を検討・・・？

…No.20927+それはあるかも？
というかゆかりさんに関しては中の人個人事務所でフットワーク軽いし
花さんについては……心当たりが色々ありすぎるわな…
出来が良い悪い関係なしにせっかく出たボイス相当ピーキーな感じになっちゃってたし

…No.20928+各IP持ちもボカロの技術的限界を感じていただろうところへこの2020年のAIの大波が来たんだもんなぁ

…No.20929+ポストVOCALOID連合として「パソコンから流れる歌声といえばボーカロイド！」とい状況を打ち崩そうという狙いもあるのかも
名工大系のCeVIO・明大系のWORD（NEUTRINOのやつ）・中国系のSynthVが今後歌声合成三国時代を構成していくのかもなぁ

…No.20930+HOYAには実は歌声合成機能がついてて
CeVIO系とNEUTRINO系の二種類のエンジンが使えるという

…No.20932そうだねx1万人に扱いやすくないと駄目だよな
ボカロPもそろそろ世代交代の時期が迫ってるし、初心者にも扱いやすいようでないとどんどん業界自体がしぼんでいく

…No.20933+AI式の合成音声が発展して複雑化するのと同時に今から始める初心者ユーザーも成熟してより難しい物を扱えるようになりより自由な物を求めるようになる
ユーザーと製品がともに成長していくことを考えるとこのタイミングは最適かもしれない
現時点ではパラメーターはさほど多くなくてもそれはむしろ強みになる

…No.20934+デモ触った限りではかなりいろんな音出せたから「単純」ではなかったけど
しかし「難解」ではなかったかな

…No.20935+MSのStudioVoICEもそろそろだな

…No.20936+ゆかりさんと花ちゃんがCeVIOになる…
大戦国時代だ…

…No.20937+えーらいことになったなあ

…No.20938+>花さんについては……心当たりが色々ありすぎるわな…
それは一体どういう…？

…No.20939+花さんV5出てないしガイノイド化まで存在すら知らなかった
ボカロは疎いもんで

…No.20940+CeVIO本家三人衆はAI化するんだろうか
たかつづはよくわからんから置いておくにしてもSSRちゃんの中の人本当にSSRになっちゃったけど収録できるんだろうか的な話を耳にした
技術デモではずっと出ずっぱりだったし大丈夫だと信じてるけど

…No.20941+CeVIO Proってなんなんだろ
AITalkの「声の職人」みたいな業務用ソフトなのかな
はたまた当初想定していたような月額制で高品質なクラウド合成サービスかね

…No.20942+>CeVIO本家三人衆はAI化するんだろうか
スターターセットとしてエディタ+両用SSRちゃんで1.2万、その他が一個当たり1.1万くらいが妥当なラインじゃないかな
つづみちゃんとタカハシは出たら良いなあくらいに思っとくのが良さそう
旧型はもう十分安いし安売りはしないさそうだけど終売するなら持ってない子お迎えしとかなきゃ

…No.20943そうだねx1YAMAHAはミクNT発売後も続けて従来型のボカロ売るつもりだったみたいだけど紅巾の乱と黄巾の乱が一遍に起きちゃ敵わないだろうなぁ
ボカロの設計も古すぎてだいぶ無理が出てきてる（というかエディタがレガシー過ぎて使い物にならない）からNT路線への舵切りを余儀なくされるかも知れないね

…No.20944+今はあくまでアンチボカロ連合みたいになってるけど今後はどうなるか分からんわ
VOCALOIDは完全に海外アーティスト向けで客層棲み分けるのか起死回生の買収や撤退・事業売却で業界再編が起こって新たなパワーバランスが発生するのか

…No.20945+そもそも本当に連合してるの？
版権持ちと開発元と販社が複雑に入り組んでどの陣営が何なのかさっぱりわからん

…No.20946+これ以上のビッグニュースはもう流石に無いはず
というかここ二ヶ月くらい濃すぎたよ…

…No.20947+AHSが抱えてそうなタマは動画編集ソフト・64bit化あたりか
SynthVの追加音源やボイロ3の発表もそう遠くない未来にあるはず
新キャララッシュはとりあえず落ち着くにしてもマキマキ3とか古参税のアプデで確実に絞ってくる

…No.20948+テクノスピーチはまだCeVIO Proを隠し持ってるけど民生品じゃ無さそう？

…No.20949+森勢教授のWORLDの商業化はしばらくは無さそうだけどありえない話じゃない
どこかが声を掛ければ急速に話は進むだろうし
ReadSpeakerが既にBtoBでWORLDやってるからこの波に乗って一般向け市場参入を模索してるかもしれない

…No.20950+SynthVの発表の豪勢さ見てオイオイCeVIO陣営大丈夫かよって思ってたけど盤石どころの騒ぎじゃなかった
総攻撃だこれ
真珠湾返し　しかも4倍返し

…No.20951+そうだSynthV2のWebお試し版の公開もあったんだ
あの圧巻の性能は真面目に扱う人にはまさに買い
しかし俺のように適当に楽譜読ませておもちゃにしてるだけの人にとっては「いじれば色んな音が出るのに単純な音しか鳴ってない、こいつ調声くっそ適当にやっつけたな」と即バレする恐ろしいもの

…No.20952+>テクノスピーチはまだCeVIO Proを隠し持ってるけど民生品じゃ無さそう？
Cubase上で動かしてるデモ映像が出てたから「音楽クリエイター向け」としてボカロ並の価格でどどんぱ説

…No.20953+ガイノイドの動向も気になるところ

…No.20954+>ガイノイドの動向も気になるところ
ヒメミコについてはVOCALOID5で出たばっかりだから移籍の心配は無さそう
値下げで勝負とか追加exvoice発売とかで刻んで存在感をアピールしてくる程度は十分ありえる
新人はvflower出たばっかりだし考えにくいけど無いとは言い切れない

…No.20955+>あの圧巻の性能は真面目に扱う人にはまさに買い
>しかし俺のように適当に楽譜読ませておもちゃにしてるだけの人にとっては「いじれば色んな音が出るのに単純な音しか鳴ってない、こいつ調声くっそ適当にやっつけたな」と即バレする恐ろしいもの
ベタ打ち楽曲のつまらなさって抑揚のなさなんだよな
いくら部分部分の歌い方が人間っぽくてもずっと同じ調子で歌ってると聴かなくても想像付くから面白くない
NEUTRINOきりたんブームが一瞬で過ぎたのも直接的には「自由度の低さ」でも、本質的には「一曲を通しての平坦さ」が大きいと思う
現状だと仮にソフトとしては表現力があってもユーザーがそれを使いこなせてなくて「神調教」ができる限られた人だけが素晴らしい作品を作れる状態

…No.20956+そのうちAIが楽譜全体を分析して「ここは盛り上がるトコだな」「ここは静かに」「力強く感動的に」みたいにしてくれるようになるんじゃないだろうか
あるいは「この小節は動きを付けて生き生きと」「このパートはここだけ表情豊かに楽しげに」みたいな大味での指定を受けてAIが上手いこと味付けしてくれるようになるのかも

…No.20957+最近情報が多すぎる・・・

…No.20958+初音ミクのデビューから見てきたおじいちゃんだけど戦局がここまで大きく動いたのはじめてだよ…

…No.20960+キャラクターと音声合成への技術的アプローチは分離できるものだから
様々なエンジンを行き来しても別段不思議でも何でもないと思うけどね…

…No.20961そうだねx1そうは言ってもビジネスはビジネスだし・・・

…No.20962+ビジネスならなおさら拘りはないんじゃない？

…No.20963+タカハシお前消えるのか…？

…No.20964+AI化したのか・・・俺以外の奴と・・・

…No.20965+SynthV巻き舌や吐息の調声が凄く簡単にできるのにとっても自然
これはすごい

…No.20968+>キャラクターと音声合成への技術的アプローチは分離できるものだから
>様々なエンジンを行き来しても別段不思議でも何でもないと思うけどね…
キャラクターとして合成音声の不気味の壁を乗り越えるでなく利用したミクさん達先達の偉大さよなあ

…No.20969そうだねx1>キャラクターとして合成音声の不気味の壁を乗り越えるでなく利用したミクさん達先達の偉大さよなあ
実際それはこれまでVOCALOIDのウリであり強みだったしこれからもそうあり続けさせる予定だったんだろうけど
かなしいかなこのAI時代に民衆が求めたものは人間っぽさに傾いてしまっていて痛い腹にもなってしまった
民心に敏感な版権は人間らしさを追求した後発に乗り換えてしまって今回のヤバい状態に陥ることになった
機械らしさを追求する一方で人間らしさを追求するNTを開発していたのは救いだけど今後どうなるかはまだまだわからない

…No.20970そうだねx1>SynthV巻き舌や吐息の調声が凄く簡単にできるのにとっても自然
>これはすごい
最初見た時はパラメータすくねぇなって思ったけど少ないパラメータの組み合わせで無限に豊かになるやつだわこれ
ピッチ線でも大化けするしUTAUの技法が結構転用できるのが地味ながら結構な驚き

…No.20971+無声化使えば外国語っぽいのも行けそうだなぁ
短すぎる音符も超綺麗に歌ってくれるから気合次第では中国語もできるかも

…No.20972+ジェンダーの設定はただのフォルマントだと思ってたけどそうでもないらしい

…No.20973+>ジェンダーの設定はただのフォルマントだと思ってたけどそうでもないらしい
思いっきり弄っても変な声になりにくくていいね

…No.20974+>かなしいかなこのAI時代に民衆が求めたものは人間っぽさに傾いてしまっていて
自分もボカロ曲の中で気に入ったやつはボカロの中でも人間っぽい調整のやつとかテクノみたいなロボっぽくても気にならないやつとかだなあ
でも結局CeVIOの歌声のが声質的には好きだし

…No.20975+初めての人がボカロ作曲しようと思うなら必要なソフトってどれぐらいになるんだろう

…No.20976+>初めての人がボカロ作曲しようと思うなら必要なソフトってどれぐらいになるんだろう
打ち込みとミックスができれば最低限の作曲はできる
そしてそういうのは大抵無料のDAWで事足りる
旧SynthVやDeepVocalといった無料のボカロ的な奴は色々あるからそこもタダで行ける

…No.20980+すごいぶっちゃけな話だけどシンセとチェビオAIだとどっちが性能いいんだろう

…No.20981+最近たまに見る読唇なんたらってのがよくわかってない

…No.20982+>すごいぶっちゃけな話だけどシンセとチェビオAIだとどっちが性能いいんだろう
SynthVはサンプル触って見るのが一番わかりやすいと思う
CeVIOAIは3年前の時点で下のURLのような感じで、そこからブラッシュアップと軽快化に取り組んでると思う
https://www.techno-speech.com/news-20181214a

…No.20983+>最近たまに見る読唇なんたらってのがよくわかってない
耳の不自由な人が補聴器や手話による意思疎通の補助に用いるのがそもそもの読唇術
音声合成にこれを応用することで「より高精度なボイチェン」や「大きな声で話せない（マイクがない）状態でもある程度のSpeech To Text」といったことを実現できるのではないか、というのが大本の発想

技術的には「顔のトラッキング」と「辞書・コーパス的な文脈予測」のあわせ技になると思うんだけど
今回のクラファンは「喋ってる人間の口元の映像と音源」を大量に集めることで
「顔の動作と音声の結びつき」を深層学習によって分析するための「元データ」として広く提供し
そういった内容の研究を促進して機械読唇の発展に貢献しよう的な趣旨のプロジェクトと思われる

よりわかり易い概略は以下に示す記事を参照されたい
https://www.dtmstation.com/archives/30552.html

…No.20985+ふむふむなんとなくわかった気もする
製品向けのクラファンという側面ばかりでもない感じかな
実用化できたら現実に返って来れない人が増えそう

…No.20986+今回の歌唱DBならびに読唇コーパスはNEUTRINOのAIきりたんの元になった「きりたん歌唱DB」と同質のものと思われる
すなわち「研究したいけど元データがねえよ！」って研究者のための材料セットの無償配布のための資金集め
故に今回作成されるコーパスによって研究者が成果を生み出して一般公開or販売するまでは一般ユーザーはその恩恵に預かる事はできない
生まれるのは「歌うAIイタコ」ではなく「歌うAIイタコのもと」と「ボイチェンイタコのもとのもと」
ただし「歌うAIイタコ」に関してはNEUTRINOに比較的速やかに実装されると見て良い

…No.20988+CeVIOのゆかりさん本当に想像つかないな…

…No.20989+何にせよメーカーや音声エンジンの軛から脱してくれるなら歓迎だよ

…No.20990+今後もし「結月ゆかりが3大合成音声・4大歌声合成の新作で同時発売！」とかなったら流石に買いきれんぞ俺

…No.21002+流石に同時発売とか需要食い合うことはないと信じたいけど最近の動向見てるとそれもわからんな

…No.21009+SynthV曲が続々と上がりだしてるね

…No.21026+へぇい買っちゃった買っちゃった
Synthesizer V買っちゃったよつづみちゃぁ～ん

…No.21059+まさか本当にこのスレが避難所になる日が来るとはな…

…No.21064+なんかあったの？

…No.21068+mayが一時的に落ちただけだよ

…No.21070+そういえばここdecだった

…No.21072+エーアイ、個人向けAI音声合成ソフトを21年2月に発売　ディープラーニング採用の新型エンジン搭載（要約） https://www.itmedia.co.jp/news/articles/2008/27/news127.html

思ってたより早かったな新エンジン
ロンチは誰になるんだろう

…No.21073+来春かぁ楽しみだね
機運の高まり方で言うとマキマキじゃないかなぁ
ゆかりさんはしばらくCeVIOの方で話題あるだろうし
ご当地組はリニューアルする財力がなさそう

…No.21075+シンセやボイロよりもCeVioの方が性能上だしもうゆかりさんボイロでだす意味ないだろ

…No.21076+でもCeVIO動画作った後にボイロ動画作ると調声が超楽で感動するからなぁ
手軽な女としての地位を占め続けるためにボイロとして君臨継続するんじゃない？

…No.21117+>ご当地組はリニューアルする財力がなさそう
ずんだはいざとなったらクラファンで金貯めてヤッてってくるぞ
つか絶対にくる

…No.21120+ずんだもだけどきりたんぽは特に需要が確実にあるしな
なんならボイロ全体でも売上トップ3に入るんじゃないか

…No.21370+ボイロやめてCeVIOに行くのが出るのは期待できるのかな

…No.21373+SynthV アップデートあまりにも早すぎて琴葉姉妹のボイスDBが早くも型落ち状態になったの笑うに笑えない