動画作成用の音声再生アプリと、ライブ放送読み上げ用の音声再生アプリでは要件が違う話

動画に再生する音声メッセージでキモいボイスを流さなくても済むように、
指定されたメッセージを読み上げるアプリを作成した。機械音声なら美声でなくても安心である。


さて、昨今、こういった機械音声はライブ放送や実況などでも利用されているが、
動画作成用に作った音声再生アプリをライブ放送のコメント読み上げに使おうとしても、
そのままではうまくいかない。


ちょっと試してみたところ、
動画作成用の音声再生アプリと、ライブ放送のコメント読み上げアプリでは、
どちらも似たような音声再生のアプリでありながら、アプリの要件が違っていたのです。

どんな要件の違いが?

・動画作成用の音声再生アプリは、動画の制作者の指定どおり忠実に音声を再生することが期待されている。
・ライブ放送のコメント読み上げアプリは、一部のメッセージをライブ放送用に読み替える機能が期待されている。

w → ワラワラ


・ライブ放送では動画の運営コマンドが飛んでくる。これは読み上げてはいけない
・動画作成用ではそのまま読み上げて欲しい。読めない語があっては困る。

/hidden
@コテハン


・並列で多数同時にメッセージが飛んでくる。
ライブ放送では、これらをキューにいれて順番に読み上げてあげる必要がある。
(試しに書かれたそばから再生してみたら凄かった。まるで動物園のようだった。)


・たとえば、辞書機能があるとして、動画作成用と、ライブ放送用では、辞書に入れるデータがだいぶ違ってくる。
・動画作成用では、頻出ワードとか辞書に登録する
・ライブ放送用では、こう読んで欲しい、みたいな語を辞書に登録する
・この2つの辞書は絶対共有できないですよね

設計的な話で言うと

ライブ放送用の音声再生アプリでは、音声再生のキューの処理機能と、一部音声のフィルター機能が要るが、
動画再生用の音声再生アプリには不要。
ライブ放送用、動画再生用で作りを変えるのは、嬉しくない。


ライブ放送用のアプリと、動画再生用の音声再生アプリを一緒にすると、
結構面倒なことになってしまいますね。

ところがギッチョン

棒読みちゃんなどのメジャーな音声アプリは、その辺、一つのアプリで両方に対応していて、
あ、ご苦労様です、苦労してたんですね、という感じなのでありました。