日記
ディープラーニングスピーカー
2015年12月28日
こんばんは。
今後、必ず出るであろうオーディオ機器について、記載しておきます。特許にはならないと思うので問題ないかと。。
オーディオでは一般的にソース音を正とするのが、基本であると思います。業界用語でいう、色付けがない。スピーカーを感じない。Hifi、忠実性が高い音というやつですね。
その忠実性を阻害している代表的な特性は次の6つがあります。1.周波数特性のばらつき。2.位相のずれ。3.残響(過渡特性)。4.倍音ノイズ。5.周波数のズレ。6.ダイナミックレンジのノンリニアリティ。です。
これらは必ずしも悪い音になるかと言えばそうではありません。真空管を使ったり、密閉スピーカー以外のものを使っている人たちはこの特有の特性を好いていますね。
そして環境によっても音が変化します。気温湿度気圧、部屋からの反射等です。
上記の様々な要因で、音が変化し忠実性が削がれます。
では、どのように解決するかというとディープラーニングの機能を搭載したアクティブスピーカーによって解決していくのではないかと思います。linnのイグザクトに近い形ですね。
なぜ、そうするのかというとソース音とイコールの電圧または電流をスピーカーユニットへ入力しても、出てくる音がソース音とイコールにならないためです。
その対策のために上記の特性環境パラメータを変数として学習させることで、最も忠実性が高い状態へ近づけることができるのではないかと思いました。
これはDSPに一定のパラメータを入力するのとは異なります。
もちろんソフトウェアだけではダメで、ハードウェア的にも優れた特性を有する必要はあると思います。
ただし問題もあって、測定点をどこにして学習させるかということがあります。フィードバックを得る場所によって学習結果が変わるためです。
一旦ここまでで。。
レス一覧
-
なるほど、ディープラーニングは面白いですね。
ディープラーニングは関係しているのですが、
本質は人間の学習を模擬するものだと思うのです。
そもそも学習させる側がどうか?という話はないのでしょうか?
byRIRA_ at2015-12-28 22:11
-
RIRAさん。おはようございます。
学習させる側がどうか。とはどのような意味でしょうか。
それは、ユーザーがどういうことを好んでいるかという問題という意味ですか?
byCronos at2015-12-29 10:21
-
私の職場で同じようなことをやっていますが、
ディープラーニングはあまり万能ではない印象です。
例えば、人の声か、ギターの音かを判断はできますが、
我々がやりたいこととずれがある印象です
まずセンシング技術が人を上回らないと、
人を越えるチューニングはできないし、
質問されている学習させる側というのは、
このコミュで話題になる、学習させるべき
オーディオの正解はなに?は
誰かが詳細に定義する必要があって、
さらにどうやって学習させるか?
安易に出てこない点が課題だと思います。
正解がわかっていれば、人がやったほうが早い印象です。
byRIRA_ at2015-12-29 12:30
-
すみません、色々情報不足でした。
おそらく表現したいのは、
フィードバック制御理論なのかな?と思います。
ディープラーニングは、識別技術なので、
良い悪いは判断できるかもしれないですが、
どうのこうのはないと思います
byRIRA_ at2015-12-29 12:53
-
RIRAさん。こんばんは。
ご指摘ありがとうございました。
私が間違っているかと思いますが、一応確認したいです。
>学習させるべきオーディオの正解はなに?
ソース=正として、マイクでセンシングするデータを人が聞こえる音と同じと仮定して書きました。もちろんこれは正しいかというとそうではないと思います。
>さらにどうやって学習させるか?
安直ですが文章で書いた変数を振って正へ近づくようにするものとして書きました。
>フィードバック制御理論なのかな?と思います。
そうかもしれません。
そのうち近い技術の似たようなものが出ると思いますので、気長にまとうと思います。
byCronos at2015-12-29 18:17
-
Cronosさん、色々書いてしまい、すみません。
センシングに関しては、大枚と大きさの制約をなくすと、
人間くらいのセンシングはできるかもしれません。
一般家庭でやれるのか?は気になるところです
ディープラーニングの学習は、通常 何千、何万次元の特徴に、
サンプルと呼ばれるインプットと良い音である正解の判定を、100万とかいれる必要があります。
(色々あるのでいろいろな研究者がどうやってるかは置いといて)
それに伴って、良い音である判断はしてくれると思います。
変数を振って正に近づけるなら、最適化理論みたいなものがあります
ただこれをやり出すと、メーカーの音がすべて同じ音になるので、
あまりやりたがらないと思います。
あくまでも、オーディオ機器は芸術品としておくのが儲かります。
たぶんですが、似たような技術では、
デジタルイコライジング技術があって、スタジオ側のメーカーの技術では良くやっているのはご存じの通りと思います
注意が必要なのは、直接音となるユニットの音のみを
イコライジングするので、聞きやすくなるけど、
直接音と間接音を聞き分けられると、本質的に良くなるか?は色々あると、オーディオメーカーは感じていると思います
直接音と間接音の聞き分けは、音像が変になるので、
メーカーのマイスターなら、わからなくもないことだと思います
byRIRA_ at2015-12-30 08:43
-
RIRAさん。コメントありがとうございます。
>それに伴って、良い音である判断はしてくれると思います。
そうでしたか。判断することができるのであればよかったです。
>最適化理論みたいなものがあります。
アプローチとしてはこちらになるのでしょうか。
>ただこれをやり出すと、メーカーの音がすべて同じ音になるので、あまりやりたがらないと思います。あくまでも、オーディオ機器は芸術品としておくのが儲かります。
もちろん。やりたいと思うメーカーはあまりいないと思います。
ただ、色がないということを売りにするメーカー様やプロ機などの低歪環境を要求する環境ではある程度は需要はあると思います。
また、こういった技術で「音がすべて同じ音になる」ことよってある程度の良い音をより低価格出来るんじゃないかと思います。
>本質的に良くなるか?は色々あると、オーディオメーカーは感じていると思います
私も含め歪んでいる音が好きな方もいらっしゃいますので、そういう考えのメーカー様もいらっしゃると思います。
こちらに関しては、2段別けて学習するべきだと思っています。おっしゃられているように直接音チューンとルームチューンに分けて考えないと、複雑になりすぎると思うからです。また、一般のシステムでは音の8割が間接音ということをいう話もありましたので、ルームを無視することは無理だと思います。
>直接音と間接音の聞き分けは、音像が変になるので、メーカーのマイスターなら、
こちらはどういう意味でしょうか。間接音のない環境ではマイスターさんは試聴しません。聞き分けは難しいと思います。直接+間接で初めてシステムの音になるため、間接音のみはどういう音、直接音のみはどういう音かという判断は難しいと思います。
byCronos at2016-01-01 15:45
レスを書く