テナガザル
テナガザル
企業勤めの理系です。 でもあくまで趣味ですから結果オーライな考えやプラシーボも容認します。 現在の機器構成 スピーカー : 自作2way Feastrex nf-5 / RAAL 140…

マイルーム

好き勝手にやってる部屋
好き勝手にやってる部屋
最近feastrexのユニット載せたスピーカーを部屋にセットしてみました。 満足いくまで遊んでいけたらと思います。
所有製品

レビュー/コメント

カレンダー

  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31      

お気に入り製品

日記

前回の続き - サンプリング定理 -

このエントリーをはてなブックマークに追加
2012年04月24日

こんばんは。
前回の記事に対して色々と反響を頂き嬉しい限りです。
自分はあくまで高校と大学で学ぶ事から記事を書いておりますので
認識違いや覚え間違い、解釈の不勉強な所など数多くあると思います。
それでも尚、今現在世の中にはびこる諸説に関しては「嘘つけ(笑)」と思っていますので、(難解な)数式をなるべく分かりやすく説明していきたいと思います。

また、この議論はあくまで「他が理想的」な事を前提としておりますので
先ずは今回の議論以外の物は完璧であると思って下さい。
一歩づつ理想から現実に近づけていかないといけません。
というかですね、「スピーカー…」と言われた段階で終了してしまう儚い議論です。
ダメ、絶対(笑)


※ここから数式が多数並びます。
※数式どうでもいいって方は下の結論まで読み飛ばして下さい。
厳密さから離れる分だけ嘘が混じりますが、なるべく簡単で分かりやすい形にしていきたいと思います。


また、前回は数式にf(x)やF(k)を使用しましたが
物理的には x や y は位置の変数として使用される事が多く、
現在見ようとしている音波は位置を固定し、時間tに対する関数と思った方が素直に受け入れられるという人もいるでしょう。
今回は(変数の書き方を変えただけですが) x→t、k→ω として表現します。


先ずは最初の式をご覧ください


これはフーリエ変換でwikiを確認すると出てくる数式です。
(のっけからg(x)をf(x)にすれば云々とか書かれている時点で分かりづらいので、fと、fをフーリエ変換したFのペアで書いています)
(wikiまる写しを心がけた為、変数はxとξにしています)
これを見た時点で「ばーかばーか!(笑)」となってしまうと思います(笑)

この式ですが、見て分かる通り?数学的には非常に綺麗です。
そして物理的にもとても意味がある式ではあるのですが、、、

学者さん達は数式という物は、より汎用性(一般性)があって綺麗である方が「偉い」と思っていますので、普通の人が見てこれが何なのかを理解する事は不可能なほどに抽象的な書かれ方をしています。

ここでフーリエ展開やフーリエ変換と言った時に、その中身は
世の中のあらゆる関数(厳密には嘘)はサインとコサインの和で表される。
と書いて許されるくらいには市民権を得ているでしょうか?
つまり昔の偉い学者さんが、全ての波形はサインとコサインの和で表現できるよ、と証明したわけですが、この式のどこにもサインやコサインは見あたりません・・・。


一旦ξをfだと思い、次に
2πf = ω (ここでのfは周波数、f(t)ではない)
である事を利用して2πを式の中から消して(笑)





さて、ここでオイラーの公式という物があります。
詳しい説明は全て省きますが、皆様が大学生の頃全くもって意味不明だった?虚数単位 i が登場します。
この虚数単位iですが、これは天才数学者さん達が一大体系を築き上げた為にその理論を丸ごと踏襲したものであり、物理・電気・機械・情報etc.で数多くの学生を困惑の渦に叩き落としている概念ではないでしょうか。

実数と虚数とか言われてすんなり理解できる学生は皆無ではないかと思います。
学校でいきなりReal partとImaginary partとか言われたら、前者が実世界?で後者がどこか別の空間であるかのような感覚を抱くでしょう。誰だってそうです。
(数学的には仮想的な軸を用意したので、勿論仮想空間なのですが)

数学者や物理学者を目指すのであれば話は別です(こんな事を言ってはいけません)が
多くの理系分野で虚数単位iを持ちだす理由は
「これはグラフを3次元的に表現していますよ」、という事に過ぎません。
我々は紙の上に3次元でグラフを書けないので、「別の軸である事」を表現するために偉い数学者さんが作りだした「i」を使うのです。
(電磁気学では電流iと区別するためにjを使います、まあつまり何でもいいんです)


長々と書きましたが、式の後半の指数で書かれた所というのは
サインとコサインを「かっこよく書きました」という事になります。
サインの前にiがついているのは、サイン軸とコサイン軸は別々に計算してねという軸の判別マークです。(ここで虚数とか言い始めるから学生は混乱します)

なので、かっこよく書く事をやめて式を展開すると
f(t) = ∫F(ω){cos(ωt)+isin(ωt)}dω
になり、サインとコサインが出てきます。
この式はまだ「かっこいい」ので更に式を崩して分解していきます。

∫dωはωの無限小の無限加算という積分概念なので
無限小ではなく微小くらいで許してもらう事にしてもらい、
非常に小さい微小角振動数ωTとする事で、先ほどの積分は
∫dω≒ΣωT  (この辺は数Ⅱの内容かな)
となりますから、整数 n を用いてf(t)を変形すると



かなり崩れて一個づつの項が見えてきました。
この時点で終わりにしてもいいのですが、更にもう一押し「嘘変形」を行います。
多くの人に見やすく?という思いのもと
これはオカシイというご指摘を覚悟して式を書き換えます。



この式はイメージです。
ただ、最初の意味不明な「かっこいい式」が何を表しているのかを理解するために
式を展開して、分かりやすい値(というか表現)を外挿しました。


wikiの数式は全くもってチンプンカンプンだけどこの「文章」であれば
なんとなくイメージは伝わるという人は増えるのではないでしょうか。

本来のf(t)は、もし○○HzでのF(○○Hz)の値が分かっているのなら
1Hzからひたすら周波数をスイープさせて重ねていく事で
元波形f(t)を実現できるという事が式の右辺から読みとれます。
※因みにf(t)からこのF(ω)を素早く数値計算する方法がFFTです。


もしf(t)が遇関数ならsinの項は全て消えますし、奇関数ならcosの項は全て消えるのでぐっと分かりやすくなります。


長々とお付き合いさせて頂いて申し訳ありません。
ここまで来たら(数式の話は)あと少しです。


ある任意の波形f(t)があった時に、フーリエ展開(変換)に依って
サインとコサインの無限級数で表現できるという事をwikiの式は言っています。

ここで良く「正弦波成分」だとか「サイン波成分」という表現を目にする事があると思います。
この「成分」という言葉はとりもなおさず上記フーリエ展開を行った時のサイン軸とコサイン軸の事であり、その対応する周波数での係数になります。

今回自分が言いたい事の1つになりますが
この「○○成分」はフーリエ展開での無限級数に分解した時の各成分であり
現実の波とは関係ないのです。

誤解を恐れずに言います。
本当は関係あります、凄く関係ありますが
この「正弦波成分」「周波数成分」は現実の波形ではないのです。


念を押して言えば、この「周波数成分」を聴いてはいけません。
これ1つ1つは実際の波ではなく、全てを足し合わせた時に初めて現実の波形f(t)が再現されます。
我々はたまたま特定のサイン波が耳に聴こえてしまうだけなのです。
一部が音として聴こえてしまう為に
「聴こえない成分には意味が無い」と思いがちですが
それは誤りです。


あくまでフーリエさんは、真摯に展開しろ(きっちりFFTを行え)
その周波数成分全てにsinやcosを乗せて無限に足し合わせれば波形が一致する。
としか言っていません。

フーリエ変換を行った"ω空間"での出来事に対して
その音を単独に聴いて判断してはいけません。



次にサンプリング定理(標本化定理)です。
これもwikiを参照します。(特に間違っていないと思われるため)



今回の知識をそのままあてはめて書き直します。

『標本化定理とは、ある関数f(t)をフーリエ変換した関数F(ω)の成分が、|ω|≧Wの範囲でF(ω)=0であるような関数f(t)に対して、ω=2Wに相当する周期より小さい周期を持つ標本化関数で標本化した時に得られる関数は、その成分(スペクトル)のうち|ω|<Wが原関数のスペクトルに一致する(=f(t))というものである』

数学表現が分かりづらいため少し書き直します

『標本化定理とは、ある関数f(t)をフーリエ変換した関数F(ω)の成分がある値W以降全てゼロになってしまう場合、そのWの2倍に相当する2W以上の標本化関数で標本化した時に得られる関数は、W以下のωでf(t)が表現できる』

もっと言い替えましょう

『標本化定理とは、ある関数f(t)のフーリエ展開がある有限のWで収束する時、そのWの2倍以上の値で標本化を行えば、f(t)が再現できる』

わかりますでしょうか?
何か当然な事を言っていると感じませんか?


そうです、サンプリング定理というのは単に
フーリエ変換が有限で収束するならその周波数成分ωの取り得る最大値Wの2倍よりも大きな数で記録しとけば良いよと言ってるだけなんです。


後半にナイキスト周波数という事が書かれていますが
これはこの逆の話です。
『標本化するためのサンプリング周波数をfsに設定すると
その半分の周波数成分fs/2までの波形を正しく再現できますよ』
という事です。
まあこれは上の話が受け入れられればこっちも当然と感じると思います。

このサンプリング定理は情報工学的には非常に意味のある重要な定理です。
デジタル信号として記録する時に、幾つで標本化すれば良いのか
全く手掛かりが無かったら条件設定のしようがありません。


ですが残念な事にこれはオーディオにそのまま転用できる魔法の理論ではありません・・・。

というかこれをオーディオに適用しようとしたら
「とにかく現在の技術レベルで達成可能な最高のサンプリング周波数で記録しろ」
と素っ気なくつっかえされるだけです。


これまでフーリエ展開(変換・逆変換)とサンプリング定理を簡単に説明しましたが
誰も周波数成分を途中で切ってもいいよなんて言っていません(そりゃ当然です)




フーリエ展開は理系なら高校生で習うと思いますが
世の中の波が全てサイン・コサインで分解できると知って「すげー」と思いますよね
世の中のあらゆるものが簡単に記述できるんじゃないか、と。
そして高校の時に幾つか例題を解けば「なんだ、ちょっと波形が複雑になるとすぐ無限級数になるじゃん」「エッジがあったら絶対収束しない」というがっかりな事実を目の当たりにします。
自分は勉強初日に落胆しました(笑)


つまり単純な連続サイン波を記述するならフーリエ展開は簡単に収束するんですが
音楽信号はすぐに無限級数に突入していきます。
この成分を途中で落としても良いなどという理論は世の中にありません。


今回参照したサンプリング定理の後半にも書いてありますが
「原信号に含まれる周波数(成分)が最高でf=22.05kHzだった場合」という時点で強烈な制限が掛かります。
音楽信号はこの条件を満たしません。
(なのでCDはサンプリング周波数44.1kHzで必要十分という主張はメーカーによるファンタジーです)
無理やり切った場合どの程度波形が崩れるかは前回書きました。



これでもまだ分かりづらいという方の為に、現実に当てはめます。
サンプリング定理というのはつまり
「映画を製作するためには、現場が必要だと言って来たスタッフ人員に対して2倍以上の人数を確保してやれ、そうすれば良い映画が製作できるぜ」
という太っ腹な理論です。
CGに100人欲しいと言われたら200人充ててやれ
メイクに50人欲しいと言われたら100人用意しろという理論です。

これをお金を渋りたいスポンサーや経営側がわざと?解釈を捻じ曲げ
「映画を製作するために、製作に必要な”キャスト”の2倍の人数を揃えてやる、そうすれば十分な映画ができるはずだ」
出演者が20人なら40人で製作出来る、出演50人なら100人で全部やれ
と主張し、「ありえねえ」と膝をつく監督に対して
偉い学者が証明してるんだから可能なはず!できないのはお前の腕が悪い!
と鉄槌をかましてる状態です。



繰り返しますが、耳に聴こえてしまうので仕方ないんですが
計算上フーリエ変換を行った後に出てくる「周波数成分」という物を耳で聴いてはいけません。
それはあくまで映画のスタッフであり、CG担当者であり、もしくは演劇の黒子です
周波数成分というものは音の構成要素であって全体として意味があります。
直接それだけを見てどうこうという話をしてはいけない存在です。



***********************************************************************

上の話から更に発展



たまに本などを読んだりすると
レコードに数十kHzや100kHzの信号が入る事があるが、
これはレコードの盤上で何nmに相当するからノイズである。
なので考慮する必要が無い、むしろ落とした方がいい。

などというような事を書かれている人がいますが、本当でしょうか?


超高域の連続サイン波が聴こえてしまう人や、
連続サイン波を聴いて楽しみたい方には残念なのですが
記者の方がおっしゃる通り、そんな連続音を出すのは無理でしょう。
それを出す為には確かにnmレベルの溝が切ってある必要があります。


しかし音波の「周波数成分」がどこまで伸びているかは
実空間での間隔が長い・短いとは違う話です。
周波数成分の話をする時は、どのくらい波形が不連続かが重要であり
無音からサイン波的な強い音が出た時点で遥か上まで高調波が伸びます。
(良く言われるのはシンバルとかでしょうか。)
そして音楽信号というのは不連続信号の塊りですから
途中から周波数成分がいきなりゼロになるという現象はあり得る話ではありません。


また、よくある誤魔化しとして
ギターやバイオリンの「連続的な」波の一部を抜き出してフーリエ変換を掛ける場合があったりしますが、それが有限で収束したとして、学術上は意味があるとして
オーディオという実用上の参考にはなりません。
私達は音楽を聴くわけですから、ちゃんと無音部を含めた波形全体で計算結果を出して論じて欲しいものです。


つまり、アナログレコードやデジタルハイレゾ音源においては
信号経路を通る信号の「周波数成分」は数百kHzに達すると思うべきでしょう。
(実際アナログレコードのFFT解析グラフは途中でスパっと切れたりしません)
ここを全てノイズだと断じるのはあまりに早計です。

勿論CDは20kHz以上の周波数成分が切ってあるので考慮しなくて良いです。


結局のところ、実はこの記事で自分が言いたい事はここなのですが
旧態依然としたオーディオ業界は扱っている周波数帯域が狭い(20kHz未満)なので
インピーダンスマッチングとかアンプの周波数特性とか色々と全部どうでもいいよと言う主張を繰り返してきたように思います。

ですがどうもインピーダンスマッチングやケーブルやアンプやスピーカーの周波数特性は十分上まで考慮する必要があるような気がしてなりません。
(というか自分はそう思っています、という話です。)


CDだと音があまり変わらないのに
レコードだとケーブルや端子をちょっと変えただけでも激変?するというような現象はまさにレコードやハイレゾ音源が十分な高域まで特性が必要だからではないでしょうか。
(一部のメーカーさんはMHz帯域近くまで特性の伸びたアンプを出してますよね)
(数百kHzやMHzと言うと笑われる方もいると思いますが、自分は笑いません)


何故オーディオメーカーの技術者はここを突っ込んでいかないのでしょうか?
みんな自分よりずっと頭が良いはずですし、
今回の話はwikiなどを見ながら定義に沿って話しただけです。
何も突飛な事は言ってないつもりです。

買い替え需要とかも積極的に生み出せる気がするんですけど、
きっと色々あるのでしょうか。
上司を説得できないとか上司を説得できないとか上司を…。


明日の為にこの辺で寝ますm(_ _)m
長々とお目汚し失礼致しました。

次回の日記→

←前回の日記

レス一覧

  1. CDの規格を決める時に、老若男女、オーディオ評論家、楽器奏者などを集めて、同じ音源で、20KHz以上をカットしたものと、カットしていないものを瞬時に切り替えて、どこで切り替えたかをあててもらう実験をしました。

    その結果、誰も当てられなかったので、20KHz以上はカットして問題無いとして、サンプリング周波数44.1KHzが決まりました。

    byミネルヴァ at2012-04-25 08:08

  2. ミネルヴァさんありがとうございます。
    そうですね、自分も実際に聴いて違いが分からなければそれで良いと思います。
    もっと言えば音楽を気持ちよく再生してくれさえすれば「細かい事はどうでもいい」と思いますが、作り手側はそれではダメなわけで、更にCDの音質には多少なり疑問を持たれている方もいらっしゃるでしょう。

    この話は理想論であって実際はむしろ電気的な歪の方が大きいし、スピーカーの物理特性には目も当てられない程ではありますが、CDの規格自身もちょっとだけ足を引っ張ってるのではないかなという内容です。

    byテナガザル at2012-04-28 16:09

  3. ストラさんこんにちは。
    CDの悪いところは、理想的な規格で音が変わらない(?)という話が先行してしまい
    マスタリングで劣化処理を掛けまくっている事(現在進行形)が何よりも大きな原因ではないかと思います(笑)

    同じCD規格でも高音質に拘ったXRCDなど色々な物が出ていますが、自分は十分いい音だと感じます。
    デジタル音源というものが出てきてから30年ですからソフト・ハード両面で良い物になっていけばと思います。


    またお二方ともこんな日記にお付き合い頂きありがとうございます。

    byテナガザル at2012-04-28 16:24

レスを書く

レスを書くにはログインする必要があります
ログインする