Subsections

音響とか / Sound and Acoustics

音速

音の伝播速度$c$ (m/s)は媒質によって異なる。常温付近でのいくつかの気体の音速は以下の通り(媒質の温度を$T$ ($^\circ$C)とする)。

空気
$c = 331.5 + 0.60T$
ヘリウム
$c_\mathrm{He} = 970 + 1.6T$
二酸化炭素
$c_\mathrm{CO_2} = 260 + 0.9T$

多くの液体では1000–1500 m/sとのこと。

波長 / wave length

波長$\lambda$ (m)、音速$c$ (m/s)、周波数$f$ (Hz)の関係は以下の式になる。

$\displaystyle \lambda = \frac{c}{f}
$

いくつか例を表1に示す(ただし音速は340 m/sとした)。


表 1: 周波数と波長の関係
周波数 (Hz) 波長 (m)
10 34
17 20
20 17
100 3.4
170 2
200 1.7
1000 0.34
1700 0.2
2000 0.17
10000 0.034
17000 0.02
20000 0.017

デシベル / dB

ふたつのパワーの比を表す単位。単位記号はdB。音の強さ$I$ ( $\mathrm{W/m^2}$)、音圧$p$ (Pa)とすれば、

$\displaystyle L$ $\displaystyle =$ $\displaystyle 10\log_{10}\frac{I_1}{I_0}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 10\log_{10}\frac{p_1^2}{p_0^2}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 10\log_{10}\left(\frac{p_1}{p_0}\right)^2$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\log_{10}\frac{p_1}{p_0}$  

となる。$I$(パワー、電力)と$p$(圧)は2乗の関係があるので( $I=\frac{p^2}{\rho c}$、空気中であれば $\rho c = 415 \mathrm{Rayl}$)、上記のように$\log$前につく定数が変化するが、どちらの計算式を用いても意味しているところは同じである。

音響機器の仕様などで「20 Hz〜20 kHzにおいて$\pm$2 dB」というような表記があるが、これは1 kHzを0 dBとしたときに、20 Hz〜20 kHzの周波数区間での音の強さの変化幅が$\pm$ 2 dBにおさまる、という意味。

以下に音に関係するいくつかのデシベルをあげてある。長いこと使用されてきていることもあり現在でもdBVのような単位表記がなされることが多いが、近年は「 $L = -45 \mathrm{dB (relative to 1 V)}$」や「 $L_p (\mathrm{re} 20 \mu\mathrm{Pa}) = 79 \mathrm{dB}$」のように規準を明確にした表記をしようということになっている。2

dBm

dBmは「1 mWを基準としたデシベル」で、放送やプロ・オーディオの世界で古くから使われているものである。基準になっているmWという単位から分かるように、dBmは電力を基準とした単位である。

ただし、オーディオで使われる計測機器は基本的に電圧を計測するものなので、dBmを使うときには測定したい対象の抵抗値(インピーダンス)を知っている必要がある。(電力の定義 $W=A\cdot V$およびオームの法則 $V=A\cdot\Omega$より、 $W=\frac{V^2}{\Omega}$。この計算に抵抗値が必要。)

放送やプロ・オーディオ業界でもっとも広く使われている(いた)インピーダンス値は600 Ω3であるので、多くの計測機器は600 Ωを暗黙のうちに基準にしてしまっていることが多い。そのときに1 mWの電力は0.7746 Vに相当する( $W=A\cdot V$ $V=A\cdot\Omega$から $V=\sqrt{W\cdot\Omega}$なので、 $\sqrt{1 \mathrm{mW}\cdot 600 \Omega}=0.7746 V$)。ただし、150 Ωなど600 Ωとは異なるインピーダンス値が使われることもあるので、基準となるインピーダンス値を明示するために $\mathrm{dBm}_{150}$ $\mathrm{dBm}_{600}$という表記も見かけることがある。

さて、真空管の時代には電力転送効率の最大化のため、全ての機材が等しく600 Ωで動いていたので、dBmの基準は自明だった。半導体の時代になり、コンシューマ向け機器などでインピーダンスを抑えた(送出電流量を抑えた)出力をするようになった。現在の機器ではロー出しハイ受けになっていることが多いので、600 Ωは使われない。つまり、dBm自体が無意味なものになってしまっている。

dBu、dBv、dBs

1 mW 600 Ωを基準としたdBmと互換性を保ちつつ、電圧ベースの測定単位が必要になったので、インピーダンスを問わず0.7746 Vを基準にしたdBuが登場した(uはunterminatedの頭文字)。600 Ωの機材であればdBmとdBuは同じ値を示す。

古い計測機器の中には勝手に600 Ωを基準と想定した設計をしているものもあり、表示部にdBmと書かれていても動作はdBuであることがある。

表記としてdBvが使われていたこともあったが、dBVと大文字・小文字の違いだけで間違いやすいのでdBuを使うことが推奨される。国内の機材ではdBs表記も見られる。dBsはNHKが制定した放送技術規格に規定されていた(sはstandardの頭文字か?)。(dBsについて中山さまに当初の誤りを指摘頂きました。ありがとうございます!)

ここで注意したいのは、交流電圧を測定するために実効値(RMS)を使用しているということである。実効値が1 Vの正弦波の場合には、$-\sqrt{2}$$+\sqrt{2}$ Vの範囲の振幅になる。下記dBVやdBuで分母に入っている基準値は実効値を用いている。

dBV

dBVはdBuと同様に電圧ベースの測定単位だが、1 Vが基準になっている。マイクロホン感度の表記やコンシューマー機器で使われることが多い。

$x$ボルトの電圧をdBVおよびdBu表記にしたときの差を考えると

$\displaystyle \mathrm{dBu}$ $\displaystyle =$ $\displaystyle 20\log_{10}\frac{x}{0.7746}$  
$\displaystyle \mathrm{dBV}$ $\displaystyle =$ $\displaystyle 20\log_{10}\frac{x}{1}$  
$\displaystyle \mathrm{dBu} - \mathrm{dBV}$ $\displaystyle =$ $\displaystyle 20\log_{10}\frac{x}{0.7746} - 20\log_{10}\frac{x}{1}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\log_{10}\frac{0.7746}{1}$  
$\displaystyle $ $\displaystyle \approx$ $\displaystyle 2.21845$  

となるので、dBVの値に約2.2を加えるとdBu値となることが分かる。

dBuとdBVの関係

プロ向け機器のラインレベルは$+4$ dBu(=1.228 V)と規定されており、コンシューマ向け機器ははっきりと決められているわけではないが$-10$ dBV(=0.316 V)となっていることが多い。

ちなみにマイクレベルは$-60$$-40$ dBV(=0.001 〜 0.01 V)なので、それをラインレベルにするには100〜1000倍くらい増幅することになる。この増幅がマイクアンプの役割。逆にラインレベルをマイクレベルに落とすためのアッテネータもある。またエレキギターなどのレベル(0.150〜0.300 Vくらい)をマイクレベルに変換するのがDI(Direct Injection Box)の役割の一つである。

dB FS

dB FSのFSはFull Scaleの略で、AES17規格によると「997 Hzの正弦波の実効値をデシベル表記したものを0 dB FS」としている。そのためクリッピングが起こる最大振幅値は+3 dB FSとなる。(一方でITU規格では、デジタル信号で表現できる最大値を0 dBovとしている)。

ダイナミックレンジ

量子化ビット数(quantization bits)が分かればデジタルでのダイナミックレンジが計算できる。

$\displaystyle 20\log_{10}2^\mathrm{bits}
$

dBSPL

人間が聞くことのできる最小の音圧4を、1 kHzのときに0 dBSPLとなるように補正したもの。 $I_0=0.964\times 10^{-12} \mathrm{W/m^2}$(パワー)、 $p_0=20 \mu\mathrm{Pa}$(音圧)のときを基準とし、dBSPLと呼ばれる。

(近年は「レベルの単位はdBとして、その種類は別途明示する」ことからdBSPLという表記は推奨されていないため、「音圧レベル $L_\mathrm{p}=94 \mathrm{dB}$」のようにする。)

1 Pa = 94 dB

計算例:音圧が1 Paのときの音圧レベル


$\displaystyle 20\log_{10}\left(\frac{1 \mathrm{Pa}}{20 \mathrm{\mu Pa}}\right)$ $\displaystyle =$ $\displaystyle 20\log_{10}\left(\frac{1 \mathrm{Pa}}{20\times 0.001\times 0.001 \mathrm{Pa}}\right)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\log_{10}\left(\frac{1000000 \mathrm{Pa}}{20 \mathrm{Pa}}\right)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\log_{10}\left(\frac{100000 \mathrm{Pa}}{2 \mathrm{Pa}}\right)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\left(\log_{10}100000 - \log_{10}2\right)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\left(\log_{10}10^5 - \log_{10}2\right)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\left(5 - 0.30103\right)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 20\times 4.6990$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 93.979 \mathrm{dB}$  

VUメーター

インピーダンス600 Ωにおいて1 kHz正弦波が+4 dBmで入力されたときに0 VUを示す、音量感を模擬した測定器。正弦波バースト信号を加えたとき300msで最終指示値の99%に達する動特性があり、あるていど聴感上の音量感に沿った数値になる。

デジタル音声の基準レベルは、 $0 \mathrm{VU}=-20 \mathrm{dBFS}$(民放)、 $0 \mathrm{VU}=-18 \mathrm{dBFS}$(NHK)、 $0 \mathrm{VU}=-16 \mathrm{dBFS}$(多くのレコーディングスタジオ)などの様々な設定がある。

なお、日本音楽スタジオ協会 (JAPRS) はデジタルマルチレコーディングにおける基準レベルの推奨値を、それまでの $0 \mathrm{VU}=-16 \mathrm{dBFS}$から $0 \mathrm{VU}=-18 \mathrm{dBFS}$に改定した(2024年4月から運用開始)。(参考:JAPRSインフォメーション2024年2月7日

マイクロホン感度

「平面進行正弦波の自由音場内にマイクロホンを置いたとき、その出力端子に生じる開放出力電圧と自由音場音圧との比のデシベル値。1 V/Pa」(JIS C5502より)

定格感度レベルは、1 kHzにおける基準軸方向の感度レベルを指す。

例えば、1 Paの平面進行1 kHz正弦波を基準軸で受けたときに出力端子で0.01 Vが測定されたとすると、マイクロホン感度は $10\log\left(\frac{0.01}{1}\right)^2=-40$ dBVである。


ブランド マイク 感度(mV/Pa) 感度(dBV)
DPA 4003 45 -27
DPA 4006 10 -40
DPA 4090 20 -34
DPA 4091 6 -44.5
Sennheiser 8050 20 -34
Shure BETA 57A 2.8 -51

D.I.

DI (Direct Injection)は、エレキギター、エレキベースなど出力インピーダンスの高い楽器をミキサーに送る際に使用される。入力端子は標準フォン、出力端子はXLRであることが多い。

LINK端子は入力された音をそのまま出力するため、ギターアンプなどに接続するときに使用する (自分の演奏をモニタすることが可能になる)。

DIはインピーダンスを調整するとともに、アンバランス入力をバランス出力にする。そのとき接地を切り離すためにLIFTスイッチが用いられる。

ミキサーからファンタム電源を供給できない場合には電池駆動をする。

最小可聴限の近似式

$\displaystyle T_q\left(f\right) = 3.64\left(\frac{f}{1000}\right)^{-0.8} - 6.5e...
...}-3.3\right)^2} + 10^{-3}\left(\frac{f}{1000}\right)^4 \quad \mathrm{[dB SPL]}
$

where $f$ is frequency in Hz.

from Terhardt, E., “Calculating Virtual Pitch,” Hearing Research, pp.155–182, 1979.

臨界帯域とERB

Zwickerのレター[1]によると、「臨界帯域では、周波数幅は決まっているようだが、その中心周波数は移動するもよう」「ISOの会合において、preferred frequencies(63, 125, 250, 500...という周波数群)とも対応するような臨界帯域を決めたいということになった」という記述がある。つまり、中心周波数はいろいろなのできっちり決めることはできないけれど、実用のために中心周波数はpreferred frequencyと合わせてしまい(特に臨界帯域3, 9, 18の中心周波数を250 Hz, 1 kHz, 4 kHzとした)、それらを基準として周波数成分の分解をする帯域を実用上決めたのだった。

Moore and Glasberg [2]には、「臨界帯域は帰納的な方法で考えられていて、特に低周波数領域での振る舞いに疑問がある」と書かれている。たしかに500 Hz以下では臨界帯域とERBはずれている。

Traunmllerの臨界帯域の計算式は[3]に書かれている。この文献には「ERBは周波数分解能の指標で、臨界帯域は周波数局在性の指標と考えられる」とあった。周波数$f$から臨界帯域番号$z$を計算する式は

$\displaystyle z = \frac{26.81 f}{1960 + f}-0.53
$

となるが、低周波数と高周波数においては以下の補正が行われる。
$\displaystyle z'$ $\displaystyle =$ $\displaystyle z + 0.15\left(2 - z\right), \quad z<2.0$  
$\displaystyle z'$ $\displaystyle =$ $\displaystyle z + 0.22\left(z - 20.1\right), \quad z>20.1$  

反対に臨界帯域番号$z$から周波数$f$を計算する式は

$\displaystyle f = \frac{1960\left(z + 0.53\right)}{26.28 - z}
$

となる。

臨界帯域の周波数幅は、補正前の臨界帯域番号を用いて、以下の式で計算できる。270〜5800 HzでZwickerの臨界帯域表とは±6%の範囲で一致するそう。

$\displaystyle B = \frac{52548}{z^2 - 52.56z + 690.39}
$

録音に必要なディスク容量

録音に必要になるディスク容量(バイト)は、以下の式で目星がつけられる。ただし、サンプリング周波数(sampling frequency)はHz、時間(time)は秒、チャンネル数(channels)は数、量子化ビット数(quantization bits)はビットを単位とする。

$\displaystyle \mathrm{channels} \times \mathrm{sampling frequency} \times \frac{\mathrm{quantization bits}}{8} \times \mathrm{time}
$

たとえば8 ch/48 kHz/24 bitをリニアPCMで15分間録音するのなら、最低でも $\displaystyle\frac{8 \times 48000 \times \frac{24}{8} \times (15 \times 60)}{1000\times 1000} = 1036.8$MBが必要。

Pink-TSP

Pink-TSP信号とその逆フィルタは離散周波数領域で次のように定義されている。 [4][5]

\begin{displaymath}
H(k) = \left\{
\begin{array}{ll}
1 & \qquad k=0 \\
\exp(j...
...leq N/2 \\
H^{*}(N-k) & \qquad N/2<k<N
\end{array}\right.\\
\end{displaymath}

ただし、 $\alpha (N/2)\log (N/2)=2m\pi$

\begin{displaymath}
H^{-1}(k) = \left\{
\begin{array}{ll}
1 & \qquad k=0 \\
\...
...q N/2 \\
H^{-1*}(N-k) & \qquad N/2<k<N
\end{array}\right.\\
\end{displaymath}

ここで$N$は信号長で、$N=2^i$$m$はパルスの幅を決める整数のパラメータで、大きければパルスの幅が広くなる。

残響時間の計算式

Sabineによる残響式

$\displaystyle T = K\frac{V}{S\overline{\alpha}}
$

where $V$ is volume of the room ($m^3$), $S$ is surface area ($m^2$), $\overline{\alpha}$ is average absorption ratio, and a coefficient $K=\frac{24}{c\log_{10}e}\approx 0.161$ ($c$ is the speed of sound).

残響時間が短くても使えるのがEyringの式

$\displaystyle T = -K\frac{V}{S\log_{e}\left(1-\overline{\alpha}\right)}
$

さらに空気によるエネルギーの吸収$m$を考慮したKnudsenの式

$\displaystyle T = -K\frac{V}{S\log_{e}\left(1-\overline{\alpha}\right)+4mV}
$

逆に、Eyringの式から平均吸音率を求めることもできる。

$\displaystyle \overline{\alpha} = 1-\exp\left(-\frac{K\cdot V}{S\cdot T}\right)
$

室内音響指標 (ISO 3382-1:2009より)

Sound Strength (dB)

Sound Strengthは、ある地点で計測した無指向性音源からの音の強さと、自由音場にて音源から10mの地点で計測した音の強さとの比5。ある計測点での時刻$t$における音圧を $p\left(t\right)$、音源から10mの位置での音圧を $p_{10}\left(t\right)$とすると、

$\displaystyle G = 10\log_{10}\frac{\int_{0}^{\infty}p^2\left(t\right)\mathrm{d}t}{\int_{0}^{\infty}p_{10}^2\left(t\right)\mathrm{d}t} \quad\mathrm{dB}
$

それぞれの実行値をデシベルで表し、差をとっても良い。つまり

$\displaystyle G = L_{pE}-L_{pE,10} \quad\mathrm{dB}
$

ここで
$\displaystyle L_{pE}$ $\displaystyle =$ $\displaystyle 10\log_{10}\left(\frac{1}{T_0}\int_{0}^{\infty}\frac{p^2\left(t\right)\mathrm{d}t}{p^2_0}\right) \quad\mathrm{dB}$  
$\displaystyle L_{pE,10}$ $\displaystyle =$ $\displaystyle 10\log_{10}\left(\frac{1}{T_0}\int_{0}^{\infty}\frac{p_{10}^2\left(t\right)\mathrm{d}t}{p^2_0}\right) \quad\mathrm{dB}$  

ただし $p_0$=20 $\mu$Pa、$T_0$=1 秒とする。$t=0$は直接音の開始時刻、$t=\infty$は減衰量が30 dB以上となった時刻もしくはそれ以降の時刻。

さらにISO 3382-1には注釈として「残響のある場所で$L_{pE,10}$を計測・推測する方法」「定常音を用いた測定法」が説明されている。

Clarity (dB)

$\displaystyle C_{t_1} = 10\log_{10}\frac{\int_{0}^{t_1}p^2\left(t\right)\mathrm{d}t}{\int_{t_1}^{\infty}p^2\left(t\right)\mathrm{d}t}
$

$t_1$は初期反射音と後続残響音の境目になる時刻。$C_{80}$のとき音楽の明瞭性と相関が高いとされ、Clarityと呼ばれる。$C_{50}$は音声で使われる。

Definition (%)

$\displaystyle D_{t_1} = \frac{\int_{0}^{t_1}p^2\left(t\right)\mathrm{d}t}{\int_{0}^{\infty}p^2\left(t\right)\mathrm{d}t}
$

$t_1$は初期反射音と後続残響音の境目になる時刻。$D_{50}$のとき($t_1=0.05$のとき)に音声の明瞭性と相関が高いとされる。

じつは$C_{t_1}$$D_{t_1}$には以下の関係があるので、どちらか一方を知っているだけで良い。

$\displaystyle C_{t_1} = 10\log_{10}\left(\frac{D_{t_1}}{1 - D_{t_1}}\right) \quad\mathrm{dB}
$

音声の明瞭度に関してはSpeech Transmission Index (STI)なども参考になる。

時間重心 Ts (s)

$\displaystyle T_s = \frac{\int_{0}^{\infty}tp^2\left(t\right)\mathrm{d}t}{\int_{0}^{\infty}p^2\left(t\right)\mathrm{d}t}
$

時間重心はC値やD値のように、初期と後期に明確に分けることがない。

Melと周波数$f$の変換式

$\displaystyle \mathrm{mel} = \log_e\left(1 + \frac{\mathrm{f}}{700}\right)\cdot 1127
$

$\displaystyle \mathrm{f} = 700\cdot \exp\left(\frac{\mathrm{mel}}{1127} - 1\right)
$

http://en.wikipedia.org/wiki/Mel_frequency_scale

Fant, C G M “Analys av de svenska konsonantljuden” LM Ericsson protokoll H/P 1064, 1949: 139pp. referenced on p. 48 of Fant, G “Speech Sounds and Features”, MIT Press, 1973.

Stevens, S.S. & Volkmann, J. (1940) The relation of pitch to frequency: A revised scale. The American Journal of Psychology, v.53, n.3, pp.329–

O'Shaughnessy, D. (1978) Speech communication: Human and machine. Addison-Wesley, New York, p.150.

Fant is the more appropriate reference (for log(1+f/1000)) and O'Shaugnessy for log(1+f/700).

バンドパスフィルタのエッジ周波数

バンドパスフィルタの周波数帯域 (bandwidth) を指定する方法はいくつかあるが、中心周波数$f_C$からエネルギーが$-3$ dBの周波数 (の高いほう$f_H$と低いほう$f_L$) の幅とすることが多い。エネルギーが$-3$ dBなので、音圧は半分であることに注意。

図 1: バンドパスフィルタの帯域幅
\includegraphics{bandwidth.eps}

オクターブのとき

たとえば1オクターブバンドと言うときには$f_H$$f_L$の1オクターブ上(周波数2倍)であるため、$f_H=2f_L$が成り立つ。

また、$f_C$は対数軸上において$f_H$$f_L$の算術平均値であるので、

$\displaystyle \log_{10}f_C$ $\displaystyle =$ $\displaystyle \frac{\log_{10}f_L + \log_{10}f_H}{2}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \frac{1}{2}\log_{10}(f_L \cdot f_H)$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \log_{10}(f_L \cdot f_H)^\frac{1}{2}$  
$\displaystyle f_C$ $\displaystyle =$ $\displaystyle (f_L \cdot f_H)^\frac{1}{2}$  

と、線形軸では幾何平均で計算できる。

中心周波数が1 kHzの1オクターブバンドの例

$f_H=2f_L$ $f_C=(f_L \cdot f_H)^\frac{1}{2}$を連立させて解くと、

$\displaystyle 1000$ $\displaystyle =$ $\displaystyle (f_L \cdot 2f_L)^\frac{1}{2}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle (2f_L^2)^\frac{1}{2}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \sqrt{2}f_L$  
$\displaystyle f_L$ $\displaystyle =$ $\displaystyle \frac{1000}{\sqrt{2}}$  
$\displaystyle $ $\displaystyle \approx$ $\displaystyle 707.11$  
$\displaystyle f_H$ $\displaystyle =$ $\displaystyle 2f_L$  
$\displaystyle $ $\displaystyle \approx$ $\displaystyle 1414.21$  

Q値を使うとき

Q値は次のように定義される。

$\displaystyle Q = \frac{f_C}{f_H - f_L}
$

中心周波数が帯域幅と等しいときにQは1となり、帯域幅が狭くなるとQ値が大きくなる。

$f_C$が対数軸上において$f_H$$f_L$の平均値であることはオクターブバンドのときと同じ。

中心周波数が1 kHz、Q値が1のときの例

Q値が1なので、 $f_C = f_H - f_L$である。これを $f_H = f_C + f_L$と変形し、 $f_C=(f_L \cdot f_H)^\frac{1}{2}$に代入して解いてゆく。

$\displaystyle 1000$ $\displaystyle =$ $\displaystyle \left(f_L \cdot \left(1000 + f_L\right)\right)^\frac{1}{2}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \left(1000f_L + f_L^2\right)^\frac{1}{2}$  
$\displaystyle 1000f_L + f_L^2$ $\displaystyle =$ $\displaystyle 1000^2$  

2次方程式の解の公式

$\displaystyle x = \frac{-b\pm\sqrt{b^2-4ac}}{2a}
$

を使う。$\pm$のうち負値は使わないので、以下では正のみにしてある。
$\displaystyle f_L$ $\displaystyle =$ $\displaystyle \frac{-1000+\sqrt{1000^2-4\cdot 1\cdot (-1000000)}}{2\cdot 1}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \frac{-1000+\sqrt{5000000}}{2}$  
$\displaystyle $ $\displaystyle \approx$ $\displaystyle \frac{-1000+2236.07}{2}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle 618.03$  

また、 $f_C = f_H - f_L$より、 $f_H = f_C + f_L = 1618.03$となる。

オクターブバンドとQ値の関係

1オクターブ上昇は周波数2倍と等しいので、$f_L$に対する$f_H$のオクターブ幅は次のように計算できる。

$\displaystyle v = \log_2 \frac{f_H}{f_L}
$

一方でQ値は以下の式で与えられていた。

$\displaystyle Q = \frac{\sqrt{f_C}}{f_H - f_L} = \frac{\sqrt{f_H\cdot f_L}}{f_H - f_L}
$

オクターブ幅の式を以下のように対数をはずして変形し、
$\displaystyle 2^v$ $\displaystyle =$ $\displaystyle \frac{f_H}{f_L}$  
$\displaystyle f_H$ $\displaystyle =$ $\displaystyle 2^v\cdot f_L$  

これをQ値の式に代入して整理してゆくと、オクターブ幅からQ値への変換式が得られる。
$\displaystyle Q$ $\displaystyle =$ $\displaystyle \frac{\sqrt{2^vf_L\cdot f_L}}{2^vf_L - f_L}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \frac{\sqrt{2^v}f_L}{\left(2^v-1\right)f_L}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \frac{\sqrt{2^v}}{2^v-1}$  

1オクターブ幅のときの例


$\displaystyle v$ $\displaystyle =$ $\displaystyle 1$  
$\displaystyle Q$ $\displaystyle =$ $\displaystyle \frac{\sqrt{2^1}}{2^1-1}$  
$\displaystyle $ $\displaystyle =$ $\displaystyle \sqrt{2}$  

フィルタの次数と減衰量の関係

信号処理において$n$次の低域フィルタは$20n$ dB/decの減衰傾度 (attenuation factor) がある。ここでdec (decade)は周波数が10倍になる周波数幅。音響ではdB/octが用いられることが多いので、変換すると

$\displaystyle y  \mathrm{(dB/oct)} = \frac{x  \mathrm{(dB/dec)}}{\log_{2}{10}}
$

である。 $\log_{2}{10}\approx 3.32192809$より $\frac{20n}{\log_{2}{10}}\approx 6.02059991$なので、$n$次のフィルタの減衰傾度は約$6n$ dB/octである。

シンセサイザーなどに搭載されているフィルタに「24 dB/oct」という表記がある場合、 $24\div 6=4$次のフィルタが使われていることが分かる。

標準規格など

音の客観・主観評価などに関係する標準規格へのリンク。

標準音源

MARUI Atsushi
2024-03-13