音声を用いた音響情報圧縮形式の音質の違い

近年携帯オーディオプレーヤーの普及により、音響情報圧縮も一般的になってきており、インターネットを通じて動画やラジオを楽しむオンデマンド配信やポッドキャスト等が急激に普及している。また、地上デジタル放送でも音響情報圧縮技術が使用されている。しかし、使用されている圧縮技術は各メディアで異なる。その中でどの圧縮形式が最も原音に近いのかを男性・女性それぞれの音声を用いて聴取実験によって考察した。

今回対象となった圧縮形式は現在主流となっているWindows Media Audio・MPEG Audio Layer-3・Real Media・Advanced Audio Codingの4つである。これに原音を含めた5種類の音源に各音源のビットレート16kbpsと32kbpsの2種類を作成し、計10個の音源を使用して聴取実験を行った。

実験の結果、男性音声と女性音声とでは判断の差は無かった。原音に最も近いと判断されたのはAACの32kbpsだったが、各コーデック間での違いよりビットレートでの違いが人間の判断に対し影響が大きいという結果が出た。それを踏まえて原音と最も離れているのはmp3と AACの16kbpsだった。

各ビットレート間でも、16kbpsではばらつきがあったが、32kbpsではある程度近い位置に布置されていたことにより、音声では32kbps以上はコーデック間でそれほど差が無いということが判明した。また、2つの音声での実験の結果から、Real Mediaの32kbps原音と差があるように判断されたのに対し、16kbpsでは原音に近いと判断された。これに関しては何か原因・要因はあると思われるが、それが何なのかまでは今回の実験では分からなかった。