2014年6月5日木曜日

iFIオーディオ主任エンジニア、トルステン博士かく語りき(2)連載インタビュー

前回からの続き)−−−−AMRとiFiでは、それぞれに価格レンジが全く対極にある製品がラインナップしています。開発設計の責任者として両方のブランドで苦労されてきた点や、チャレンジしてきたことを教えて下さい。

AMR、iFiともども、設計のあらゆる局面で一緒に携わっている強力な開発チームがいます。私の役割は重要ではありますが、私はそのチームワークの中で、最終設計を担当する数人のうちの一人に過ぎません。

チャレンジは相違していると同時に似通ってもいます。最も重要なことは、それぞれの製品に対して可能な限り最高のサウンドクオリティーを実現することです。このことはiFiでもAMRでも同じことです。唯一異なっているのは、製品をつくる際の制約の部分です。

スーパーハイエンドのAMRでは、技術的な面や、パーツ選定において広く設計の自由があり、コストや時間の問題をほとんど度外視しながら、もはや製造されていないまったくのデッドストックのパーツを使うことにこだわっても大丈夫です。例えば10〜20年ものの新品のデッドストック(いわゆる「新古品」)DACチップや、50年ものの新品のデッドストック真空管であっても、取り入れることができます。回路の細かな側面を完成するのに1年かかる? いや、2年かけてもいい。実際にそれだけかかるのなら、そうするしかないのです。

一方iFiでは、私達は時間とコストの制限と戦わなければなりません。利用可能な技術を使い、ひとつの設計を仕上げるのに数年をかけるということはありません。新製品を、もっとずっと迅速に発売できることが必要なのです。

“多くのメーカーにとってアプリケーションノート(テクニカルシート)は絶対基準であると思いますが、私たちにとっては、単に最低限のパフォーマンス基準であり、設計のスタート地点に過ぎません”

それでも、どちらのブランドでも、私たちは通常とは違う解決法を用いることができ、また実際にそうしています。アプリケーションノートに従って、“クッキーの型抜き”のような型どおりのやり方に自らを限定するようなことはしません。多くのメーカーにとってアプリケーションノートは絶対基準であると思いますが、私たちにとっては単に最低限のパフォーマンス基準であり、実際の設計のスタート地点に過ぎません。超ハイエンドの製品を設計して実際に発表するということを通じて、私たちはiFi製品に使われることになるものを選定し、発表するにあたっての、確かで安定した手段を得ているのです。

最終的に、iFiの製品はまさにAMRと同じ“ハイエンド”のDNAを持ち、AMRの“ハイエンド”製品と同様に細心の注意を払って組み立てられます。iFiの場合、超ハイエンド製品に必要とされる最終のリファインの工程を一部簡略化することでコストを下げていますが、基本的なパフォーマンスは等しく私たちのベストを尽くしています。

左からAMR CD-77 (製造中止でストックのみとなったTDA-1541A DACチップセット、及びMullard製真空管を使用) 、 iFi nano iDSD とnano iCAN
−−−−iFiのラインナップには“PCM/DSD/DXDなど、全てのハイレゾフォーマットのネイティブ再生に対応する”「nano iDSD」があります。一般のDSD再生の周辺環境と実際の“DSDネイティブ再生”には多少の混同がありますが、“ネイティブ”とはどういう意味なのかを、この背景の中で説明していただけますか?

PCMとDSDは根本的に異なるフォーマットです。このことは、PCMとDSDのデジタル波形の手を加えていないデジタル出力を観察すれば、明らかになります(Delta Sigma、Bitstream、DSDは、実は基本的には同じ処理に対する異なった商標名)。

PCM vs. DSD – Wikipedia.org

それぞれのフォーマットは、それぞれ異なる長所と短所を持っています。詳しい背景と歴史については、もう一つの論文を参照してください(追加資料後日掲載)。キーとなる論点を要約すると、あるフォーマットを他のフォーマットへ変換する際にはいつも、私たちが完全な世界にでもいない限り、データロスのない完全なフォーマット変換は絶対に不可能であるということです。さらに悪いことに、変換の過程行程で私達は(1)フォーマットが起こす例外は何であれ取り除き、 同時に(ii)もう一方のフォーマットの限界をそれに押しつける傾向にあります。

24bit /352.8kHz (DXD-PCM)のフォーマットから1-bit/2.822MHz (DSD)に変換する場合、DSDシステムがカバーできるのはわずか12.5%の タイムドメイン情報であるのにもかかわらず、私たちはPCMフォーマットがカバーできる約99.6%の振幅情報を捨てなければなりません。DXDからDSDへ変換した場合には、1-bit/ 2.822MHzから24bit/352.8kHzになります。理論的には全てを振幅情報にリマップできるとしても、DSDのタイムドメインの87.5%を捨てることになります。つまり事実上は、両フォーマットからベストというよりも、むしろ最悪のものを取り出してしまう結果になるのです。

Analogue Devices (AD)、旭化成マイクロデバイス(AK)、Cirrus Logic(CS)、ESS(ES)、Texas Instruments(PCM)、そしてWolfson Micro(WM)といった、近年のADC/DACパーツは、一般的にPCMを主体とした市場を対象に開発されています。言い換えると、産業的にはレコーディング/編集/マスタリング/リリースの全てがPCMフォーマットで行われているため、ADコンバーターは一般的にPCMを出力し、DAコンバーターはPCM入力で受けることを想定しており、これらはこのオペレーションに最適化される傾向があります。にもかかわらず、それぞれのDACの中では、基礎をなす変換メカニズムとして、Delta Sigma (言い換えれば1-bit) の一種が使用されているのです。

現在製産されているDACは、一般的にワンチップに統合された、デジタルフィルタリングとデジタルボリュームコントロールによる完全なPCMオーディオパスを搭載しています。デジタルフィルターとデジタルドメインボリュームコントロールはPCMフォーマットでしか動作しません。DSD再生については、ほんのオマケとして 、マーケティング的なニーズから“流行に合わせる”ために付け足されていることが多くあります。DSDをまず最初にPCMへ変換しないDACは、どれもDSD専用のデジタルボリュームコントロールやデジタルフィルターを搭載することはできません。

“DSDをまず最初にPCMへ変換しないDACは、どれもDSD専用のデジタルボリュームコントロールやデジタルフィルターを搭載することはできません”

これらの特徴を踏まえた上で、DSDはまずPCMへ変換され、デジタルフィルター処理が行われ(この段階ではPCMからDSDのデータストリームに変換されるすべての問題が、そしてまたデジタルフィルターの全ての問題が加わってしまうのですが)、ようやくマルチビット Delta Sigmaの信号に変換されます。つまりDACチップと呼ばれるブラックボックスの心臓部分で、望ましくない変換を二重にすることになるのです。

DSDではなく、PCMに的を絞った昨今のDACチップセット。Analogue Devices(AD)、旭化成マイクロデバイス(AK)、 Cirrus Logic(CS)、 ESS(ES)、 Texas Instruments(PCM)、Wolfson Micro(WM)の出しているようなADC/DAC

DSDをまずPCMに変換してからPCM信号として処理し、マルチビットDelta Sigma(Multi Bit Sigmaは未だに1-bitのテクノロジーで、多くのものは並行して走らせているだけです。これは本物のマルチビットDACを走らせるのとは大きな違いがあります)に戻して再生しています。これはつまり、DSDを直ちにPCMに変換してPCM信号として出力しているということで、多くの「DSD対応DAC」と呼ばれる製品で採用されています。Wolfson Microのチップの中に、オプションとしてDSDからPCMへの変換、デジタルフィルター、デジタルボリュームをバイパスして、DSDを直接変換するものもありますが、この場合はDSD信号に最適化しながら、50kHz対応のローパスフィルターを搭載するアナログ回路が必要になります。私は今日に至るまで、このWolfson Microのチップを“ダイレクトDSD”モードで使っているDSD DACを目にしたことはありません。

“ですから通常は、現代のコンバーターでPCM音源とDSD音源を聴いて音の違いがあったとしても、厳密に言えば、それでそれぞれのフォーマットの相対的な長所について何かがわかるわけではなく、変換のアルゴリズムばかりがわかるだけなのです。”

ですから通常は、現代のコンバーターでPCM音源とDSD音源を聴いて音の違いがあったとしても、厳密に言えば、それでそれぞれのフォーマットの相対的な長所について何かがわかるわけではなく、変換のアルゴリズムばかりがわかるだけなのです。

理想なのは、PCMを、真のマルチビットDAC(オリジナルのADC音源が何であるかは問題ありません – 変換処理とそれによるロスの段階を常に一段省くことになるからです)を用いて、PCMとして再生することです。そして私たちは、DSDを、デジタルドメインでは一切変換処理することなく(オリジナルのADC音源が何であるかは問題ありません – 変換処理とそれによるロスの段階を常に一段省くことになるからです)、純粋なDelta Sigmaとして再生します。これが、私たちが“ネイティブ”再生と呼んでいるものなのです。DSDはDSDのままで、直接アナログに変換されます。PCMはPCMのままで、直接アナログに変換されるのです。

iFi Audioのnano iDSD (そして近々発売予定の全てのiDSDレンジ)では、これを提供するためならなんでもやろうと思っています。DSDとPCMの両方を適切に扱えるDACチップをすぐにも見つけることは大変な難題でした。メーカーは一般的にチップの内部に関する情報を公開したがらないので、本当はどんな処理が行われているのか知るためには、実際のパーツを手に入れてから独自に入念なテストをしなければならないのです。

nano iDSDで使っているDACチップでは少し変わった処理を行っています。PCMオーディオの上位 6bitの信号に対して、6bitトゥルーマルチビットDACを用いることで、Burr Brown のマルチビットDACの有名な特質である、暖かいと同時に定位のピシッと定まったサウンドを実現しているのです。これより下位のビット情報は全て、等級の低い256スピードのDelta Sigma変調器により(事実上のDSD256)変換され、PCM再生に、Delta Sigma DACとDSDの有名な特質である滑らかなサウンドを提供します。

Burr-Brownの真にネイティブなDSD/PCMチップセット – PCMとDSDをネイティブに処理

DSDの再生時には、同じDelta Sigma変調器が、直接DSDのビットストリームからアナログ信号に変換する形で使用されます。もちろん、DSDに使うことができるデジタルフィルターやデジタルボリュームコントロールは存在しないので、これらの機能は元々あるべきアナログドメインに追加しなければなりません。

−−−−DoP再生のベネフィットは あると思いますか?

この問いの答えについては、よく議論されるように再生の側だけでなく、そもそもの録音から再生までの流れ全体で考える必要があります。

私は、DSD(そして残念なことにネイティブPCMも)は、LPやCDのように歴史的なフォーマットと見なしています…。ネイティブPCMでの録音・再生、またはネイティブDSDの録音・再生のどちらかが、それぞれのフォーマットでの最高品質を提供するでしょう。しかし現実の世界で、これは稀なケースです。

現代ではまだネイティブDSD対応のADC・DACはとても珍しく、ネイティブPCM対応のそれはさらに稀なので、特にハイブリッドタイプのADCやDACにおいては比較自体が無意味です。

リンゴとオレンジそのものの魅力を比較することは無意味ですが、例えばリンゴとオレンジをフリーズドライして、ジュースの粉にして 水や砂糖と混ぜるといった加工の手順を経てできたものの味や出来映えについては比較ができます。新鮮な絞り立てのオレンジジュースと濃縮還元のオレンジジュースについては、これはもう比べるまでもありません。

確かなことは、ネイティブDSDは、DSDからPCMやハイブリッドPCMに変換した信号よりもメリットが大きいということです。そしてネイティブPCMには、DSDに変換されたPCM信号よりもメリットがあります。

−−−−さらに高いサンプリングレートのPCMデータも話題になりつつあります。192kHz/24bitはより低いサンプリングレートの音源よりもクオリティが低いと主張する人がいます。Monty Montgomery氏もその一人ですhttp://xiph.org/~xiphmont/demo/neil-young.html。192kHzやDXDを含む、ハイサンプリングレートのハイレゾが登場してきたことについてはどう感じていますか。

そうですね、Montgomery氏が主張している、人間の聴覚には限界があるという持論には一理があります。ただ、彼は人間が実際に聴き、認識できるものの限界については、それほど正確に解明していないと思います。

人間の聴覚メカニズムは驚異的です。それは全体がデジタル方式の“トランスデューサー”(有毛細胞)と、高機能なノンリニア・アコースティックシステム(外耳道、隔膜、繋がった骨や腱等々)の組み合わせにより構成されています。正のフィードバック(正帰還)を使って、小さな音を増幅することさえやってのけます。そしてこのフィードバックが本来の軌道を外れると、耳鳴りの原因のひとつになるのです。時には、耳鳴りのような音が聞こえている人の隣に立っている人がその音を聴くことができるような微少な音圧レベルでも、耳は振動することがあるほどです! こうして、獲得されたデジタル信号は、学習によって相当な種類のサウンドに反応することができるアナログコンピューターに相当するもの(つまり脳)を使って処理されるのです。

人間の聴覚器官


もしも人間の聴覚が(電気による)機械的なサウンド録音・解析システムの総体だとしたら、設計がめちゃくちゃで全然役に立たないものに思われるはずです。しかしながら一方で、それは同時に例外的なアコースティック解析の能力といえる「聴覚」を我々にもたらしました(それを私たちはとりあえず「聴覚」と呼んでいるのです)。実際私たちは、脳内の神経システムに“つなぐ”ことのできる、実用的な人工聴器官の製造にはまだ辿り着いていないのですから。機械でそれを再現できるほどまでには、人間の聴覚システムをまだ十分には理解していないのです。

実のところ、人間の(そしてある程度は動物の)聴覚は、“インテリジェントデザイン”(訳注/宇宙や生命体は高度に知的な存在によって創造されたものであるとし、進化論を認めない主張)の賛否の議論にも役立ちそうです。通常自然は与えられた問題に対して、最もシンプルに実現可能性を描ける解決方法にめがけて進化します。極端に精巧なシステムができることは稀です。従って極端に複雑で、反単純化されている人間の聴覚は、“インテリジェントデザイナー”によってのみ作られることが可能であるというのです。同様に、まったく気の狂った人なら、人間の聴覚にアコースティックな感覚を与えているこのルーブ・ゴールドバーグ・マシン(訳注/アメリカの漫画家ルーベン・L・ゴールドバーグの漫画が起源。簡単にできそうなことをするのに、わざわざ手の込んだ仕組みや機械を作ること)のような珍奇な仕組みを、作るかもしれません。ですからそれは、進化の目に見えない力だったに違いないのです。

形而上学的なことはさて置き、私たちは、オオハシ氏を始めとする人々の研究を通じて、たとえば音楽を聴く時には音を超越した何かも知覚しているのだという証拠を得ています。Lee/ Geddes氏、 J.J. Johnston氏、他の多くの人々が、私たちは何をどのように聴いているのかという知識の境界を押し広げ続けています。多くの先端研究の成果が伝えることは、 私たちはあらゆる領域における人間の聴覚認知を過大にも過小にも評価してきたがゆえに、一般的に伝えられている音の周波数や大きさおける認識限界の数値は必ずしも正しいものではないと考えられるということです。私たちが、何が聞こえていて、何が聞こえないのかを断言できるようになるまでには、まだ多くの研究が必要です。(続く)

(翻訳:山本敦)
AudioStreamのインタビュー記事より 原文

0 件のコメント:

コメントを投稿