2018年11月9日金曜日

ギブズ・トランジェント・オプティマイズド・デジタル・フィルター;ほんものの音楽のようなトランジェント

iFi製品用の新しいファームウェア5.30Cが公開されました。
以下はそこで採用された新しいデジタル・フィルターGTO™(ギブズ・トランジェント・オプティマイズド)のテクニカル・ノートです。

GIBBS TRANSIENT OPTIMISED DIGITAL FILTER; TRANSIENTS LIKE REAL MUSIC. 


-->

GTO™(ギブズ・トランジェント・オプティマイズド)デジタル・フィルター:ほんものの音楽のようなトランジェント。


INTRODUCING THE IFI GTO™ DIGITAL FILTER  iFiのGTOデジタル・フィルターを紹介します


ALL DIGITAL FILTERS FOR AUDIO ARE WRONG.
ALL OF THEM, INCLUDING THE 'NO FILTER' OPTION.
THIS IS WHY WE NEED YET ANOTHER FILTER!
オーディオ用のすべてのデジタル・フィルターは間違っています。
「フィルターなし」のオプションも含んで、そのすべてが間違っているのです。
だからこそ、さらにもうひとつのフィルターが必要なのです!

All digital filters (including no filter) differ in how they are wrong and how this influences objective measured performance as well as subjective listening performance with music and indeed, specific types of music. All digital filters add specific distortion signatures in either time vs. amplitude domain or frequency vs. amplitude domain. These distortions become all the more relevant the lower the sample rate. So, the most abundant digital music source - CD quality - is most impacted with greater possible audible consequences than High-Res content.
すべてのデジタル・フィルター(「フィルターなし」も含む)はそもそも間違っているのですが、その間違い方は、フィルターによってそれぞれ異なります。そしてそのことが音楽の(実際、特定のタイプの音楽の)客観的な測定にも、主観的な聴取にも影響を与えるのですが、その影響の与え方も、フィルターによってそれぞれ異なります。すべてのデジタル・フィルターは、「時間対振幅」の領域、あるいは「周波数対振幅」の領域のどちらかにおいて、特定の歪み特性を加えます。これらの歪みは、サンプリング・レートが低ければ低いほど、ますます大きな影響を与えます。ですから、いちばん普及している音楽ソース(=CD品質16Bit/44.1KHz)の方が、聴感上、ハイレゾ音源よりも大きな影響を受ける可能性を持っているということです。


Wherever there is a difference, there is also a preference. Subjective listening preference may be informed by a range of factors including a learned or acquired response to recorded sound (e.g. what sounds ‘right’ or ‘hifi’ is not what sounds natural in comparison to a live performance), including direct referencing acoustic music performances.
違いがある時はいつでも、好みの違いも生じます。主観的な聴取の好みは、録音されたサウンドに対する学習・習得された反応(たとえば、「正しく」聞こえる、あるいは「ハイファイに」聞こえるというのは、ライブ演奏と比較した時にナチュラルに聞こえるということではありません)を含む、そしてまたアコースティックな音楽演奏を直接参考にすることを含む、様々な要因から情報を得た結果生み出されるのかもしれません。

However, with sufficient data from extensive listening tests and some inductive thinking, one should be able to propose and implement a digital filter that offers substantial improvements in removing ultrasonic noise over the ‘no filter’ (non-oversampling) case while avoiding as much as possible erring too far in the other direction with excessive and audible ringing.
しかしながら、幅広い聴取テストと、ある程度の帰納的思考の結果得られた十分なデータがあれば、「フィルターなし」(オーバーサンプリングなし)の場合の超音波ノイズを除去するにあたって、他の方向で大きな間違いを犯す(耳に聞こえるほどのリンギングを伴う)ことをできるだけ避けながら、相当な改善を生み出すデジタル・フィルターを提案し、実現することができるはずです。

So here it is - the ever so musical iFi GTO™ Digital Filter in the Pro iDSD which is the first ever seen in any DAC. In due course, technological hurdles permitting, we will try to implement it as a firmware upgrade for just about all1 iFi audio digital products.
それが、あらゆるDACの中で初めてPro iDSDに搭載された、かつてないほど音楽的な、iFi GTOデジタル・フィルターです。順調に進んで、テクノロジー面でのハードルが許しさえすれば、iFiのデジタル・オーディオ製品のすべて(オリジナルのmicro iDACを除く)に対応できるファームウェアのアップグレードという形で、このフィルターを装備したいと考えています。

WHAT IS THE IFI GTO™ DIGITAL FILTER?The Gibbs Transient Optimised filter (GTO) is named after the ‘Gibbs phenomenon2’ in mathematics.iFiのGTO™デジタル・フィルターとは何か?

GTOは、Gibbs Transient Optimisedの略で、数学の「ギブズ現象」に因んで名付けられました。

Wikipedia referred to the Gibbs phenomenon as “the peculiar manner in which the Fourier series of a piecewise continuously differentiable periodic function behaves at a jump discontinuity. The nth partial sum of the Fourier series has large oscillations near the jump, which might increase the maximum of the partial sum above that of the function itself. The overshoot does not die out as n increases, but approaches a finite limit.”
Most crucially, this is one cause of ringing artefacts’ in signal processing which the GTO addresses.
ウィキペディア(https://ja.wikipedia.org/wiki/ギブズ現象)によると、「ギブズ現象」は以下のように解説されています。
「区分的連続微分可能な周期関数のフーリエ級数において、その関数が第1種不連続 となる点付近では、フーリエ級数のn 次部分和が大きく振動して、部分和の最大値が関数自体の最大値より大きくなってしまうことがあるという振る舞いのことを指す。この超過量は、高調波の周波数(つまり、部分和の項数)が増えても無くならず、ある有限極限値に近付く」。
いちばん重要なのは、これが、信号処理においてリンギングが人工的に生成される原因のひとつとなっていることであり、GTO™はそれに対処しようとしているのです。

Way back in May 2011, the parent company of iFi audio, AMR, pioneered an earlier version of this filter in the DP-777 digital processor where it was available as an ‘Organic’ filter. Since 2011, more time has been invested into producing a filter that offered both better compatibility and technical performance than non-oversampling, while delivering a transient optimised performance that differs as little from non-oversampling as possible, delivering the new GTO™ filter.
遡ること2011年5月に、iFiの親会社AMRは、このフィルターの初期バージョンをDP-777デジタル・プロセッサーで開発しました。そこではそれを「オーガニック・フィルター」として利用することができたのです。2011年以来、オーバーサンプリングなしのもの以上に対応性が高く、しかも技術面でのパフォーマンスも優秀な、そしてまたその一方で、オーバーサンプリングなしのものとできる限り異なることのない、トランジェントが最適化されたパフォーマンスを引き出すことのできるフィルター生み出すことを目指して、さらに多くの時間が費やされました。こうして、新しいGTOフィルターが生み出されたのです。
Non-oversampling Transient response vs Organic- Digital Filter AMR DP-777
オーバサンプリングなしのトランジェント・レスポンス対AMR DP-777のオーガニック・デジタル・フィルター
No doubt there will be extended debate if our GTO™ digital filter offers the right trade-off, compared to others. To us the two key qualities we sought was to shape of the unavoidable transient or time domain distortion so that is free of any ‘pre-ringing’ and that completes its impulse response within a fraction of the Haas (precedence effect) window; to remain in effect, inaudible to the human ear.
私たちのGTOTMデジタル・フィルターが、他のフィルターと比べて正しい「トレードオフ」〔有利な点と不利な点のバランス〕を提供することができているかどうかについては、色々な議論が生まれるに違いありません。私たちにとっては、私たちが追求した鍵となる2つの品質は、トランジェントあるいは時間領域の不可避な歪みを、「プリリンギング」がまったくないように形作ること、そしてそのインパルス反応を「ハース(先行音効果)・ウィンドウ」の微細な時間内で終了させるように形作ることでした。そうすれば、実質的に人間の耳には聞こえないままとなるのです。

What we really refer to when we are talking about ringing in digital filters is actually a form of ‘Echo’ or ‘Reverb’ where, in addition to the actual transient time-shifted lower amplitude, copies of the impulse are generated using delay lines (see also the transients and digital filters section later on).
デジタル・フィルターにおけるリンギングについて語る時に私たちが実際に指しているのは、「エコー」や「リバーブ」のことです。そこでは、実際のトランジェント・タイムの移行による低振幅に加えて、ディレイ・ラインを通じてインパルスのコピーが生成されているのです(後述の「トランジェントとデジタル・フィルター」の項もご参照ください)。

The human hearing itself is subject to an inherent transient post (impulse) ringing that completely decays within around 0.7mS (“Response of the human tympanic membrane to transient acoustic and mechanical stimuli: Preliminary results” Payam Razavi, Michael E. Ravicz et al - Hear Res. 2016 Oct; 340: 15–24.) (see also the transients and the human hearing section later on).
人間の聴覚自体は、内部のトランジェント・ポスト(インパルス)・リンギングの影響を受けますが、このリンギングは0.7ミリ秒(700μ秒)以内に完全に消失します(《一過性の音と機械的刺激に対する人間の鼓膜の反応:予備結果》 パヤム・ラザビ、マイケル・E・ラビッツ他 - Hear Res. 2016年10月、340:15-24)(後述の「トランジェントと人間の聴覚」の項もご参照ください)。

The GTO filter’s transient post-ringing decays completely within 0.72mS for a 44.kHz source, ensuring that the unavoidable blurring of the transient response cannot be heard, but is integrated by the human hearing into the original transient.
GTOTMのフィルターのトランジェント・ポスト・リンギングは、44.1kHzの音源で、0.72ミリ秒(720μ秒)で完全に消失します。つまり、トランジェント・レスポンスにとって不可避な滲みが聞こえることがなく、人間の聴覚によってオリジナルのトランジェントに統合されることが確保されるのです。

This is in stark contrast to some alternative filter concepts. For example, the ‘Transient Aligned’ filter seeks a maximum number of taps, leading to an impulse response that falls well outside the Haas window. ie. its ‘ringing’ is very audible, in part because there is a preringing (or pre-echo) present and in part through the sheer length of the delay line used.
これは、他の代替フィルターのコンセプトとは際立った対比となります。たとえば、「トランジェント・アラインド」フィルターは、最大限の数のタップを探し求めるので、その結果「ハース・ウィンドウ」のずっと外に着地するインパルス・レスポンスへと至ります。つまり、「リンギング」が非常に大きく聞こえるのです。それは、「プリリンギング(あるいはプリエコー)」が存在するからであり、また、使用されているディレイ・ラインの長さによってリンギングが生じるからです。

For example, the 16k tap Transient Aligned filter in the Pro iDSD has an impulse response with equal pre- and post-ringing trail of around 186mS @ 44.1kHz sample rates, or a total 386mS worth of ringing. This is certainly sufficient time delay to be perceived as reverb.
Using an even larger number of taps lengthens this impulse response even more.
たとえば、Pro iDSDの16000タップのトランジェント・アラインド・フィルターは、44.1kHzのサンプリング・レートで、プリ・リンギング・トレイル、ポスト・リンギング・トレイルともに、それぞれ約186ミリ秒(186000μ秒)のインパルス・レスポンスを示します。これは、リバーブとして感知されるには十分なタイム・ディレイであるに違いありません。さらに多数のタップを使用すると、このインパルス・レスポンスはさらにいっそう長くなります。


Transient Aligned Digital Filter Transient response vs GTO™ Digital Filter iFi iDSD Proトランジェント・アラインド・デジタル・フィルターのトランジェント・レスポンス対iFiのPro iDSDのGTOデジタル・フィルター 
It may be of course, that some will prefer the sound of a very long filter, with large amounts of ringing/reverb/echo as the result is often perceived as extra added spaciousness, however, to anyone seeking to be close to the original musical performance such additives are usually unwanted.
もちろん、リンギング/リバーブ/エコーをたっぷりと備えた、非常に長いフィルターのサウンドを好む人もいるでしょう。空間感が増したと感じる結果になることがよくあるからです。しかし、オリジナルの音楽演奏に近づくことを求める人にとっては、そのような添加物は通常は望ましくないでしょう。

In the end, with the iFi GTO filter, by keeping the filter short and without pre-ringing, the filter response is inaudible because it is masked by the limits of the human hearing system. At the same time this filter still permits significant attenuation of unwanted ultrasonic images, compared to non-oversampling and also other attempts at “low tap number digital filter”.
最終的に、iFiのGTOフィルターを使うと、フィルターを短く、プリリンギングなしに保つことによって、フィルター・レスポンスが聞こえなくなります。なぜなら、人間の聴覚システムの限界によってマスキングされるからです。同時に、このフィルターは、オーバーサンプリングなしの、そしてまた「タップ数の少ないデジタル・フィルター」での他の試みと比較して、望ましくない超音波イメージを著しく低減することも可能にしています。

Analogy: if a 20million mega pixel camera was used to take a picture of a straight line, the naked eye would see only a straight line. As the resolution is ‘beyond’ that of the human eye, any ultra-fine imperfections are not ‘seen’. This is the same as with the GTO filter with human hearing.
例え話をひとつ:1本の直線の写真を撮るのに20メガ・ピクセルのカメラが使用されたとしても、裸眼で見えるのは1本の直線だけです。解像度が人間の目の解像能力を「超えている」ので、超高精細な「不完全」は「見えない」のです。GTO™フィルターと人間の聴覚の関係についても、これと同じことが言えます。

If the GTO™ digital filter is so ‘perfect’, why include the other filters with the Pro iDSD? As remarked before, individual listeners may have different listening preferences and rather than imposing one option, even if we feel this option is not the best, we prefer to leave the choice down to the individual.
GTO デジタル・フィルターがきわめて「完璧」であるなら、Pro iDSDに他のフィルターを組み込む必要がなぜあるのでしょう? 前述したように、リスナーにはそれぞれ好みがあるので、ひとつの選択肢だけを押しつけるよりもむしろ、たとえ他の選択肢がベストとは言えないと感じていても、私たちは選択を各個人に委ねたいと思っているのです。

HOW TAPS RELATES TO WHAT IS HEARDタップ数は聞こえてくるサウンドとどういう関係があるのか

So far, we have identified that we prefer the GTO filter because it has few taps.
Because:
ここまでで、私たちはGTOフィルターが望ましいことを確認してきました。なぜなら、タップ数がほとんどないからです。
その理由は:

More taps = more reverberation.
Few taps = minimal reverberation
タップ数が多い = リバーブが増す
タップ数が少ない = リバーブが最小限

Reverberation4 is artificial. Sound engineers add reverb to make recordings more spacious, artificially so. Digital filters introduce reverb by the nature of their operation. In fact, a digital reverb unit operates precisely like a digital filter in principle – as depicted in this diagram.
リバーブ(https://en.wikipedia.org/wiki/Reverberation#Digital_reverberatorsとhttps://en.wikipedia.org/wiki/Digital_delay_line)は人工的なものです。サウンド・エンジニアは、レコーディングにもっと空間感を出すために、人工的にリバーブを加えるのです。デジタル・フィルターは、その動作の性質によってリバーブを誘引します。実際、デジタル・リバーブ・ユニットは、原理的には、まったくデジタル・フィルターのように動作するのです。この図を見れば、それがわかるでしょう。

Within digital filters are Digital Delay Lines which is defined by Wikipedia:
デジタル・フィルターの内部にはデジタル・ディレイ・ラインが入っているのですが、それはウィキペディアでは以下のように定義されています。

"A digital delay line is a discrete element in digital filter theory, which allows a signal to be delayed by a number of samples.

Delays of N samples is notated as {z} ^{-N} motivated by the role the z-transform plays in describing digital filter structures.

Digital delay lines are widely used building blocks in methods to simulate room acoustics, musical instruments and digital audio effects."
「デジタル・ディレイ・ラインは、デジタル・フィルター理論における個別要素であり、信号が数多くのサンプルによって遅延されることを可能にする。

Nサンプルの遅延は、デジタル・フィルターの構造を記述する際に「Z変換」が果たす役割に導かれ、{z} ^{-N}と表される。

デジタル・ディレイ・ラインは、室内の音響、楽器、デジタル・オーディオの効果をシミュレートするためのメソッドにおいて、広く用いられている構築ブロックである。」

To our ears, the GTO filter simply sounds ‘right’ without any hint of artefacts or exceptional detail that feels ‘processed’, by avoiding large number of tap’s that add excessive reverb.
私たちの耳には、GTOTMフィルターはシンプルに「正しい」と聞こえます。過度なリバーブを加えることになる多数のタップを避けることで、「処理された」と感じられる人工的な感じや、異常なほど細かな部分を仄めかすことがないからです。

TRANSIENTS AND THE HUMAN HEARINGトランジェントと人間の聴覚


The human ear is a marvelous system with an incredible dynamic range (~135dB in middle frequencies) huge bandwidth (almost 1:1000) and a transient resolving ability that exceeds the upper limit of hearing steady state tones. Yet it is also subject to limiting factors which result in, so to speak, “blind spots” in its behavior that do not exist in purely mechanical systems (e.g. microphone). These “blind spots” can mask some behavior which objectively is distortion to be inaudible. For example, harmonic distortion masking has been well documented since the at least the 1950s if not earlier and it is reasonable to consider that ‘ringing’ on transients is also masked to a certain degree.
人間の耳は、信じられないほどのダイナミック・レンジ(中帯域で~135dB)、広大な帯域幅(ほとんど1:1000)、そして耳に聞こえる定常状態の音の上限を超えるトランジェント解像力を備えた、驚異的なシステムです。しかも、純粋に機械的なシステム(たとえばマイク)には存在しない、いわゆる「ブラインド・スポット」がその動作中に生まれることになる、制限要因の影響を受けます。これらの「ブラインド・スポット」は、客観的には耳に聞こえない歪みとなる何らかの動きを作り出すことがあります。たとえば、高調波歪みによるマスキングは、少なくとも1950年代から(それ以前からとは言いませんが)十分に証明されてきています。ですから、トランジェントにおける「リンギング」もまた、ある程度はマスキングされるのだと考えることは、理に適っているのです。

If we wish to produce audio gear that is capable of operating in a way that subjectively sounds undistorted to the human hearing (the most logical preference), we must understand its limitations and capabilities. Here, we focus on the time-domain capabilities.
もしも私たちが、主観的には人間の聴覚には歪みがないように聞こえる形(もっとも論理的な好み)で動作することができるオーディオ装置を生み出したいと願うなら、その限界と可能性を理解しなければなりません。ここで私たちは、時間領域の可能性に焦点を絞ってみましょう。

It has been shown that the human hearing’s time domain resolution for the initial transient may be as small as 5μs. Some debate remains as to the exact limits, though work done by Dr Peter Lennox of Derby University suggests a median between 13…18μs, or a location accuracy of less than 2 degrees.
最初のトランジェントに対する人間の聴覚の時間領域の解像度は、わずか5μ秒かもしれないと示されてきました。正確な限界については、今なお議論が続いていますが、ダービー大学のピーター・レノックス博士による研究では、13…18μ秒の中央値、あるいは位置の精度が2度以下であると提起されています。

Additionally, the transient response of the human hearing includes 500...700uS ringing caused by the ear’s mechanical system (Tympanic Membrane, Malleus / Incus /Stapes).
さらに、人間の聴覚のトランジェント・レスポンスは、耳の構造(鼓膜、槌骨、砧骨、鎧骨)によって生み出される500…700μ秒のリンギングを含んでいます。

This ringing occurs after a transient event, there is no pre-ringing. The ringing in the ear’s system will mask any similar external ringing, which will instead be integrated into the transient, so it is inaudible.
このリンギングは、トランジェントの後に起こり、プリリンギングはありません。耳のシステム内のリンギングは、同様の外的リンギングをどれもマスキングし、その外的リンギングはトランジェント内で一体化されるので、耳には聞こえなくなるのです。



Any pre-ringing is not masked by the human hearing, nor is any ringing that continues substantially beyond 500...700uS.
これとは対照的に、どのようなプリリンギングも、人間の聴覚によってはマスキングされません。また、500…700μ秒をかなり超えて継続するどのようなリンギングも、同様に人間の聴覚によってはマスキングされません。

TRANSIENTS AND DIGITAL FILTERSトランジェントとデジタル・フィルター


Digital filters introduce time-domain distortions that are unavoidable and a result of the inherent functional principle of digital filters. Digital filters are formed from delay-lines with so-called ‘taps’ usually at one audio sample intervals. Summing the delayed signals with varying gain, positive and negative, forms the filter function. Time-domain distortion, just as amplitude domain distortion is accumulated along the recording and playback chain and cannot be removed unless its exact nature is known.
デジタル・フィルターは時間領域の歪みを誘引しますが、これは不可避のものであり、デジタル・フィルターに内在する機能原理から生じます。デジタル・フィルターは、いわゆる「タップ」(通常はひとつのオーディオ・サンプルの間隔)を用いて、ディレイ・ラインから形成されます。変化する正負のゲインで遅延信号を合計することで、フィルター機能が形成されるのです。時間領域の歪みは、振幅領域の歪みと同じように、録音と再生の一連の流れに沿って蓄積され、正確な性質がわからなければ除去することができません。
FIRタイプのデジタル・フィルターの構造

FIRフィルターの音響効果


FIRフィルターのフィルター・レスポンス


FIRフィルターの時間領域

Among others, the mathematical consequences of this filtering have been described by J. Willard Gibbs after whom the Gibbs phenomenon is named. A square-wave filtered perfectly with a filter that allows only the fundamental to pass, will be a sinewave. Transient distortion, however, will be very high. If a square-wave is filtered but not with a perfect filter that only allows the fundamental to pass, ringing is observed. No filtering restores the perfect square wave.
中でも、このフィルターリングの数学的結果は、J・ウィラード・ギブズ(「ギブズ現象」ということばは、彼に因んで付けられたのです)によって説明されています。基本波だけを通すフィルターで完璧にフィルターリングされた矩形波は、正弦波になります。しかし、トランジェント歪みはきわめて高くなります。もしも矩形波が、フィルターリングはされるものの、基本波だけを通すフィルターで完璧にフィルターリングされるのではないなら、リンギングが観察できます。フィルターリングによって完璧な矩形波が回復されることはないのです。


OPTIMISING DIGITAL FILTERS FOR TRANSIENTSトランジェント用にデジタル・フィルターを最適化する

Considering the responses of the human ear, a digital filter can claim to offer a transient response distortion that does not materially alter the perception of music should have a transient response that has been completed in under 700μs and be free of pre-ringing.
人間の耳の反応を考えると、物質によらずに音楽の感じ方を変えるトランジェント・レスポンス歪みを生み出すことができると主張できるデジタル・フィルターを作ろうと思ったら、それは700μ秒以下で終了するトランジェント・レスポンスを持ち、プリリンギングのないものでないといけません。

各種デジタル・フィルターのトランジェント・レスポンスの長さ(短いほど良い)

Such a filter could be an asymmetrical FIR filter with no more than 32 taps at 44.1/48kHz sample rate and no more than 64 taps at 88.2/96kHz sample rate, which is precisely what iFi have implemented as GTO Filter.
そのようなフィルターは、44.1kHz/48kHzのサンプリング・レートで32タップしかない、そして88.2kHz/96kHzのサンプリング・レートで64タップしかない、非対称のFIRフィルターなら可能になります。これこそがまさにiFiがGTOTMフィルターとして実現したものなのです。

GTOタイプのデジタル・フィルターの構造

GTOフィルターの音響効果

Given the ‘Haas Window’ within which reverb or ringing is integrated into the main arrival is agreed to be at minimum 5ms (some debate remains to the actual number), one may expect filters that require more than 5ms to complete their impulse response (or have in excess of around 220 Taps at 44.1kHz sample rate) to have the potential to be significantly audible as alteration.
リバーブやプリリンギングが主到達に統合される「ハース・ウィンドウ」が、最低5ミリ秒(500μ秒)(実際の数値についてはまだ議論がある)であると同意するなら、変化としてかなり聞き取れるような潜在力を得るには、インパルス・レスポンスを終了するのに(あるいは、44.1kHzのサンプリング・レートで220タップ程度を得るのに)5ミリ秒(500μ秒)以上を必要とするフィルターを期待するかもしれません。

各種フィルターのトランジェント・レスポンスの長さ(短いほど良い)

By contrast a 5μs transient resolving ability of the ear would require a sample rate of around 200kHz to ensure a transient response, while a 20μs transient resolving ability of the ear would require a sample rate of over 50kHz, with a good middle ground represented by a 88.2/96kHz sample rate.
これとは対照的に、耳が5μ秒のトランジェント解像能力を持っていたら、トランジェント・レスポンスを確保するのに200kHz程度のサンプリング・レートが必要とされるでしょう。一方、耳が20μ秒のトランジェント解像能力を持っていたら、88.2/96kHzのサンプリング・レートのちょうど中間地点となる、50kHz以上のサンプリング・レートが必要とされるでしょう。
各種フォーマットの時間的解像度(短いほど良い)

The above suggests that at 44.1kHz sample rate digital audio lacks time domain resolution to be transparent and the common ‘long’ symmetrical FIR digital filter will have the potential to cause audible problems. It is thus desirable to use a higher sample rate and ‘short’ asymmetrical digital filters to ensure recording and playback are audibly transparent.
上記は、44.1kHzのサンプリング・レートでは、デジタル・オーディオは時間領域の解像度が不足しているので透明にならないこと、そして一般的な「長い」 対称FIRデジタル・フィルターでは、耳に聞こえるほどの問題が起きる可能性があるということを提起しています。ですから、録音と再生の透明性が聞いてわかることを確保するには、もっと高いサンプリング・レートと、「短い」 非対称デジタル・フィルターを使うことが望ましいのです。

At this point in time even higher sample rate recordings tend to utilise “long” symmetrical FIR Filters, so their benefit is diluted. That said, if we know the filter response applied at the time of recording, the time-domain distortion in the recording could in theory be reversed and replaced by one that is not audible, this action is asserted for the complete end to end MQA coding system promoted by MQA Ltd, which is now supported by all current iFi products.
この時点で、サンプリング・レートのさらに高い録音でも「長い」対称FIRフィルターを利用する傾向があるので、その利益が打ち消されてしまうことがわかります。ということは、録音時に適用されたフィルター・レスポンスを知っていれば、録音における時間領域の歪みは、理論的には反転することができ、耳には聞こえない歪みで置き換えることができるということです。MQA社が推進している端から端までのすべてに対応するMQAコーディング・システムでは、この動きが使われています(iFiの現行製品は、すべてこのMQAをサポートしています)。

For recordings not available in MQA derived from analogue Masters or genuine high-resolution digital masters with a known provenance, selecting iFi’s GTO filter presents the highest possible fidelity.
出どころのよくわかったアナログ・マスターやほんものの高解像度デジタル・マスターに由来する、MQAでは利用できない録音でも、iFiのGTOTMフィルターを選ぶと、可能な限り最高の忠実度を実現することができます。

HOW IFI HAS IMPLEMENTED THE GTO™ DIGITAL FILTERiFiはどうやってGTOTMデジタル・フィルターを実現したのか


A digital filter must be implemented somewhere, perhaps on an FPGA like the Xilinx Spartan 6 as used in the Pro iDSD, a DSP Chip like an Analogue Devices Sharc or Blackfin. Recent developments on the XMOS Platform have led to our becoming very familiar with offerings from the new XCore200 and the onboard DSP capabilities baked-in.
デジタル・フィルターは、おそらくはPro iDSDに使用されているXILINX Spartan 6のようなFPGAや、アナログ・デバイセズ社のSharcやBlackfinのようなDSPチップのどこかに取り入れなければなりません。XMOSプラットフォームの最近の進化によって、私たちは新しいxCore-200の能力に大きくなじむことが可能になり、DSPの能力をオンボードで実現することが可能になりました。

In the Pro iDSD we choose to use the XILINX Spartan 6 FPGA which also performs the DSD 1024 remastering, simply because the 16-Core XMOS is substantially loaded already.
Pro iDSDでは、私たちはXILINX Spartan 6 FPGAを使用することを選択していますが、これはまたDSD1024マスターリングも実現します。なぜなら、16コアのXMOSが実質的に既に使用されているからです。



Using any option requiring dedicated hardware would mean this filter can only be made available on products in development at higher price-points as FPGAs or DSP chips sufficiently capable are costly or on products using the xCore-200, which is on-board of the Pro iDSD.
専用のハードウェアを必要とする選択肢を選ぶと、もっと高価な(十分な能力を備えたFPGAやDSPチップは値段が高いのです)開発製品上でしか、あるいはxCore-200(Pro iDSDにオンボードで装備されているもの)を使用した製品上でしかこのフィルターが利用できないことになってしまうでしょう。


GTO TRICKLE-DOWNGTO™を下位機種にも取り入れる

Unlike the xCore-200 series which include built-in DSP capabilities, implementing MQA on xCore-100 required the ground-up design of a DSP engine. With the DSP engine now available, our natural inclination was to have our new filter baked onto the XMOS Firmware.
DSPの能力が組み込まれたxCore-200シリーズとは異なり、xCore-100にMQAを組み込むには、DSPエンジンをゼロから設計する必要がありましたが、現在はそのDSPエンジンが利用可能になったので、私たちはいつもの「性癖」に従って、XMOSファームウェアに新しいフィルターを焼き込むことになりました。




Technical assistance came from an unexpected source; MQA. Using very different filter parameters as part of a more complex system including the decoder section requires serious DSP chops. The implementation of MQA rendering on the original xCore-100 series XMOS processors widely used in the iFi products required extensive DSP work.
思いもかけないところから技術援助をしてもらうことになりました。MQA社です。デコーダー部分を含む、より複雑なシステムの一部として非常に異なったフィルター・パラメーターを使用するには、最高度なDSP技術が必要になります。iFi製品に広く使われているオリジナルのxCore-100シリーズのXMOSプロセッサーにMQAレンダーリング機能を加えるには、広範なDSP作業が必要になりました。

This took some extra work, and some fine-tuning of resource allocation, however with the version 5.3C of our XMOS firmware we now offer this new, Global Transient Optimised digital filter to all our customers, including just about all our legacy products, as an alternate option to the filters implemented in the DAC chip that apply for version 5.30 and before.
これには余分な作業やリソース分配の細かな調整が必要でしたが、XMOSファームウェア・バージョン5.3Cとともに、私たちはこの新しいGTOデジタル・フィルターをすべてのユーザーのみなさまにお届けすることが可能になりました。これには、ほぼすべての旧製品も含まれており、バージョン5.30以前に対応するDACチップ内のフィルターの代わりにご使用いただくことができるのです。


TECHNICAL BACKDROP技術的背景

The ‘Gibbs Transient Optimised’ filter was developed by iFi according to our specifications in conjunction with the MQA team. We must make clear that GTO is not directly related to filter types used by MQA, it is not “MQA through the backdoor”, but instead what we feel is the optimum solution for the playback of digital audio that has not undergone the MQA process. We would like to thank MQA for their technical assistance in integrating this into
our firmware.
GTOフィルターは、弊社の仕様に応じて、MQAチームと共同開発したものです。GTOが、MQAが使用しているフィルターのタイプと直製の関連を持っているわけではないことを、明確にしておかなければなりません。「裏口MQA」ではないということです。その代わり私たちは、MQAの処理を受けていないデジタル・オーディオの再生にとって、これが最適の解決になると感じています。これを私たちのファームウェアにまとめるにあたってMQA社からいただいた技術援助に、感謝したいと思います。

※iFi audio製品用新ファームウェア5.30Cのダウンロードページは→こちらです。