ProMemo

pp7-9

最終更新:

yosilove

- view
メンバー限定 登録/ログイン

講義メモ/情報通信論/G711.1/pp7-9


このページはメモ書きです、どこまで正しいかは不明です。


6 General description of the coder 符号化の概説

The G.711 wideband extension codec is implemented in fixed point using basic operators 
version 2.2 defined in [ITU-T G.191], software tool library.
G711広帯域符号化は、固定点(不動点)でバージョン2.2のITU-T Gで実装されます。


This Recommendation provides the detailed algorithm description.
この勧告は、アルゴリズムの詳細を提供します。


6.1 Encoder

Figure 6-1 shows the high-level block diagram of the encoder. 
6-1の図を見てください。エンコーダのハイレベルなブロック図です。

A pre-processing high-pass filter is applied to the 16-kHz-sampled input signal sWB(n) 
to remove 0-50Hz components.
前処理ハイパスフィルタは、16kHz-サンプル0-50Hzの要素を取り外すためにの入力信号sWB(n)に適用されます。

The pre-processed signal sWB (n) is divided into 8-kHz-sampled lower-band and higher-band signals,
前処理された信号sWB(n)は8kHzサンプルを、低周波と高周波に分けられる。

sLB (n) and sHB (n) , using a 32-tap quadrature mirror filterbank (QMF).
sLbとsHBは32タップの直行ミラーフィルターに使用する。

The lower-band signal is encoded with an embedded lower-band encoder 
which generates G.711-compatible core bitstream
(Layer 0) IL0 at 64 kbit/s, and lower-band enhancement (Layer 1) bitstream IL1 at 16 kbit/s. 
低周波は、低周波のエンコーダーと一緒に G711と互換性のあるコアビットストリームIL0 64kbt/sにエンコードされる。そして、低周波(enhance)拡充は、ビットストリームIL2 16kb/sでエンコードされる。

The higher-band signal is transformed into modified discrete cosine transform (MDCT) domain 
and the frequency domain coefficients SHB(k) are encoded together with and its normalization factor
\eta_{HB} by the higher-band encoder which generates higher-band enhancement (Layer 2)  bitstream IL2 at 16 kbit/s.
高周波は修正離散コサイン変換(MDCT)によって、そして周波領域 係数SHB(k)は標準化要素高ηHBといっしょに高周波(enhancement)拡充IL2 16kb/sでエンコードされる。

IL0 64kb/s = 8bit * 8kHz
IL1 16kb/s = 2bit * 8kHz
IL2 16bit/s = 80bit/40サンプル*8000

All bitstreams are multiplexed as a scalable bitstream.
すべてのビットストリームはスケーラブルな(計ることができる)ビットストリームを多重送信します。

6.2 Decoder 復号化

Figure 6-2 shows the high-level block diagram of the decoder. 
図6-2をみてください。デコーダーのブロック図です。

The whole bitstream is de-multiplexed to G.711-compatible core (Layer 0) bitstream IL0 ,
lower-band enhancement (Layer 1) bitstream IL1 , and higher-band enhancement (Layer 2) bitstream IL2 . 
ビットストリーム全体は、デマルチプレックスされG.711と互換性のあるビットストリームIL0,低域強調Layer 1ビットストリーム IL1 そして、高域強調 Layer2 IL2。

Both the Layer 0 and 1 bitstreams are handed to the lower-band decoder. 
両方のLayer0とLayer1の両方のビットストリームは低域デコーダに手渡されます。

The Layer 2 bitstream is given to the higher-band decoder,
and consequently decoded signal in the frequency domain S_{HB}(k) is fed to inverse MDCT (iMDCT),
together with the normalization factor \eta_{HB} . 
Layer2のビットストリームは、高周波デコーダーにあたられます。そして、その結果 周波領域\hat{S}_{HB}(K)は標準的な要素\eta_{HB}と一緒に、逆修正離散コサイン変換 (IMDCT) されます。


By this iMDCT process, the higher-band signal in time domain \hat{s}_{HB}(n) is obtained. 
iMDCTの過程において、時間領域sHBより高周波の信号を手に入れます。

To improve the quality under frame erasures due to channel errors such as packet-losses,
frame erasure concealment (FERC) algorithms are applied to the lower-band and higher-band signals independently. 
パケット損失などの通信路エラーの品質を改良するために、フレーム消去隠匿アルゴリズムは、低周波と高周波に関係なく適用される

Although the concealment process is performed independently,
the pitch lag TLB estimated in the lower-band FERC is given to higher-band FERC as auxiliary information. 
隠匿過程は独自に実行されるが、低周波 FERCでのピッチの遅れTLBは、補助情報として高周波 FERCに補助情報として与えられていました。

The lower- and higher-band signals, \hat{s}_{LB}(n) and s\hat{s}_{HB} (n) ,
are combined using a synthesis QMF filterbank to generate a wideband signal \hat{s}_{QMF}(n) . 
低周波、高周波信号\hat{s}_{LB}と\hat{s}_{HB}は、統合して、統合体QMFフィルターバンクに用いられ、広域信号 \hat{s}_{QMF}(n) を生成します。

Noise gate processing is applied to the QMF output to reduce low-level background noise.
ノイズゲート処理は、QMF出力の低レベルの背後のノイズを減少に使用される。

At the decoder output, 16-kHz-sampled speech \hat{s}_{WB}(n) (or 8-kHz-sampled speech \hat{s}_{NB}(n) ) is synthesized.
デコーダー出力のときに、16kHzサンプルスピーチ sˆWB (n) は合成される。


6.3 Coder modes 符号化のやりかた

The possible bitstream combinations are shown in Table 6-1. 
可能なビットストリームの組み合わせは、表6-1に示されています。

In total, four modes are defined: R1, R2a, R2b and R3, with combinations of bitstreams. 
合計で、4つのモードが定義されます: R1、R2a、R2b、R3のビットストリームの組み合わせがある。

It should be noted that since the bitstream itself cannot discriminate between R2a and R2b,
an explicit outband signalling of the mode is required.
bitstream自身がR2aとR2bを区別できないので、バンドシグナリングが必要であることがわかる。

6.4 Bit allocation ビット割当

The bit allocation of the coder is presented in Table 6-2. 
符号化器のビット割当はTable6-2に提示されます。

This table is structured according to the different bitstream layers.
異なったbitstreamよって、この表は構造化されます。

For a given bit rate, the bitstream is obtained by concatenation of the contributing
layers as described in clause 6.3.
特定のビットレートにおいて、6.3番目の節で説明されるように、レイヤーの連結でビットストリームを入手します



タグ:

講義メモ
目安箱バナー