講義メモ/情報通信論/G711.1/pp1-5
このページはメモ書きです、どこまで正しいかは不明です。
1 Scope (範囲)
This Recommendation(勧告) contains the description(説明) of an algorithm extending(拡張する) [ITU-T G.711] for the scalable coding of narrow-band(狭域) and wideband speech and audio signals from 64 to 96 kbit/s.
この勧告は64~96kbpsの峡帯域および広帯域音声/オーディオ信号符号化法「ITU-T G711」を拡張するアルゴリズムを解説する。
Narrow Band = 電話帯域 ~4kHz Wide Band = ~8KHz Super Wide Band ~16kHz
This Recommendation is organized as follows.
この勧告は以下で構成される。
The references(参照), definitions(定義), abbreviations(略語) and acronyms(頭字語:All Nippon Airline->ANAとか), and conventions(慣例) used throughout this Recommendation are defined in clauses 2, 3, 4, and 5, respectively(各々).
2,3,4,5節では各々「参照」「 定義と頭字語」「略語」「慣例」が定義されている
Clause 6 gives a general outline of the G.711.1 algorithm.
6節では「G.711.1」のアルゴリズムの概要が述べられている。
The G.711.1 encoder and decoder principles are discussed in clauses 7 and 8, respectively.
7,8節では各々「G.711.1」のエンコーダとデコーダの原理について議論している。
The transmitted parameters are presented in clause 9.
9節では伝送パラメータを紹介している。
Clause 10 describes(述べる) the software that defines this coder in 16-32 bit fixed-point arithmetic.
10節では16または32bitの固定小数点演算で符号化するソフトウェアについて述べる。
16bit固定小数点演算(ある数字がa0からa15までの固定小数点で表されてる場合)
In addition to the algorithm specified(区別可能) in the main body of this Recommendation, Appendix I provides(提供) a supplemental functionality enhancing(強める) the quality of the decoded signal when a legacy G.711 or only the basic log companded PCM part is available.
この勧告の本論で明確化したアルゴリズムに加え、
付録1では、現行のG.711や対数符号化のみを行ったPCMと比較して解読信号の
品質が向上したことを補足する。
付録1では、現行のG.711や対数符号化のみを行ったPCMと比較して解読信号の
品質が向上したことを補足する。
2 References (参照)
The following ITU-T Recommendations and other references contain provisions(供給) which, through reference in this text,constitute(構成) provisions of this Recommendation.
この勧告よりも先に構成されているITU-Tの勧告と参照している文章を示す
At the time of publication, the editions indicated were valid.
この版は公布時に有効だったこととを示す。
All Recommendations and other references are subject(対象/根拠/受けやすい) to revision(校正);
すべての勧告や参考文献はよく改訂される。
users of this Recommendation are therefore encouraged(勇気づけられる) to investigate(調査する) the possibility of applying the most recent edition(古い版) of the Recommendations and other references listed below.
この勧告の利用者は以下に示す参照や勧告の新しい版を調査することを推奨する。
A list of the currently valid ITU-T Recommendations is regularly published.
現在有効なITU-T勧告のリストは定期的に公表されている。
The reference to a document within this Recommendation does not give it, as a stand-alone document, the status of a Recommendation.
この勧告は改訂されるかもしれない。
3 Definitions 定義
とくになし
4 Abbreviations and acronyms 略語と頭字語
This Recommendation uses the following abbreviations and acronyms:
この勧告では以下のような定義と頭字語を使いる。
- CSVQ (Conjugate Structured Vector Quantization) 共役構造ベクトル量子化手法
多数の要素をベクトルとして一括に量子化するとき,1つのベクトルを複数のベクトルの和として表現する手法。音声の符号化で使用され,単一ベクトルによる場合と比べ,量子化誤差をあまり増加せずに符号帳に用いるメモリ量を大幅に削減し,また,伝送路誤りに強くすることがで
きる。
きる。
- DeMUX (Demultiplexer) デマルチプレクサ
マルチプレクサの逆、
選択制御入力の値にしたがってデータ入力を複数ある出力のいずれかに送り出す。
選択制御入力の値にしたがってデータ入力を複数ある出力のいずれかに送り出す。
- FER (Frame ERasure) フレーム損失
- FERC (Frame ERasure Concealment) フレーム損失隠蔽
- FFT (Fast Fourier Transform) 高速フーリエ変換
- FIR (Finite Impulse Response) 有限インパルス応答
ディジタルフィルタの一種
http://ja.wikipedia.org/wiki/有限インパルス応答
http://ja.wikipedia.org/wiki/有限インパルス応答
- HB (Higher Band) 高帯域
- iFFT (Inverse Fast Fourier Transform) 逆高速フーリエ変換
- iMDCT (Inverse Modified Discrete Cosine Transform) 逆修正離散コサイン変換(を使ったフーリエ変換)
- LB (Lower Band) 低帯域
- LP (Linear Prediction) 線形予測法
- LPC (Linear Prediction Coefficient) 線形予測係数
- LSB (Least Significant Bit) 最下位ビット
- LTP (Long-Term Prediction) 長期予測
今の電圧(信号)から次の電圧を予測する→なんとかかんとかでエラーを含むかどうかわかる。
http://en.wikipedia.org/wiki/Long_Term_Prediction
http://en.wikipedia.org/wiki/Long_Term_Prediction
- MDCT (Modified Discrete Cosine Transform) 修正離散コサイン変換
- MSB (Most Significant Bit)最上位ビット
- MUX (Multiplexer) マルチプレクサ(ふたつ以上の入力をひとつの信号として出力する機構)
選択制御入力の値にしたがって複数のデータ入力のいづれかを出力に送り出す。
- NB (Narrow-Band)狭帯域
- NG (Noise Gate) ノイズゲート
主に雑音の軽減を目的として、一定レベル以下の音信号を減衰させるエフェクター、ゲート
- OLA (OverLap Add) FFTを用いた畳み込み手法の名前
outputされたデータを、overlapする。
http://junzo.sakura.ne.jp/c_plus36/c_plus36.html
http://junzo.sakura.ne.jp/c_plus36/c_plus36.html
- OLS (OverLap Save) FFTを用いた畳み込み手法の名前
captureしたデータを、overlapする。
http://junzo.sakura.ne.jp/c_plus12/c_plus12.htm
http://junzo.sakura.ne.jp/c_plus12/c_plus12.htm
- PCM (Pulse Code Modulation) パルス符号変調
アナログ信号を標本化(サンプリング)・量子化し、得られた信号の大きさを二進の数値データとして表現する。
- PSD (Power Spectral Density) パワースペクトル密度
定常過程(時間や位置によって確率分布が変化しない確率過程)に関する周波数値の正実数の関数または時間に関する決定的な関数。
http://ja.wikipedia.org/wiki/スペクトル密度
http://ja.wikipedia.org/wiki/スペクトル密度
- QMF (Quadrature-Mirror Filterbank) 直交ミラーフィルタバンク
音声信号をいくつかの周波数帯域に分割し,合成する。
http://search.ieice.org/bin/summary.php?id=j73-a_11_1823&category=A&year=1990&lang=J&abst=
http://search.ieice.org/bin/summary.php?id=j73-a_11_1823&category=A&year=1990&lang=J&abst=
- RMS (Root Mean Square) 二乗平均平方根(平均二乗偏差)
- RSX (Re-synchronized) 再同期
- SNR (Signal to (quantization) Noise Ratio) S/N比(信号/エラー比)
- TDAC (Time Domain Aliasing Cancellation) 時間領域エイリアスキャンセリング
時変数関数を周波数関数に変換する手法
- VQ (Vector Quantization) ベクトル量子化
- WB (WideBand) 広帯域
- WMOPS (Weighted Million Operations Per Second)
http://www.polycom.co.jp/news/release/2005/0511.htmlhttp://eow.alc.co.jp/root-mean-squa\
re/UTF-8/?ref=wl
WMOPS はITU の演算処理能力の測定単位で1 秒間に何百万回の命令を実行できるかを示し、MIPS に類似しています。
re/UTF-8/?ref=wl
WMOPS はITU の演算処理能力の測定単位で1 秒間に何百万回の命令を実行できるかを示し、MIPS に類似しています。
5 Conventions (慣例)
The notational(表記) conventions(慣例) are detailed below:
表記の慣例に関する詳細。
表記の慣例に関する詳細。
- Time-domain signals(時系列信号) are denoted(意味する) by their symbol and a sample index between parentheses(括弧内),
e.g., s(n) . The variable n is used as sample index.
時系列信号はサンプルインデックスを括弧内に入れて表す。nはインデックス。
時系列信号はサンプルインデックスを括弧内に入れて表す。nはインデックス。
- Frequency-domain(周波数領域) transforms are denoted by converting the related time-domain signal to
capital letters, e.g., S(k) is the transform of s(n). The variable k is used as coefficient index.
時系列信号s(n)を周波数領域に変換したものをS(k)とする。kは係数のインデックスである。
時系列信号s(n)を周波数領域に変換したものをS(k)とする。kは係数のインデックスである。
2 Rec. ITU-T G.711.1 (03/2008) ITU-T G.711.1の分
- 括弧内の上付きの記号は時間に依存している値である、mは内容に依存します、nがサンプルインデックス。
- []内の上付き文字は繰り返しインデックス
- 下付き文字は係数行列の特定の値のインデックス
- 「^」はパラメータを量子化したもの
- パラメータ範囲は[]で表す。
- sign関数は値の極性(正負)を表します。
sgn(x)はx>=0のとき1でそれ以外が-1
- 無限小に丸める
ビット演算子のAND | |
ビット演算子のXOR |
- 0xがついているものは16進数
- 値xの N bitの右シフトは以下のように表す
- ANSI Cで用いられている16bit固定小数点演算は16bitもしくは32bitで丸められている。
Table 5-1
Filter
- 低帯域エンコーダ/デコーダにおける知覚重みフィルタ
- 低帯域前強調フィルタ
- 低帯域FERCにおける短期LP解析フィルタ
- 低帯域FERCにおけるローパスフィルタ
- 低帯域FERCにおける重み付けフィルタ
- FERCにおける前処理フィルタ
- 低帯域後処理フィルタにおけるノイズ低減フィルタ(付録1)
- 低帯域後処理フィルタにおける第1ノイズ低減フィルタ(付録1)
- 低帯域後処理フィルタにおける第2ノイズ低減フィルタ(付録1)
Signals
- 広帯域入力信号
- 狭帯域入力信号
- 前処理済み広帯域入力信号
- 前処理済み狭帯域入力信号
- QMF処理後の低帯域信号 (1/10)
- 知覚重み付き低帯域対象信号
- SLBとS'LBの差
- レイヤ0ビット列のデコード後の信号
- レイヤ0ビット列のデコード後の信号からオフセットを外した信号
- 低帯域知覚フィルタの前強調処理済みLP解析用レイヤ0デコード済み信号
- ↑に窓をかけた信号
- 低帯域知覚フィルタで用いられる自己相関関数
- ↑に遅延窓(lag窓)をかけたもの
- 低帯域対象信号指数 (3bitの正確性)
- 低帯域対象信号の精製信号 (3bitの正確性)
- QMF処理前の高帯域信号 (1/10)
- スケーリング前の高帯域MDCT係数
- 重み付き高帯域MDCT係数
- 標準化後重み付き高帯域MDCT係数
- CSVQの対象となる1/10減衰高帯域MDCT係数
- デコーダの低帯域指数
- デコーダの低帯域信号のsin
- デコーダ内の低帯域強調信号
- デコーダのレイヤ1デコード済み信号
- デコード済みの低帯域信号
- 重み付けと標準化を行った、デコード後高帯域MDCT係数
- 重み付けを行った、デコード後高帯域MDCT係数
- デコード後高帯域MDCT係数
- MDCTにおけるOLA前の高帯域信号
- 低帯域FERCにおける前処理後デコード信号
- 低帯域FERCにおけるLP残差信号
- 低帯域FERCにおける推定信号
- 低帯域FERCにおけるピッチ計算のための1/10減衰信号
- 低帯域FERCにおけるピッチ計算のための重み付き1/10減衰信号
- 低帯域FERCにおけるゲイン補正済み推定信号
- 低帯域FERCにおける再同調済み信号
- 低帯域FERCにおけるスケーリング済み再同調済み信号
- デコード後高帯域信号
- 高帯域FERCにおける高帯域信号バッファ
- デコード後高帯域MDCT係数
- デコード済み広帯域信号
- 周波数領域におけるレイヤ0デコード済み信号(付録1)
- 後処理フィルタの出力信号(付録1)
Parameters
- QMF係数セットその1
- QMF係数セットその2
- 低帯域の前強調フィルタの係数
- 低帯域エンコーダで計算されるZero-crossing rate
「ZCR(Zero Crossing Rate)といって、無音状態の場合には、そのシーンを飛ばす、というなこともする。by http://journal.mycom.co.jp/news/2001/12/13/09.html」
- 低帯域知覚フィルタのためのLP応答窓
- 低帯域知覚フィルタのための遅延LP応答窓
- コアエンコーダのオフセット
- 低帯域の知覚重み係数
- 低帯域知覚フィルタのLP係数
- 低帯域知覚フィルタにおける影響係数obtain
- 低帯域信号の標準化因子
- 低帯域における知覚フィルタの減少因子
- レイヤ1の計算で使う、低帯域信号のExponent map
- レイヤ1のBit-allocation table
- 前スケーリングのための高帯域MDCT標準化因子
- 後スケーリングのための高帯域MDCT標準化因子