以下,雑誌,レスピレーションリサーチファンデーション「呼吸」(Surrogate data法を用いた生体信号解析,鰤岡直人,網崎孝志)から引用.

文献はメディカルオンライン http://www.medicalonline.jp/ から購入可能.

 

時系列データ解析は生体の生理学的現象から生じた生体信号を解析するための重要な手法である.

時系列データは等間隔にすると解析が容易になる.

 

時間間隔が等間隔な時系列データ u(i), (i = 1, 2, 3,, n) を考える.u(i) には信号値が入る.

等間隔時系列データからTakens の埋め込み定理 を用いた m次元空間用の再構成ベクトルセット Xi(i = 1, 2, 3,, n - (m - 1)t) は以下のようになる.

Xi = {u(i), u(i + t), u(i + 2t), , u(i + (m - 1)t)}, (i = 1, 2, 3,, n - (m - 1)t)

時間遅れ座標系の時間遅れ(time lag)の t は正の整数の定数である.

t は時系列データの自己相関関数が最初に 1/e に減衰する時間を参考にすることが多い

時間遅れの実際の時間は t×ΔtとなるΔtはサンプリング時間である.

 

時間遅れの t を導入して拡張したApEnも報告されている.

以下に式を示す.

ApEn(n, m, r, t) = Fm (r) – Fm+1 (r)

= (n - (m-1)t)-1ln Cm,i (r) (n - mt)-1ln Cm+1,i (r)

Cm,i (r)は以下で定義される.

Cm,i (r) = (n - (m-1)t)-1Q(r -|Xi - Xj |)

|Xi - Xj |はベクトルXiとベクトルXjの距離である.

 

Pincus ApEn 考案時,t = 1の場合を考えた.t = 1のとき時系列データ u(i) から作製した再構成ベクトルは,

Xi = {u(i), u(i + 1), u(i + 2), , u(i + (m - 1))}, (i = 1, 2, 3,, n - (m - 1))

ApEnは以下のように計算される.

 

Fm (r) = (n - (m - 1))-1 ln Cm,i (r)

ApEn(n, m, r) = Fm (r) Fm+1 (r)

= (n - (m - 1))-1ln Cm,i (r) (n - m)-1ln Cm+1,i (r)

 

Cm, i (r) は以下で表される.

まず,d[Xi, Xj] = (u(i + (k - 1)) – u(j + (k - 1)))を定義する.

d[Xi, Xj]はベクトルXi,の要素,u(i + (k - 1))とベクトルXjの要素,u(j + (k - 1)) の差の絶対値のうち,埋め込み次元 m 以下の場合で最大の値を意味する.これを用いて,

Cm, i (r) = (n - (m - 1))-1Q( r - d[Xi, Xj]),

nは時系列データのデータ数,m は埋め込み次元(embedding dimension),r は定数,lnは自然対数 (natural logarithm)である.

 d[Xi, Xj] は,ベクトルXi とベクトルXj 間の距離に関連する.

Q(t) はヘビサイド関数で, t 0ならば Q(t) = 1とし, t < 0ならば Q(t) = 0とする.

Q( r - d[Xi, Xj]) はベクトルXiを中心としてXiから一定の定数 r 内にd[Xi, Xj] £ r を満たす他のベクトルXj (j = 1, 2, 3,, n - (m - 1)) が何個含まれているかを意味している.

もっと砕けて説明すると,Cm, i (r)は,ベクトルXiを中心として,距離 r 内に他のベクトルXjj = 1,2,3,…, n - (m - 1))が何個含まれるか(Q( r - d[Xi, Xj]) )を確率(比率とも解釈可能)で表したものである(n - (m - 1)で割っている).

距離 r はユークリッドの距離を用いても本質は変わらない.

通常,m = 2r = 0.10.25×SDSDは対象とした時系列データの標準偏差)の定数にして計算する.

ApEn(n, m, r)の変数を定数とすることで計算速度が飛躍的に短縮でき,解釈もしやすくなった.

埋め込み次元mを2にする,距離 r を定数にする.これらがPincus が工夫した重要な点である.

 

さらに,詳細な説明.

定義式の意味として再構成ベクトルをm次元の時間遅れ座標系の中に描写された点とすると,ある点(ベクトルXi)を中心として,一定の距離 r 内にどれくらい他の点(ベクトルXj ,(j = 1, 2, 3,, n - (m - 1))が含まれているかを確率Cm,i (r)として計算し,ln Cm,i (r)エントロピーの形にしている(ln:自然対数).
m = 2ならば半径 r の円の中に含まれる点の数ベクトルXj ,(j = 1, 2, 3,, n - (m - 1))のうち,ベクトルXi を中心とした半径 r の円内に何点存在するかm = 3ならば半径 r の球の中に含まれる点の数(ベクトルXj (j = 1, 2, 3, …, n - (m - 1))のうち,ベクトルXi を中心とした半径 r の球内に何点存在するかを用いて,各々 ln C2,i (r), ln C3,i (r)を計算する.

符号はマイナスであるが選択情報量を計算したことになる.

さらに, m次元の時間遅れ座標系に埋め込こまれた点(n - (m - 1) )すべてに対して同様の操作を行い( ln Cm,i (r)),平均を計算した統計量n - (m - 1)で割り算する)がFm (r) であるこの意味として情報量に関連した統計量の平均値を計算したことになる.

Fm (r) = (n - (m - 1))-1 ln Cm,i (r)

式の解釈として,任意の再構成ベクトルを一点選んだとき,それを中心として一定の距離r 内にどれくらい他の点が含まれているか(分布確率)をエントロピーの形として計算したら平均値としてどの程度なのかを示している.

次いで,エントロピーの符号を正にするためマイナス符号をつける(−Fm (r)).

そして,時間遅れ座標系の埋め込み次元 m が1のみ大きい場合(m+1)と比較した値がApEnである

ApEn(n, m, r) = – Fm+1 (r) – (– Fm (r)) = Fm (r) – Fm+1 (r)

周期的で規則正しい時系列データならば,mあるいはm+1次元で作成された再構成ベクトルは時間遅れ座標系での分布が同じ性質なので,

ApEn(n, m, r) = Fm (r) – Fm+1 (r) @ 0となり規則正しい状態を判定できる.

逆に乱雑な時系列データの場合,値は大きくなる.

 

具体的に,生体信号からApEnを計算したとする.

ApEnは下限値と上限値が存在するので生体信号を定量化するのに便利な統計量である.

ApEn は下限が存在し下限値は0である.サインカーブやトーラスのような規則正しい時系列データならば0に近い値をとる.

全く乱雑な場合が上限値となる.ApEnの上限値は時系列データの個数 n に依存する.従って,時系列データの個数 n が異なった条件での解析は意味をなさないことに注意が必要である.
従って,生体信号をA/Dコンバーターで時系列データ化する長さ(時間)は同じでなければならない.

Matlabで発生させた一様乱数を時系列データとするとデータ数が600個でApEn1.4前後,2000個でApEn1.9前後となる.

カオスは乱雑でApEn値は大きいという誤解があるが,決定論的カオスから作成した1変数の時系列データ(x軸に正射影)で計算するとLorenzモデルApEn値は0.135RösslerモデルでApEn値は0.218と小さい値であり,初期値には敏感であるが,決して乱数のように乱雑なわけではない.カオスは背景に明確な決定論をもつことを考えれば値が小さい結果に納得がいくと思われる.

カオスは極めて特殊な状態であり,このような数学的に特殊なものを生体に安易にあてはめると誤謬が生じる可能性がある.

 

参考文献

1. Pincus SM. Approximate entropy as a measure of system complexity. Proc Natl Acad Sci USA 88: 2279-301, 1991.

2. Burioka N, Cornélissen G, Halberg F, Kaplan DT, Suyama H, Sako T, Shimizu E.

Approximate entropy of human respiratory movement during eye-closed wake and different sleep stages. Chest 123: 80-6, 2003.

3. Burioka N, Cornélissen G, Maegaki Y, Halberg F, Kaplan DT, Miyata M, Fukuoka Y, Endo M, Suyama H, Tomita Y, Shimizu E. 
Approximate entropy of the electroencephalogram in healthy awake subjects and absence epilepsy patients. Clin EEG Neurosci. 36:188-93, 2005.