Advanced
Data-Driven Signal Decomposition using Improved Ensemble EMD Method
Data-Driven Signal Decomposition using Improved Ensemble EMD Method
Journal of the Korea Institute of Information and Communication Engineering. 2015. Feb, 19(2): 279-286
Copyright © 2015, The Korean Institute of Information and Commucation Engineering
This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/li-censes/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.
  • Received : December 09, 2014
  • Accepted : January 08, 2015
  • Published : February 28, 2015
Download
PDF
e-PUB
PubReader
PPT
Export by style
Share
Article
Author
Metrics
Cited by
TagCloud
About the Authors
금분 이
goldpalm@cst.ac.kr

Abstract
EMD는 미리 정의된 어떠한 기저함수도 사용하지 않으며 사용자에 의해 미리 정의된 파라미터값도 필요치 않은 완전히 데이터에 기반한 신호 처리의 특징을 갖는다. 그러나 유사한 스케일을 갖는 신호 모드로 분해하는 것을 방해하는 모드 혼합이 발생하는 단점이 있다. 이를 해결하기 위해 EEMD 알고리즘이 도입되었으며, EEMD는 처리하고자 하는 신호에 가우시안 백색 잡음을 혼합하여 앙상블 수만큼 신호를 만들어 EMD 방법을 적용함으로써 모드 혼합문제를 해결한다. 그럼에도 EEMD는 잡음이 추가된 신호 분해 시 원 신호와 상이한 모드 수를 만들어 내며, 분해된 신호들을 원 신호로 재구성 시에도 레지듀 잡음이 포함된다. 본 논문은 개선된 EEMD알고리즘으로 EMD의 모드 혼합 문제를 해결하고 원신호를 정확히 재구성하며 EEMD 보다 적은 연산 비용으로 신호 모드 분리를 제안한다. 실험결과는 EEMD 방법과 비교하여 적은 체과정의 반복으로 빠른 모드 분리를 보여 주었으며 EEMD 방법의 20.87%의 비용만으로 완전한 신호 분해가 가능하였고, 신호 복원에 있어서도 EEMD 보다 우수한 성능을 보여주었다.
Keywords
Ⅰ. 서 론
EMD (Empirical Mode Decomposition)는 비선형적이며 비정상적인 신호를 분석하기 위해 도입된 적응적인 모드이다 [1 - 3] . EMD에 의해 분해된 신호 모드는 지역적(local)이고 완전히 데이터에 기반한(data-driven) 빠르고 느린 진동의 분리로 구성된다. EMD는 신호를 몇 개의 모드(mode) 또는 IMF (Intrinsic Mode Function)라 불리는 유한개의 함수로 분해한다. 모드들 은 원신호의 고유한 속성을 보존하면서 분해 단계가 증가할수록 신호의 복잡도와 스케일이 감소한다 [2] . 그러나 EMD는 같은 모드 내에서 동일한 스케일을 가진 신호로 분해하지 않고, 한 모드 내에 이질적인 진폭을 가진 진동이 존재하거나 서로 다른 모드 내에 유사한 진동이 존재하는 모드 혼합(mode-mixing)의 문제가 발생한다. 이러한 문제를 해결하기 위해 가우시안 백색 잡음을 추가한 신호의 앙상블 상에 EMD를 수행하는 EEMD (Ensemble Empirical Mode Decomposition)라 불리는 새로운 방법이 제안되었다 [4 - 6] . 가우시안 백색잡음의 추가는 시간-주파수 공간에 잡음이 존재하도록 함으로써 EMD가 dyadic 필터뱅크처럼 동작하도록 하여 모드 혼합 문제를 풀 수 있다 [4] . 그러나 EEMD는 원신호에 백색 잡음을 추가한 앙상블 신호의 분해이므로 원신호의 모드와 다른 모드의 수를 만들어 내며, 복원 된 신호가 레지듀 잡음을 포함하게 되어 상이한 신호가될 수 있다 [5 , 6] . 이런 문제를 극복하기 위해 본 논문은 EEMD에 적용된 수식을 개선하여 EMD의 모드 혼합 문제를 해결하고 적은 연산 비용으로 효율적인 모드 분리와 원신호의 정확한 복원을 제안하고자 한다.
Ⅱ. EEMD와 개선된 EEMD
신호 분해 방법으로 EMD는 웨이블릿과 달리 미리 정의된 기저 함수를 사용하지 않으며, 사용자에 의한 파라미터 값들의 적용 없이 완전히 데이터에 기반하여 신호를 분해한다. 따라서 원신호의 고유한 비선형성‧비정상성의 특징을 그대로 보존할 수 있다 [7] .
- 2.1. EMD (Empirical Mode Decompositon)
EMD는 신호 x ( t )를 모드 또는 IMF(Intrinsic Mode Functions)라 불리는 함수로 분해하며, 한 개의 IMF는 다음 두 가지 조건을 만족해야 한다. (i) 극대점의 수와 영점교차(zero crossing)의 수는 같거나 최소한 한 개 이상의 차이가 나지 않는다. (ii) 지역 최대와 지역 최소에 의해 정의된 상위 포괄선(upper envelope)과 하위 포괄선의 평균은 0이다. EMD 알고리즘은 다음과 같다.
단계 1. 신호 x ( t )의 지역 극대‧극소를 추출한다.
단계 2. 단계 (1)에 의해 추출된 극점들은 큐빅 스플라인으로 연결하여 상위 포괄선 e _max( t )와 하위 포괄선을 e _min( t )을 형성한다.
단계 3. 상위 포괄선과 하위 포괄선의 평균 함수 m 1 ( t )를 계산한다.
PPT Slide
Lager Image
단계 4. 신호 x ( t )와 포괄선의 평균값인 m 1 ( t )의 차이값을 h 1 ( t )의 첫 번째 요소로 계산한다.
PPT Slide
Lager Image
만일 h 1 ( t )가 영평균(zero mean)이면 반복은 중단되고 이때 h 1 ( t )는 첫 번째 IMF 1 로서 C 1 ( t )로 표기되고 그렇지 않으면 단계 1)로 가서 h 1 k ( t )가 IMF가 될 때까지 k 번 반복한다. 반복 과정은 불규칙한 신호들을 제거하고 신호를 대칭적으로 만들기 위한 것으로 체과정(shifting process)으로 부른다.
PPT Slide
Lager Image
단계 5. 신호 x ( t )로부터 C 1 ( t )를 분리하여 레지듀 r 1 ( t )를 구한다. r 1 ( t )은 신호에 대한 정보를 포함하고 있기 때문에 새로운 신호로 보고 다시 체과정을 적용한다.
PPT Slide
Lager Image
단계 6. 만일 레지듀 r 1 ( t )가 최소 2개 이상의 극점을 가지면 단계 (1)로 가고 그렇지 않으면 분해 과정은 종료된다.
원 신호 x ( t )는 레지듀 rn ( t )와 C 1 ( t )부터 Cn ( t ) 까지의 n 개의 IMFs 의 집합으로 분해된다.
PPT Slide
Lager Image
EMD는 사용자에 의해 미리 정의된 파라미터값이나 선택된 기저함수를 사용하지 않고 완전히 데이터에 기반하므로 원신호의 특성을 잘 보존한다. 그림 1 (a)는 EMD 알고리즘의 단계 1-3을 구현한 것으로 신호의 극대‧극소점을 찾아 큐빅스플라인으로 연결한 후 상위포괄선과 하위포괄선의 평균을 구한 결과이고, 그림 1 (b)는 IMF를 구하기 위한 체과정으로 EMD 알고리즘의 단계 4-6의 과정으로 IMF를 구하기 위한 위의 두 가지 조건을 만족할 때까지 반복한다.
PPT Slide
Lager Image
ECG 신호 분해 과정 (a) 신호의 상위, 하위 포괄선 및 평균 (b) 체과정을 위한 반복적인 신호 분해 Fig. 1 Decomposition Processing of ECG Signal (a) Upper, Lower Envelope and mean of Signal (b) Iterative Signal Decomposition for Sifting
- 2.2. EEMD (Ensemble Empirical Mode Decompositon)
EMD 방법에 의한 신호 분해 시 각각의 모드는 유사한 스케일의 진동으로 분리되어야 하지만 상이한 스케일의 진동이 포함되는 모드 혼합 문제가 발생할 수 있다. EEMD에 있어 앙상블이라 함은 원신호 x ( t )에 서로 다른 분산을 가진 백색 잡음이 추가된 신호 xi ( t )를 말한다. 잡음이 섞인 신호를 EMD 방법으로 분해한 후 획득된 IMF들의 평균으로 EEMD를 정의한다. EEMD 알고리즘은 다음과 같다.
단계 1. 원 신호 x ( t )에 서로 다른 백색 잡음 wi ( t )을 추가하여 잡음이 섞인 신호의 앙상블을 만든다.
PPT Slide
Lager Image
단계 2. EMD 방법을 잡음 추가 신호인 xi ( t )에 적용하여 IMF들의 집합
PPT Slide
Lager Image
을 유도한다. 여기서
PPT Slide
Lager Image
i 번째 잡음 신호 앙상블의 k 번째 IMF로 표기한다. 여기서 k = 1,…, K 는 IMF의 수를 나타낸다.
단계 3. 구하고자 하는 분해 과정의 최종 IMFs 는
PPT Slide
Lager Image
로 대응되는
PPT Slide
Lager Image
의 앙상블의 평균으로 다음 수식과 같이 구한다.
PPT Slide
Lager Image
그림 2 (a)는 EMD 방법에 의해 10개의 IMF와 1개의 레지듀 신호로 분해된 결과이며, 그림 2 (b)는 EEMD 방법에 의해 11개의 IMF와 1개의 레지듀 신호로 분해를 보여준다. EMD 방법에 의한 신호 분해 모드들은 한 스케일에서 다른 스케일로 이행단계에서 간헐적 진동인 에일리어스에 의해 유사한 스케일을 가진 신호를 추출하는 것을 어렵게 만든다. EEMD 방법에 있어 분해하려는 데이터는 식 (6)에서 주어진 것처럼 신호와 잡음의 혼합이다. 측정의 정확성을 기하고자 앙상블 평균 방법을 사용하였으며, 앙상블 아이디어를 일반화하기 위해 원 신호에 서로 다른 백색잡음을 도입하여 수 많은 물리적 실험을 반복할 수 있는 신호를 만들 수 있게 된다. 백색 잡음을 추가하는 것이 낮은 SNR을 초래할 지라도 EMD 방법에 의한 신호 분해를 용이하게 하여 균등한 스케일 분포를 제공할 수 있다. 실제로 신호 데이터에 서로 다른 백색 잡음의 추가함으로써 신호 분해 방법에 영향을 미치지 않고 모드 혼합을 피하도록 하여 신호를 향상시킬 수 있음이 증명되었다 [4] . 그림 2 (b)는 식 (6-7)을 적용하여 신호를 분해한 결과로 그림 2 (a)의 EMD에 의한 신호 분해보다 균등한 스케일의 분해를 보여준다.
PPT Slide
Lager Image
EMD와 EEMD 방법에 의한 신호 분해 (a) EMD 방법에 의한 신호 분해 (b) EEMD 방법에 의한 신호 분해 Fig. 2 Decomposition of Signal by EMD vs EEMD (a) Signal Decomposition by EMD (b) Signal Decomposition by EEMD
- 2.3. 제안하는 방법
EEMD에서 각 xi ( t )는 독립적으로 분해되고, 레지듀는
PPT Slide
Lager Image
이다. 그러나 제안하는 방법에서의 분해 모드들은
PPT Slide
Lager Image
로 표기하고, 첫 번째 레지듀 r 1 ( t )를 다음 수식으로 계산한다.
PPT Slide
Lager Image
여기서
PPT Slide
Lager Image
는 EEMD에서와 같은 방법으로 구한다. 수식을 적용하여
PPT Slide
Lager Image
를 구하고 서로 다른 독립 동일 분포의 잡음이 추가된 r 1 ( t )의 앙상블로 첫 번째 EMD 모드를 계산하면 두 번째 레지듀는
PPT Slide
Lager Image
이다. 이 절차는 조건을 만족할 때까지 나머지 모드들에 적용된다.
식의 Ej (‧)는 신호가 주어질 때, EMD에 의해 j 번째 모드를 발생시키는 연산자로 정의한다. wi N (0,1)를 갖는 백색 잡음이고 ε 0 가 잡음 계수로 각 단계에서 SNR을 선택하도록 할 수 있으며, x ( t )는 최종적으로 복원해야 할 신호라 할 때 알고리즘은 다음과 같다.
단계 1. 첫 번째 모드들을 얻기 위하여 n 개의 앙상블 x ( t ) + ε 0 wi ( t )을 EMD로 분해하고 다음과 같이 계산한다.
PPT Slide
Lager Image
단계 2. 첫 번째 단계인 k = 1에서 수식 (1)과 같이 레지듀를 계산한다.
PPT Slide
Lager Image
단계 3. r 1 ( t ) + ε 1 E 1 ( wi ( t )), i = 1,…, n 신호를 분해하고 두 번째 모드를 수식 (11)과 같이 계산한다.
PPT Slide
Lager Image
단계 4. k = 2,…, K 에 대하여 k 번째 레지듀를 계산한다.
PPT Slide
Lager Image
단계 5. rk ( t ) + εk Ek ( wi ( t )), i = 1,…, n 를 분해하고 k + 1번째 모드는 다음 수식과 같다.
PPT Slide
Lager Image
단계 6. 단계 4로 가서 다음 k 에 대해 수행한다. 레지듀가 더 이상 분해 불가능할 때까지 단계 4~6을 수행한다. 최종 레지듀는 식(14)를 만족한다.
PPT Slide
Lager Image
전체 모드의 수 K 와 주어진 신호 x ( t )는 식(15)와 같다.
PPT Slide
Lager Image
식 (15)는 제안한 신호 분해 후에 IMF 집합인
PPT Slide
Lager Image
( k = 1, …, K )와 최종 레지듀 rK ( t )의 합으로 원신호를 재구성할 수 있음을 보여준다.
εi 의 계수가 각 단계에서 SNR을 선택하도록 할 수 있는데 추가된 잡음의 진폭과 관련하여 고주파 데이터에 대해 작은 진폭값을 사용하고 저주파는 큰 진폭값을 사용할 수 있다 [4] . 본 논문은 500개의 서로 다른 잡음이 첨가된 데이터를 사용하고 모든 단계에 동일한 SNR 값으로 고정한다.
그림 3 은 제안하는 방법에 의한 식 (9-15)를 구현한 결과를 보여준다. 그림 3 의 맨 위는 잡음이 섞인 ECG 신호를 나타내며
PPT Slide
Lager Image
은 분해 모드인 IMFs,
PPT Slide
Lager Image
은 레지듀 신호를 나타낸다.
PPT Slide
Lager Image
제안한 방법에 의한 신호 분해 Fig. 3 Decomposition of Signal by Proposed Method
그림 3 의 제안한 방법과 그림 2 (b)의 EEMD 방법에 의한 분해 결과를 비교할 때, 그림 3
PPT Slide
Lager Image
에서 더 균등한 스케일을 보이고 있으며, 체과정을 통해 얻은모드 수에 있어서도 EEMD 방법보다 적은 계산 비용이 소요되었다.
Ⅲ. 실험결과 및 분석
실험을 위한 데이터는 MIT-BIH 심전도 데이터베이스로부터 획득하였으며 [8] , 1028 길이의 샘플링된 신호를 발생시켜 EEMD 방법과 제안한 방법을 비교 실험하였다. 그림은 ECG 신호에 EEMD와 제안한 방법을 적용한 신호 분해 결과를 보여준다. 앙상블의 크기 K = 500를 사용하고 ε = 0.1, 그리고 14㏈의 SNR을 적용하였다. 그림 4 (a)에서 EEMD 방법을 적용한 결과 14개의 분해 모드를 발생시켰으며, 제안한 방법을 적용한 그림 4 (b)는 10개의 분해 모드를 보여주고 있다. 그림에서와 같이 두 가지 방법에 의한 분해에 있어 C 1 ~ C 5 까지 모드의 진폭은 유사하였으나, EEMD의 경우 C 6 ~ C 8 은 진폭이 10 −3 이하이며 C 9 이상은 매우 낮은 진폭을 보여주고 기대했던 대칭을 이루지 못하였다. 이러한 문제는 서로 다른 백색 잡음이 첨가된 신호들을 분해하여 평균한 결과이며, 모드 수에 있어서도 EEMD 방법은 13개, 제안한 방법 9개로 차이가 있음을 알 수 있다.
PPT Slide
Lager Image
EEMD와 제안한 방법에 의한 ECG 신호 분해 (a) EEMD 방법에 의한 ECG 신호 분해 (b) 제안한 방법에 의한 ECG 신호 분해 Fig. 4 Decomposition of ECG Singnal by EEMD vs Proposed Method (a) EC
EEMD 방법의 신호 분해는 식 (6)과 같이 서로 다른 잡음이 섞인 신호 xi ( t )로 분해된 모드들의 수가 각각 달라서 평균을 수행하기 위해 존재하지 않는 모드들을 0으로 채우고 계산하므로 낮은 진폭을 얻게 된다. 이러한 문제를 해결하기 위해 EEMD 방법에서와 같이 잡음이 섞인 신호 앙상블을 만든 후에 신호의 모드를 구한다. 그러나 EEMD 방법과 달리 각각의 해당 모드들의 평균을 계산하는 대신 잡음이 추가된 신호들을 첫 번째 모드에 도달할 때까지 분해한다. 식 (8)과 같이 레지듀를 구한 후 두 번째 모드를 계산하기 위해 첫 번째 레지듀에 잡음을 추가하여 분해하는 방법으로 그림 4 (b)와 같이 9개의 IMFs와 단조함수가 되는 마지막 분해 모드인 K 번째 레지듀 신호를 구하였다.
EEMD 방법과 비교했을 때 제안한 방법의 또 다른 장점은 체과정의 반복횟수가 적다는 것이다. EEMD 방법은 신호 분해를 위해 774510번의 체과정을 필요로 한 반면 제안한 방법은 161666번의 체과정을 필요로 하였다.
그림 5 는 각 IMF 모드를 얻기 위해 필요한 체과정의 총 반복횟수를 나타내고 있으며, EEMD 방법과 제안한 방법의 그래프를 보여준다. 그림 5 에서 알 수 있듯이 제안한 방법은 EEMD 방법에 의한 체과정의 20.87%만이 ECG 신호 분해에 요구되었다.
PPT Slide
Lager Image
EEMD와 제안한 방법의 체과정 반복 횟수 Fig. 5 Number of Shifting Processing for IMFs
신호의 분해에 요구되는 각 모드의 체과정 반복에 대한 박스 도표는 그림 6 에서 제시된다. 각 IMF의 단계에서 보여진 붉은 색의 +표식은 EMD 방법의 신호 분해조건을 만족하기 위한 반복 횟수를 나타낸다. 그림 6 의(a)와 (b)의 박스도표에서 반복 횟수를 보여주는 y축의 단위가 EEMD 방법은 35000을 나타내고, 제안하는 방법은 350을 보임으로써 제안한 방법의 연산 비용이 적음을 알 수 있다.
PPT Slide
Lager Image
EMD와 EEMD 방법에 의한 신호 분해 (a) EEMD 방법에 의한 각 모드에 따른 체과정의 박스 도표 (b) 제안한 방법에 의한 IMF에 따른 체과정의 박스 도표 Fig. 6 Boxplot showing Sifting Iterations by EMD vs EEMD (a) Boxplot showing Sifting Iterations for Each Mode by EEMD (b) Boxplot showing Sifting Iterations for Each Mode by Proposed Method
분해된 신호들을 식 (15)의 IMF들과 최종 레지듀의 합으로 재구성할 수 있다. 그림 7 (a), (b)는 EEMD와 제안한 방법에 의한 복원 오류의 결과를 ECG 원신호와 모드들의 합의 차로 계산하여 그래프로 나타내었다. 제안한 방법의 경우 오류 표준편차 2.38×10 −14 이고 최대 진폭은 2.5×10 −13 이다. EEMD 방법을 적용하여 이러한 정밀성에 도달하기 위해서는 식 (16)을 고려할 때 [5] , 백색 잡음이 포함된 신호의 수를 10 26 이상으로 증가시켜야 하므로 엄청난 연산 비용이 요구된다.
PPT Slide
Lager Image
PPT Slide
Lager Image
EEMD와 제안한 방법의 ECG 신호 복원 오류 (a) EEMD 방법의 ECG 신호 복원 오류 (b) 제안한 방법의 복원 신호 오류 Fig. 7 ECG Restoration Error of (a) EEMD (b) Proposed Method (a) ECG Restoration Error of EEMD (b) Restoration Signal Error of Proposed Method
Ⅳ. 결 론
본 논문에서 비선형적이고 비정상적인 신호를 분석하고 처리하기 위해 데이터에 기반한 신호 처리 알고리즘을 ECG 신호에 적용하여 실험하였다. 신호 분해를 위한 연산과정에서 EEMD 알고리즘을 개선하여 보다 적은 신호 앙상블을 적용함으로써 연산 비용의 감소를 가져왔고, 각 단계의 신호 분해 모드인 IMF들을 EEMD방법의 20.87% 정도의 체과정 만으로 해결할 수 있었다. 그리고 EEMD 방법은 백색 잡음의 추가 등으로 EMD 방법의 모드 혼합 문제를 해결하였음에도 원신호를 복원하는데 있어 완전히 데이터에 기반한 모드가 아니므로 정확한 복원이 어려웠으나 제안한 방법은 EEMD 방법에 의해 놓친 EMD 속성의 일부를 복원할 수 있었으며, 분해된 모드들의 합으로 원 신호를 정확히 복원할 수 있었다.
BIO
이금분(Geum-Boon Lee)
2002년 대전대학교 컴퓨터공학과 공학석사
2010년 조선대학교 컴퓨터공학과 공학박사
2013년~현재 조선이공대학교 컴퓨터보안과 조교수
※관심분야 : 영상보안, 신호처리, 패턴인식
References
Huang N. E. , Shen Z. , Long S. R. , Wu M. C. , Shih E. H. , Zheng Q. , N.-C. Yen. , Tung C. C. , Liu H. H. 1998 “The empical mode decomposition method and the Hilbert spectrum for nonlinear and non-stationary time series analysis,” Proc. Roy. Soc. London. A 454 903 - 995    DOI : 10.1098/rspa.1998.0193
Flandrin P. , Rilling G. , Goncalves P. 2004 "Empirical mode decomposition as a filter bank," IEEE Signal Process. Lett. 11 (2) 112 - 114    DOI : 10.1109/LSP.2003.821662
Weng B. , Blanco-Velasco M. , Earner K. E. "ECG denoising based on the empirical mode decomposition," in EMBS'06. 28th Annual International Conference of the IEEE Aug. 2006 1 - 4
Wu Z. , Huang N. E. 2009 "Ensemble empirical mode decomposition: A noise-assisted data analysis method," Advances in Adaptive Data Analysis 1 (1) 1 - 41    DOI : 10.1142/S1793536909000047
Torres M. E. , Colominas M. A. , Schlotthauer G. , Flandrin P. "A complete ensemble empirical mode decomposition with adaptive noise," in Proceeding of 2011 IEEE International Conference on Acoustics, Speech and Signal 2011 4144 - 4147
Chang K. M. 2010 "Ensemble empirical mode decomposition for high frequency ECG noise reduction," Biomedizinische Technik/Biomedical Engineering 55 193 - 201    DOI : 10.1515/bmt.2010.030
Lee G. B. , Cho B. J. 2009 "ECG Filtering using Empirical Mode Decomposition Method," Journal of the Korea Institute of Information and Communication Engineering 13 (12) 2671 - 2676
Moody G. B. , Mark R. G. 2001 The Impact of MIT-BIH Arrhythmia Database. IEEE Eng in Med and Bio [Internet]. Available: 20 (3) 45 - 50    DOI : 10.1109/51.932724