Advanced
Topological Analysis of Spaces of Waveform Signals
Topological Analysis of Spaces of Waveform Signals
Journal of Korea Multimedia Society. 2016. Feb, 19(2): 146-154
Copyright © 2016, Korea Multimedia Society
  • Received : October 23, 2015
  • Accepted : December 23, 2015
  • Published : February 28, 2016
Download
PDF
e-PUB
PubReader
PPT
Export by style
Article
Author
Metrics
Cited by
About the Authors
희 일, 한
Dept. of Information and Communications Eng., Hankuk University of Foreign Studies
hihahn@hufs.ac.kr

Abstract
This paper presents methods to analyze the topological structures of the spaces composed of patches extracted from waveform signals, which can be applied to the classification of signals. Commute time embedding is performed to transform the patch sets into the corresponding geometries, which has the properties that the embedding geometries of periodic or quasi-periodic waveforms are represented as closed curves on the low dimensional Euclidean space, while those of aperiodic signals have the shape of open curves. Persistent homology is employed to determine the topological invariants of the simplicial complexes constructed by randomly sampling the commute time embedding of the waveforms, which can be used to discriminate between the groups of waveforms topologically.
Keywords
1. 서 론
파형신호는 미지의 고차원 공간에서 무작위로 추출한 벡터라고 가정하는 문제를 상정한다. 이때 그 벡터의 차원은 신호의 길이와 일치한다. 주어진 파형신호에 해당되는 공간의 구조를 알 수 있다면, 이를 통하여 파형신호에 대한 인식이나 분류 등이 가능할 것으로 기대할 수 있다. 공간의 차원을 줄이기 위하여 파형신호 대신에 그 곳에서 작은 크기의 패치를 충분히 많이 추출하고 이들의 궤적을 저차원 공간의 기하구조로 변환한 다음, 그 기하구조의 위상특성을 분석하여 파형신호를 분류하는 것이 가능한지를 연구하는 것이 본 논문의 목적이다.
최근 들어 미분기하, 위상수학 등의 순수 수학 이론들을 이산 공간에서 처리하기 위한 연구가 크게 진척되면서 신호처리와 추상 수학의 융합이 새로운 트렌드로 자리매김하고 있다. 예를 들면, 미분기하의 개념을 도입하여 데이터를 고차원 다양체의 점으로 간주하고 이를 저차원 공간으로 임베딩함으로써 기하학적으로 차원을 줄이는 기법(dimensionality reduction)은 기계학습이나 컴퓨터 비전 등에서 이미 널리 이용되고 있다 [1 , 2 , 3] . 이에 더하여, 지속적 호몰로지 이론의 발표로 말미암아 가장 추상적인 수학분야로 알려진 대수적 위상수학을 신호처리 응용분야에 적용시키려는 기초연구가 최근들어 제한적으로 시도되고 있다 [4 , 5] . 이들의 대표적인 예로, 센서노드의 불규칙한 분포로 인하여 특정 지역에는 센서노드가 전혀 배치되지 않을 수 있는데, 이러한 영역(coverage hole)을 검출하는데 이용되거나 [6] , 다양한 특성의 수많은 이미지에서 추출한 패치가 이루는 공간이 클라인 병과 위상동형임을 증명하는데 활용된 바 있다 [7] .
현재까지 다양체 학습 기법을 이용하여 데이터들을 저차원 공간으로 임베딩함으로써 정보를 압축시키는 연구나, [7] 에서와 같이 확보한 데이터 공간이 특정공간과 위상동형임을 실험적으로 확인하는 연구결과는 비교적 많이 발표되었으나, 본 논문에서와 같이 다양체 학습을 이용하여 특정 신호 등에서 추출한 데이터들을 저차원 공간으로 임베딩시킨 다음, 이들의 임베딩 결과에 대한 위상구조를 분석한 연구는 아직까지 발표된 바 없다. 본 논문에서는 통계적 특성이나 스펙트럼이 시간에 따라 가변적인 파형신호를 다양체 임베딩할 때, 그에 따라 생성되는 기하구조는 변화하지만 그 신호 고유의 내재된 특성은 보존하고 있음을 보이고, 신호 고유의 내재된 특성은 다름 아닌 위상구조임을 실험적으로 확인하는 연구를 수행한다. 이를 위하여 최근에 개발된 지속적 호몰로지라고 부르는 대수적 위상수학 개념을 적용한다. 또한, 바틀넥 거리함수(bottleneck distance)를 이용하여 각 파형에서 구한 호몰로지 바코드 간의 거리를 측정함으로써 본 논문이 제안하는 특성을 정량적으로 분석한다 [8] . 간략히 부연하면, 삼각형과 원, 커피잔과 도너츠 등은 서로가 위상동형이어서 위상수학의 방식으로는 이들을 각각 구분하지 못한다. 따라서, 본 논문에서는 파형들을 개별적으로 분류하기 보다는 위상동형인 파형들을 군으로 분류하는데 그 목적이 있다.
본 논문의 구성은 다음과 같다. 2장에서는 파형신호에서 추출한 패치모음을 유클리드 공간으로 임베딩하는 과정을 설명한다. 3장에서는 임베딩 데이터를 무작위로 표본화하여 단순 복합체를 구성하는 방법과 호몰로지 이론을 리뷰하고, 복합체 열을 구성하여 지속적 호몰로지를 구하는 과정을 설명한다. 파형신호에서 구한 컴뮤트 타임 임베딩의 기하구조와 신호의 스펙트럼 간의 관계를 4장에서 실험적으로 확인하고, 그 기하구조에서 계산한 지속적 호몰로지를 이용하여 구한 위상구조를 5장에 설명한다. 마지막으로 6장에서는 결론을 맺고 향후 연구진행방향에 대하여 논의한다.
2. 패치 모음의 기하 구조 변환
- 2.1 컴뮤트 타임 임베딩
컴뮤트 타임 임베딩을 구현하기 위해서는 우선 패치모음을 그래프로 구성하여야 한다. 본 논문에서는 패치모음 { xn , n = 1,⋯, N }에 대하여 k-NN(k-nearest neighbor)방식을 이용하여 xv xu 에 가장 가까운 k 개의 인근 패치 안에 있거나 xu xv 에 가장 가까운 k 개의 인근 패치에 속하면 이들을 연결시킨다. 패치그래프에서 패치 xu xv 간의 가중치 w ( u,v )는 다음과 같다.
PPT Slide
Lager Image
여기서,
PPT Slide
Lager Image
이다 [9 , 10] . 그래프가 무방향(undirected)이고 가중행렬 W 가 대칭이면 그래프 라플라시안 행렬 L D-W 의 정의되는데, 여기서 D 는 각 원소가
PPT Slide
Lager Image
인 대각행렬을 나타낸다. 본 논문에서는 L Lsym = D -1/2 LD -1/2 으로 정규화시킨다. 두 노드 xi xj 간의 컴뮤트 타임 c ( xi , xj )는 다음과 같이 구할 수 있는데 [9] ,
PPT Slide
Lager Image
여기서,
PPT Slide
Lager Image
)이고, λk vk Lsym 의 고유값과 고유벡터를, vik vk i 번째 원소를 각각 나타낸다. 또한, 고유값 λk 는 0 = λ 1 λ 2 ≤⋯≤ λN < 2와 같이 정렬되어 있다고 가정한다. 위 식 (2)를 관찰하면
PPT Slide
Lager Image
R N -1 상의 두 벡터 간의 거리로 해석될 수 있다. 다시 말해서 xi 를 다음과 같이 임베딩하면
PPT Slide
Lager Image
식 (2)로부터
PPT Slide
Lager Image
이므로 그래프의 두 노드 xi xj 간의 유클리드 거리로 간주될 수 있는데, 이를 컴뮤트 타임 거리라고 부른다. 여기서, Lsym 의 고유벡터 vk 의 인덱스를 2부터 시작하는 이유는 v 1 에 해당되는 고유값 λ 1 이 0의 값을 갖기 때문이다. 그런데 임베딩 공간의 차원은 노드 수에 따라 증가하므로 어느 정도의 오차를 허용하는 범위 내에서 차원을 K = 3으로 줄이면 다음과 같이 정의될 수 있는데, 이를 이용하면 시각화가 가능한 장점이 있다 [9] .
PPT Slide
Lager Image
3. 호몰로지 이론
- 3.1 호몰로지
공간의 위상동형 개념 즉, 기하구조를 찢거나 이어 붙이지 않고 단순히 늘이거나 휘게 하는 과정을 통해서는 위상구조가 변하지 않음을 이용한다. 예를 들어, 삼각형과 원은 기하구조가 다르지만 이들은 서로 위상동형이다. 일반적으로 두 기하공간이 위상동형인지를 계산하는 것은 매우 어려운 작업이므로 이의 대안으로 호몰로지를 대수적으로 구하는 것이 보편적인 선택이다. 호몰로지란 쉽게 말해서 기하구조에서 다양한 차원의 홀(hole)의 수를 측정하기 위한 방법론이다. 본 논문에서는 기하공간이 PCD(point cloud data)로 주어지기 때문에 호몰로지를 구하기 위해서는 PCD를 기하구조로 변환하는 작업이 선행되어야 하는데, 이를 위하여 기하구조를 단순 복합체(simplicial complex)로 근사화시킨다. 본 논문에서는 계산이 간편하고 성능이 우수한 립스(Vietoris-Rips) 복합체 방식을 채택한다 [4] .
호몰로지 이론의 수학적 정의는 다음과 같이 요약될 수 있다. 주어진 단순 복합체 S ∈ℝ p 에 대하여, 사슬 군(chain group) Ck ( S ), 0 ≤ k p 는 기저원소로 k -심플렉스를 이용하여 구성된다. Ck ( s )의 원소인 k -사슬은 덧셈에 닫혀 있는 아벨 군(Abelian group)으로서 본 논문에서는 그 계수로 정수 ℤ를 이용한다. 경계사상(boundary map) ∂ k : Ck C k -1 k -사슬 σ = [ v 0 , v 1 ,⋯, vk ]에 대하여
PPT Slide
Lager Image
으로 정의되는데, 여기서,
PPT Slide
Lager Image
가 제거된 k -1사슬이다. 이 경계사상은 사슬 군을 다음과 같이 사슬 복합체로 연결시키는 역할을 한다.
PPT Slide
Lager Image
k 의 커널 ker(∂ k )은 그 경계가 0인 k -사슬을, ∂ k 의 치역 img (∂ k )는 k -사슬의 경계인 k -1-사슬을 각각 나타낸다. k -순환(cycle)은 ker(∂ k )의 원소인 k -사슬이고 k -경계(boundary)는 img (∂ k+1 )의 원소인 k -사슬이다. k -순환 군 Zk k -경계 군 Bk Ck 의 부분군(subgroup)으로서 Bk Zk Ck 인 관계가 있다 [5] . k -호몰로지 군 Hk Zk / Bk 인 상군(quotient group)으로 정의되는데, Hk 의 랭크(rank)를 복합체 S k -베티 수(Betti number)라고 부른다. 예를 들어, 임의의 순환 c ∈ ker(∂ 1 )는 H 1 의 한 원소인 동등류(equivalence class) [ c ]에 속하고, 두 개의 순환 c 1 , c 2 ∈ker(∂ 1 )가 H 1 의 동일한 원소로 매핑되면, 즉, [ c 1 ] = [ c 2 ]이면 c 1 c 2 는 동일한 홀을 감싼다. [ c ] = 0이면, 1-순환 c 는 축약가능(contractible)하다고 말하는데, 어떠한 홀도 감싸지 않으며 img (∂ 2 )의 원소가 된다 [4] .
- 3.2 지속적 호몰로지
기하구조의 연결성에 대한 모든 정보를 알면 호몰로지를 이용하여 그 구조의 위상특성을 구할 수 있지만, 무작위 표본화된 데이터로 간주된 PCD로 주어지면 그 내부의 각 점이 어떻게 연결되어 있는지 알 수 없으므로 호몰로지를 적용하는데 어려움이 발생한다. 공간의 연결성이 위상구조를 결정하므로 PCD내의 각 점의 연결성을 지정해 주어야 한다. 이를 위하여 지속특성(persistence) 개념이 도입된다. 기하공간 M 의 립스 복합체 Rϵ ( M )에서는 점들의 부분집합 σ = { x 0 , x 1 ,⋯, xk }에서 각 쌍의 점 xi , xj σ 간의 거리 d ( xi , xj ) ≤ ϵ 이면 σ k -심플렉스를 스팬한다. PCD외에 별 다른 정보를 알지 못하면 최적의 ϵ 을 찾는 것은 사실상 불가능하다. 따라서 ϵ 가 단순 증가하는 값을 갖는 수열이 되도록 Rϵ ( M )을 구성하여 복합체열(persistence complex)을 얻은 다음, 이로부터 호몰로지의 추이를 관찰하면 위상구조를 추론할 수 있는데, 이 기법을 지속적 호몰로지라고 부른다. 여기서 복합체 열은 Rϵ ( M )의 열, 사슬(chain)과 경계 사상등의 집합체 등을 말한다 [4 , 5] . 지속적 호몰로지를 구하기 위해서는 이와 같은 방법으로 복합체 열 0 = K 0 K 0 ⊆⋯⊆ Km = K 을 생성하여야 한다. 여기서 심플렉스 σ Ki 를 만족시키는 인자 i 의 최소값은 σ 의 필트레이션(filtration) 인자로 정의되는데, σ k 차원 홀을 필트레이션 인자 s 에서 생성하고 t 에서 소멸시킬 때, 그 구간 [ s,t )를 k 차원 홀의 지속구간(persistence)이라고 부른다. Ks p 지속구간 k 차원 호몰로지 군은
PPT Slide
Lager Image
으로 정의되는데 [4 , 5] 여기서, p = t - s 이고,
PPT Slide
Lager Image
Ks k -순환 군을,
PPT Slide
Lager Image
K s+p k -경계 군을 각각 나타낸다. 본 논문에서 지속적 호몰로지는 Fig. 8 에 나타낸 바와 같이 각 지속구간을 수평막대의 집합으로 그래프화 시킨 바코드로 표현한다. 막대의 길이, 즉 지속구간이 짧으면 이는 위상특성을 반영한다기보다는 표본화 과정의 불규칙으로 인한 위상잡음으로 간주되고 긴 막대만이 위상정보로 인식된다.
4. 파형 신호의 기하 구조
본 논문에서는 파형신호의 기하와 위상구조 등을 파악하고 분석하기 위하여, 바이올린, 호른 등의 악기 음과 음성신호를 시료 데이터로 이용한다. 선행실험으로 주기신호와 비주기 신호의 임베딩 특성을 알아보기 위하여 정현파와 처프(chirp) 신호를 컴뮤트 타임 임베딩한다. Fig. 1 은 이 신호에서 25차원 벡터 크기의 패치를 최대한 겹치도록 676 개 추출하여 패치 그래프를 구성한 다음, 식 (4)를 이용하여 컴뮤트 타임 임베딩한 결과를 각각 보여 준다. 이를 통하여 비주기 신호를 임베딩하면 열린 곡선의 형태를 갖지만 주기 신호의 임베딩은 고리구조로 표현됨을 알 수 있다.
PPT Slide
Lager Image
Commute time embedding of a sinusoidal and a chirp signal. (a) sinusoidal (b) chirp signal.
- 4.1 악기 음의 기하 구조
우선, 관악기 음의 기하구조를 알아보기 위하여 호른, 플룻 등의 악기 음으로부터 1,500 샘플 길이의 세그멘트를 여러 개 추출한 다음 각 세그멘트에서 패치모음을 삼차원 유클리드 공간에 컴뮤트 타임 임베딩시킨다. Fig. 2 는 호른 음에서 추출한 두 개의 세그멘트 파형과 컴뮤트 타임 임베딩 및 이의 전력 스펙트럼(periodogram averaging)을 각각 보여 준다. Fig. 2 (a)와 (d)에 주어진 호른 음의 파형 세그멘트에 해당되는 컴뮤트 타임 임베딩은 Fig. 2 (b)와 (e)에, Fig. 2 (c)와 (f)는 이들 파형에 대한 전력 스펙트럼을 각각 나타낸다. 이 그림을 보면 알 수 있듯이, 호른 음의 파형 신호는 대역폭이 좁고 이의 임베딩은 두 개의 고리가 서로 연결되어 있는 구조를 갖는다. Fig. 3 은 플룻 음의 파형, 임베딩 및 전력 스펙트럼을 각각 나타내고 있는데, 플룻 음의 스펙트럼은 두 개의 뚜렷한 주파수 성분으로 구성되어 있다는 점에서 호른 음과 유사하며, 이러한 특성이 임베딩 기하에 구조적으로 반영되어 있음을 확인할 수 있다. 이와 같은 관점에서 임베딩 결과는 패치모음의 통계적 특성이나 스펙트럼에 따라 가변적인 구조를 갖고 있으나, 악기음 별로 세그멘트가 달라도 변하지 않는 그 고유의 기하구조를 지니고 있음을 추론할 수 있다.
PPT Slide
Lager Image
Commute time embedding and power spectrums of two different patch-sets of a horn sound. 1st column: waveforms, 2nd column: embedding results and 3rd column: power spectrums.
PPT Slide
Lager Image
Commute time embedding and power spectrums of two different patch-sets of a flute sound. 1st column: waveforms, 2nd column: embedding results and 3rd column: power spectrums.
관악기 음에 비해, 바이올린의 파형은 보다 동적이고, 따라서 Fig. 4 에 보인 바와 같이 보다 복잡한 기하구조를 가진다. 반면에, 첼로 음의 기하구조는 Fig. 5 에서 알 수 있듯이 바이올린과 매우 다르다. 이는 Fig. 6 에 제시한 해당 파형을 비교해보면 쉽게 예상이 가능하다. Fig. 6 (a)와 (b)는 Fig. 4 (a)와 Fig. 5 (a)의 임베딩에 대응되는 파형을 각각 나타낸다.
PPT Slide
Lager Image
Commute time embedding and power spectrums of two different patch-sets of a violin sound. Upper row: embedding results, Lower row: power spectrums.
PPT Slide
Lager Image
Commute time embedding and power spectrums of two different patch-sets of a cello sound. Upper row: embedding results, Lower row: power spectrums
PPT Slide
Lager Image
The waveform segments of the violin and the cello instrumental sounds whose embedding results are given in (a) Fig. 4(a) (b) Fig. 5(a)
- 4.2 음성 신호의 기하 구조
앞 절에서 수행한 악기 음에 대한 실험을, 한국어 모음 [아:], [오:], [우:] 음에서 추출한 파형에 적용하여 구한 컴뮤트 타임 임베딩 결과를 Fig. 7 에 제시한다. 이 그림에서 좌측 열은 세번째 열의 임베딩에 대응되는 파형 세그먼트인데, 이를 자세히 살펴보면, 임베딩의 폐곡선 수는 뚜렷이 구분되는 포먼트 성분의 수에 비례하는 것을 볼 수 있다. [아:] 파형에는 세 개의 포먼트 성분이 있으나 이들 간의 간격이 좁아 임베딩에서 뚜렷하지 않다. 하지만, [오:]와 [우:]는 육안으로도 구별할 수 있을 만큼 두 개의 뚜렷한 포먼트 성분을 갖고 있어서 임베딩 기하구조가 동수의 폐곡선으로 구성된 것으로 파악된다.
PPT Slide
Lager Image
Commute time embedding of Korean speech signals. (a) vowel [a:] (b) vowel [o:] (c) vowel [u:].
5. 파형 신호의 위상 구조 분석
- 5.1 악기 음의 위상 구조
호른 음과 플롯 음의 기하구조는 두 개의 고리로 구성되어 있다는 점에서 이들의 위상구조는 기본적으로 동일할 것으로 추론할 수 있다. 이를 확인하기 위하여 본 논문에서는 기하구조에서 150 개의 점을 무작위로 표본화하여 립스 복합체 열을 구성한 후, 이로부터 지속적 호몰로지를 구한다. Fig. 8 Fig. 2 (b)와 (e)에 주어진 호른 음의 기하구조에서 구한 지속적 호몰로지를 바코드 형태로 나타낸다. 이 그림을 보면, 0차원 호몰로지와 1차원 호몰로지에 긴 선이 각각 한 개와 두 개 그려져 있으므로 0차원 베티수와 1차원 베티 수는 각각 1과 2이고, 이는 한 개의 연결성분이 두 개의 고리로 구성되어 있음을 의미한다. 여기서 면으로 둘러싸인 이차원 홀은 존재하지 않으므로 2차원 베티 수는 0이다. 따라서 호른 음에 대한 호몰로지 군은 다음과 같이 나타낼 수 있다.
PPT Slide
Lager Image
PPT Slide
Lager Image
The persistence barcodes of the Rips complexes (0 ≤ ϵ ≤ 8) constructed from the embedding results of horn sounds, as given in (a) Fig. 2(b), (b) Fig. 2(e).
여기서, Hk 의 랭크를 k -베티 수라고 부른다. 플롯음에 대한 호몰로지 군도 위와 동일하다.
관악기 음의 임베딩이 두 개의 고리가 연결된 구조인 반면, 현악기 음의 임베딩은 바이올린과 첼로가 서로 다른 구조를 갖는다. 바이올린 음의 기하구조는 Fig. 4 에서와 같이 세 개의 고리로 구성되어 있지만 첼로 음은 Fig. 5 에서 확인할 수 있듯이 한 개의 고리형태를 갖는다. 0차원 베티수가 연결 성분의 수를 나타내는 바, 본 논문에서 제시한 기하구조는 모두 단일 성분으로 구성되어 있어 0차원 호몰로지는 기본적으로 동일하다. 즉, H 0 ( K ) = ℤ이다. 또한, 2차원 홀은 존재하지 않으므로 이들의 2차원 호몰로지는 모두 H 2 ( K ) = {0}이다. 따라서, 1차원 호몰로지만 위상정보를 갖고 있다. 이에 따라 바이올린 음과 첼로 음의 1차원 바코드만 Fig. 9 에 제시한다. 이 바코드를 통하여 바이올린과 첼로 음의 1차원 호몰로지 군은 각각 H 1 ( K ) = ℤ⊕ℤ⊕ℤ, H 1 ( K ) = ℤ임을 알 수 있다.
PPT Slide
Lager Image
The first dimensional persistence barcodes of the Rips complexes constructed from commute time embedding of violin and cello sounds. (a) the barcode for the embedding result of Fig. 4(a) (b) the barcode for the embedding result of Fig. 5(a)
- 5.2 음성 신호의 위상 구조
앞 절에서 설명한 음성신호의 임베딩 구조를 위상적으로 확인하기 위하여 Fig. 7 의 3 열에 나타낸 컴뮤트 타임 임베딩에 대한 지속적 호몰로지를 Fig. 10 에 제시한다. 위에서 설명한 바와 같이, 음성신호의 컴뮤트 타임 임베딩에 대한 위상특성은 1차원 호몰로지로 충분하다. 이러한 이유로 Fig. 10 에 세 개의 모음에 대한 1차원 호몰로지 바코드를 제시한다. 이와 같이, 파형신호를 기하구조로 변환한 다음, 이의 지속적 호몰로지를 구하면 파형신호 고유의 위상구조를 알 수 있으므로 이를 이용하여 신호들을 대역적으로 분류할 수 있다.
PPT Slide
Lager Image
The first dimensional persistence barcodes of the Rips complexes constructed from commute time embedding of the speech signals, as given in the thrid column of Fig. 7. (a) vowel [a:] (b) vowel [o:] (c) vowel [u:].
- 5.3 지속적 호몰로지 간의 거리 분석
위상정보는 해당 기하의 연결구조에 대한 의미만 보유하고 디테일 정보는 나타내지 않으므로 삼각형과 원, 컵과 도너츠를 각각 구별하지 못하고 동일 구조로 인식하는 특성이 있다. 그럼에도 불구하고 서로 다른 기하구조의 지속적 호몰로지가 주어지면 이들 간의 거리를 정의하여 유사도를 측정할 수 있다. 이의 대표적인 거리함수로 바틀넥 거리가 있는데, Cohen-Steiner는 이를 이용하여 지속적 호몰로지 간의 거리를 안정적으로 구할 수 있음을 증명하였다 [8] . 여기서, 안정적이라 함은 호몰로지에 적은 양의 왜곡이 발생하면 이에 따른 거리의 변화도 작음을 의미한다. 두 개의 호몰로지 바코드 집합 X, Y ⊂ ℝ 2 에 대한 바틀넥 거리는
dB ( X, Y ) = inf γsup xX x - γ ( X )║으로 정의된다. 여기서, 각 바를 나타내는 x = ( a, b )에서 a 는 바의 x 좌표를, b 는 바의 길이를 각각 나타내고, 모든 가능한 일대일 매핑 γ : X Y 를 고려한다. 여기서, p,q ⊂ ℝ 2 에 대하여 ║ p-q = max{| p 1 - q 1 |·| p 2 - q 2 |이다. 예를 들어, Fig. 8 에 주어진 두 개의 호몰로지 바코드에 대하여 위 식을 적용하면, 0차원과 1차원 바틀넥 거리는 각각 1.40, 0.933으로 구해진다.
본 논문에서는 호른, 플롯, 바이올린, 첼로 등의 악기 음과 모음 ‘아’, ‘오’, ‘우’에서 각각 7 개의 세그멘트를 추출하여 이에 대한 분류 실험을 하였을 때의 실험결과를 Table 1 에 제시한다. 위에서 설명한 바와 같이 의미 있는 위상정보는 1차원 호몰로지에 존재하므로 이 실험에서는 1차원 바틀넥 거리만 이용한다. 본 논문에서 이용한 7 개 파형에 대하여 바코드 위상정보만을 이용하여 파형을 분류하였을 때의 성능을 보면 매우 저조하지만 위상동형인 파형 군 {첼로, ’아‘}, {호른, 플롯, ‘오’, ‘우}, {바이올린}은 평균 92%로 비교적 정확히 분류함을 알 수 있다.
The rate of classification of waveforms based on the persistence barcodes
PPT Slide
Lager Image
The rate of classification of waveforms based on the persistence barcodes
6. 결 론
본 논문에서는 악기 음과 음성신호를 대상으로 이들을 기하구조로 변환시킨 다음 지속적 호몰로지를 이용하여 이들을 위상적으로 해석하는 기법을 제안하였다. 컴뮤트 타임 임베딩을 여러 악기 음과 음성신호에 적용시켜 본 바, 신호의 스펙트럼 변화에도 불구하고 임베딩 결과는 그 신호에 고유한 기하구조를 보존하고 있음을 확인하였다. 하지만, 생성된 기하구조로부터 유용한 정보를 추출해 내는 것은 쉬운 일이 아니다. 이를 해결하기 위한 기초 연구로 임베딩 데이터를 무작위로 표본화하여 립스 단순 복합체를 구성한 다음 이로부터 지속적 호몰로지를 구하여 이들의 위상 특성을 분석하는 기법을 제안하였다.
본 논문에서는 생성된 기하구조의 호몰로지를 이용하므로 파형을 개별적으로 분류하기 보다는 위상동형인 파형 군을 분류하는데 그 목적이 있다. 위상구조를 결정하는 요인은 뚜렷한 포먼트 주파수의 수와 관련 있음을 실험으로 추론한 바 있는데, 향후에는 위상특성을 결정하는 신호의 특성이 무엇인지를 정량적으로 분석하기 위한 연구를 진행할 계획이다.
BIO
한 희 일
1980년 3월∼1984년 2월 서울대학교 제어계측 공학과 공학사
1984년 3월∼1986년 2월 서울대학교 제어계측 공학과 공학석사
1992년 8월∼1995년 12월 University of Arizona 전기및 컴퓨터 공학과 공학박사
1987년 1월∼1998년 3월 한국전자통신연구원, 선임연구원
1998년 3월∼현재 한국외국어대학교 정보통신공학과 교수
관심분야 : 신호처리, 영상처리, 컴퓨터비전, 패턴인식, 미분기하 및 토폴로지
References
Tenenbaum J.B. , DeSilva V. , Langford J.C. 2000 “A Global Geometric Framework for Nonlinear Dimensionality Reduction,” Science 290 2319 - 2323    DOI : 10.1126/science.290.5500.2319
Belkin M. , Niyogi P. 2003 “Laplacian Eigenmaps for Dimensionality Reduction and Data Representation,” Neural Computation 15 (6) 1373 - 1396    DOI : 10.1162/089976603321780317
Hahn H. 2013 “Proposing a Connection Method for Measuring Differentiation of Tangent Vectors at Shape Manifold,” Journal of Korea Multimedia Society 16 (2) 160 - 168    DOI : 10.9717/kmms.2013.16.2.160
Edelsbrunner H. , Letscher D. , Zomorodian A. 2002 “Topological Persistence and Simplification,” Proceeding of Discrete Computational Geometry 28 511 - 533    DOI : 10.1007/s00454-002-2885-2
Zomorodian A. , Carlsson G. 2005 “Computing Persistent Homology,” Proceeding of Discrete Computational Geometry 33 249 - 274    DOI : 10.1007/s00454-004-1146-y
Chintakunta H. , Krim H. 2014 “Distributed Localization of Coverage Holes Using Topological Persistence,” IEEE Transactions on Signal Processing 62 (10) 2531 - 2541    DOI : 10.1109/TSP.2014.2314063
Chazal F. , Guibas L. , Oudot S.Y. , Skraba P. “Analysis of Scalar Fields Over Point Cloud Data,” Proceedings of the Nineteenth Annual ACM-SIAM Symposium on Discrete Algorithms 2009 1021 - 1030
Cohen-Steiner D. , Edelsbrunner H. , Harer J. “Stability of Persistence Diagrams,” Proceeding of 21st ACM Symposium on Computational Geometry 2005 263 - 271
Taylor K.M. , Doctor‘s Thesis 2011 The Geometry of Signal and Image Patch-sets University of Colorado Doctor‘s Thesis
Hahn H. 2014 “Analysis of Commute Time Embedding Based on Spectral Graph,” Journal of Korea Multimedia Society 17 (1) 101 - 109    DOI : 10.9717/kmms.2014.17.1.034