Vyuˇzit´ı zlomkov´ych stochastick´ych proces˚u pro anal...

Post on 30-Aug-2020

12 views 0 download

Transcript of Vyuˇzit´ı zlomkov´ych stochastick´ych proces˚u pro anal...

Vyuzitı zlomkovych stochastickych procesu pro analyzu

signalu a casovych rad

Seminar strojoveho ucenı a modelovanı

Martin Dlask (KSI FJFI)

http://people.fjfi.cvut.cz/dlaskma1/

3. brezna 2016

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 1 / 62

Juliova mnozina

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 2 / 62

Juliova mnozina

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 3 / 62

Juliova mnozina

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 4 / 62

Fraktalnı mnoziny

Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 5 / 62

Fraktalnı mnoziny

Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)

→ mnoziny s necelocıselnou dimenzı

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 6 / 62

Fraktalnı mnoziny

Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)

→ mnoziny s necelocıselnou dimenzı

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 7 / 62

Fraktalnı mnoziny

Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)

→ mnoziny s necelocıselnou dimenzı

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 8 / 62

Fraktalnı mnoziny

Tak co jsou vlastne fraktaly? (pokud ne jen barevne obrazky)

→ mnoziny s necelocıselnou dimenzı

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 9 / 62

Fraktalnı mnoziny

mnozina je charakterizovana svojı

mıroufraktalnı dimenzı - Hausdorffova dimenze

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 10 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 11 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 12 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 13 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 14 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 15 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 16 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 17 / 62

Fraktalnı mnoziny

δ-pokrytı mnoziny F ⊂ Rn

mnozina v R2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 18 / 62

Hausdorffova mıra a dimenze

Hausdorffova s-rozmerna mıra mnoziny F ⊂ Rn

Hs(F ) = limδ→0

inf

{

+∞∑

i=1

(diam(Ai ))s : (Ai ) je δ-pokrytı mnozinyF

}

Hausdorffova dimenze

dimH(F ) = sup {s : Hs(F ) = +∞}

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 19 / 62

Fraktalnı mnoziny

dimH(C ) = log(4)/ log(3) dimH(S) = log(3)/ log(2)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 20 / 62

Zlomkovy Brownuv pohyb

zlomkovy Brownuv pohyb BH(t) - spojity gaussovsky proces

definovany na intervalu 〈0;+∞)

je zavisly na parametru H ∈ (0; 1)

dimH(BH(t)) = 2− H

autokovariancnı funkce

cov(BH(t),BH(s)) =σ2

2

(

|t|2H + |s|2H + |t − s|2H)

0 50 100 150 200 250 300 350 400 450 500−1.5

−1

−0.5

0

0.5

1

1.5

t

BH

(t)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 21 / 62

Zlomkovy Brownuv pohyb

Zlomkovy Brownuv pohyb - spojity proces

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 22 / 62

Zlomkovy Gaussuv sum

zlomkovy Gaussuv sum GH(t) - spojity gaussovsky proces

definovany na intervalu 〈0;+∞)

je zavisly na parametru H ∈ (0; 1)

dimH(GH(t)) = 2

autokovariancnı funkce

cov(GH(t),GH(t + k)) =σ2

2

(

|k + 1|2H − 2 · |k |2H + |k − 1|2H)

0 50 100 150 200 250 300 350 400 450 500−0.1

−0.05

0

0.05

0.1

t

GH

(t)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 23 / 62

Specialnı prıpady pro H=0,5

zlomkovy Brownuv pohyb pro H = 0, 5 → Wieneruv proces

0 50 100 150 200 250 300 350 400 450 500−0.2

0

0.2

0.4

0.6

0.8

1

1.2

t

W(t

)

zlomkovy Gaussuv sum pro H = 0, 5 → bıly sum

0 100 200 300 400 500−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

t

WN

(t)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 24 / 62

Specialnı prıpady pro H=0,5

Wieneruv proces

jeho diference - bıly sum (short memory)

Norbert Wiener

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 25 / 62

Vlastnosti zlomkoveho Brownova pohybu

parametr H fraktal zavislost prırustku

H = 1 ne ano

H = 0,5 ano ne

H = 0 ano ano

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 26 / 62

Hurstuv exponent

D = 2− H

D . . . Hausdorffova dimenzeH . . . Hurstuv exponent

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 27 / 62

Hurstuv exponent

D = 2− H

D . . . Hausdorffova dimenzeH . . . Hurstuv exponent

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 28 / 62

Metoda R/S

R . . . rozsah (range)

S . . . smerodatna odchylka (std)

m . . . velikost segmentu

1 vypocet strednı hodnoty R/S v kazdem segmentu

(R/S)m =1

r

r∑

j=1

Rj

Sj,

2 pouzitı regresnıho modelu

E [(R/S)] ∝ mH .

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 29 / 62

Metoda R/S

R . . . rozsah (range)

S . . . smerodatna odchylka (std)

m . . . velikost segmentu

1 vypocet strednı hodnoty R/S v kazdem segmentu

(R/S)m =1

r

r∑

j=1

Rj

Sj,

2 pouzitı regresnıho modelu

E [(R/S)] ∝ mH .

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 30 / 62

Metoda R/S

R . . . rozsah (range)

S . . . smerodatna odchylka (std)

m . . . velikost segmentu

1 vypocet strednı hodnoty R/S v kazdem segmentu

(R/S)m =1

r

r∑

j=1

Rj

Sj,

2 pouzitı regresnıho modelu

E [(R/S)] ∝ mH .

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 31 / 62

Metoda R/S

R . . . rozsah (range)

S . . . smerodatna odchylka (std)

m . . . velikost segmentu

1 vypocet strednı hodnoty R/S v kazdem segmentu

(R/S)m =1

r

r∑

j=1

Rj

Sj,

2 pouzitı regresnıho modelu

E [(R/S)] ∝ mH .

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 32 / 62

Metoda pruchodu nulou (zero-crossing)

1 vypocet pravdepodobnosti pruchodu nulou

p∗ =pocet prusecıku

pocet dat

2 vypocet bodoveho odhadu H

H = 1 + log2 cosπp∗

2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 33 / 62

Metoda pruchodu nulou (zero-crossing)

1 vypocet pravdepodobnosti pruchodu nulou

p∗ =pocet prusecıku

pocet dat

2 vypocet bodoveho odhadu H

H = 1 + log2 cosπp∗

2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 34 / 62

Metoda pruchodu nulou (zero-crossing)

1 vypocet pravdepodobnosti pruchodu nulou

p∗ =pocet prusecıku

pocet dat

2 vypocet bodoveho odhadu H

H = 1 + log2 cosπp∗

2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 35 / 62

Vylepsena metoda pruchodu nulou (zero-crossing revisited)

bodovy odhad Hurstova exponentu H za predpokladu znamepravdepodobnosti p∗

H = 1 + log2 cosπp∗

2

pocet pruchodu nulou Z ve vzorku delky N se rıdı binomickymrozdelenım

f (Z |p∗) =

(

N

Z

)

(p∗)Z · (1− p∗)N−Z

po pouzitı Bayesovske inverze ma pravdepodobnost pruchodu nulouBeta-rozdelenı

fPOST(p∗|Z ) =

(p∗)Z−α(1− p∗)N−Z−α

B(Z + 1− α,N − Z + 1− α)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 36 / 62

Vylepsena metoda pruchodu nulou (zero-crossing revisited)

po rozdelenı casove rady na L castı (v kazde casti je Zk pruchodunulou) muzeme vypocıtat agregovanou hustotu pravdepodobnosti

fL(p) =1

L

L∑

k=1

pZk−α(1− p)N−α−Zk

B(Zk + 1− α,N − Zk + 1− α)

idealnı rozdelenı (optimalnı segmentace) je na L∗ dılu

L∗ =

{

1, kdyz fL(p) je jednovrcholova pro vsechna L

min {L > 1 : fL(p) je jednovrcholova } , jinak

→ delıme signal na jemnejsı segmenty do te doby, dokud nenıagregovana hustota pravdepodobnosti fL(p) jednovrcholova

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 37 / 62

Vizualizace optimalnı segmentace

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 38 / 62

Vizualizace optimalnı segmentace

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 39 / 62

Vizualizace optimalnı segmentace

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 40 / 62

Vizualizace optimalnı segmentace

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 41 / 62

Vylepsena metoda pruchodu nulou (zero-crossing revisited)

vypocet Hurstova exponentu

E(H) = 1 +

∫ 1

0fL∗(p) log2 cos

2dp

tradicnı metoda nova metoda

bodovy odhad H strednı hodnota a konfidencnıintervaly

pravdepodobnost pruchodu nulou jenahrazena relativnı cetnostı

pravdepodobnost pruchodunulou ma Beta-rozdelenı

pojıma signal jako celek vyuzıva bayesovskeho prıstupua segmentace signalu

absence konfidencnıho intervalu realisticky konfidencnı interval

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 42 / 62

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 43 / 62

Aplikace fraktalnı teorie

Pouzitı Hurstova exponentu:

1 test generatoru nahodnych cısel - nejjednodussı pouzitı

2 ekonomie - zavislost vyvoje casovych rad (indexy akciovych trhu)

3 biomedicına - detekce Alzheimerovy choroby ze signalu EEG

4 IT - vytızenı pocıtacovych sıtı z hlediska mnozstvı dat

5 hydrologie - analyza prutoku vodnıch toku

6 hudba - klasifikace hudebnıch zanru

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 44 / 62

Ekonomie - merenı zavislosti a predikovanı casovych rad

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 45 / 62

Ekonomie - merenı zavislosti a predikovanı casovych rad

pouzitı nove metodiky pro odhad Hurstova exponentu

data z obdobı 1991 - 2015zkoumane indexy akciovych trhu:

Evropa - CAC40, DAX, FTSE, SMIAsie - HSI, NIKKEISevernı Amerika - SP500, NASDAQ, TSX

zkoumany jejich logaritmicke diference (za predpokladu fGn)

1990 1995 2000 2005 2010 20150

500

1000

1500

2000

2500

t

x(t)

SP500Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 46 / 62

Ekonomie - merenı zavislosti a predikovanı casovych rad

mıra zavislosti casove rady je dana Hurstovym exponentem

casova rada je predikovatelna, kdyz je Hurstuv exponent vetsı nez 0,5

pouzitı nastroje pro zlomkove modelovanı casovych rad (ARFIMA)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 47 / 62

Ekonomie - merenı zavislosti a predikovanı casovych rad

ekonomicke casove rady jsou obtızne predikovatelne

vetsinou je Hurstuv exponent blızky 0,5

u vıce zavislych casovych rad je zapotrebı maly pocet delenı

5 10 15 20 250

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

L

H

SP500

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 48 / 62

Ekonomie - merenı zavislosti a predikovanı casovych rad

index L∗ EH 95% CI

CAC40 5 0.4652 (0.3746;0.5545)

DAX 1 0.4790 (0.4556;0.5023)

FTSE 3 0.4863 (0.4361;0.5482)

HSI 1 0.4974 (0.4746;0.5201)

NASDAQ 14 0.5418 (0.4008;0.7136)

NIKKEI 3 0.4532 (0.4034;0.5068)

SMI 1 0.5087 (0.4863;0.5310)

SP500 6 0.4460 (0.3225;0.5628)

TSX 12 0.5607 (0.3957;0.6992)

Optimalnı segmentace a konfidencnı intervaly

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 49 / 62

ARFIMA modely

B . . . operator posunutı

B i(Xt) = Xt−i

ARMA(p,q) model

(

1−

p∑

i=1

φiBi

)

Xt =

(

1 +

q∑

i=1

θiBi

)

et

ARIMA(p,d,q) model, kde p ∈ N

(

1−

p∑

i=1

φiBi

)

(1− B)dXt =

(

1 +

q∑

i=1

θiBi

)

et

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 50 / 62

ARFIMA modely

ARFIMA(p,d,q) model, kde d ∈ (0, 1)

(

1−

p∑

i=1

φiBi

)

(1− B)dXt =

(

1 +

q∑

i=1

θiBi

)

et

ma stejny zapis jako ARIMA s rozdılem, ze

(1− B)d =

∞∑

k=0

(

d

k

)

(−B)k = 1− d · B +d(d − 1)

2!B2 − · · ·

parametr d vypocteme z Hurstova exponentu H jako

d = H − 1/2

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 51 / 62

Biomedicına - diagnostika Alzheimerovy choroby z EEG

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 52 / 62

Biomedicına - diagnostika Alzheimerovy choroby z EEG

analyza 19 kanalu EEG

rozdılny Hurstuv exponent zdravychsubjektu a pacientu trpıcıch Alzheimerovoudemencı

zdravy clovek (CN) - nizsı hodnoty H

nemocny clovek (AD) - vyssı hodnoty H

nalezeny vyznamne rozdıly mezi obemaskupinami

nemoc se u kazdeho projevuje ruzne

metodika zatım neumoznuje presne urcit,jestli konkretnı pacient nemocı trpı

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 53 / 62

Biomedicına - diagnostika Alzheimerovy choroby z EEG

0 500 1000 1500 2000 2500 3000−150

−100

−50

0

50

100

150

t

∆ϕ

nemocný pacient

0 500 1000 1500 2000 2500 3000−100

−50

0

50

100

150

200

t

∆ϕ

zdravý pacient

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 54 / 62

Biomedicına - diagnostika Alzheimerovy choroby z EEG

0 10 20 30 40 50 60 70 800.8

0.82

0.84

0.86

0.88

0.9

0.92

0.94

0.96

0.98

1

k

E(H

)

0 10 20 30 40 50 60 70 800.8

0.85

0.9

0.95

1

k

E(H

)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 55 / 62

Biomedicına - diagnostika Alzheimerovy choroby z EEG

rozsah (range) Hurstovaexponentu u nemocnych (AD)a zdravych (CN) pacientu

na druhem kanalu

0

0.05

0.1

0.15

0.2

1 2

R

CNAD

nejvetsı rozdıly vetsinounastavajı na druhem,

tretım a sedmem kanalu

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 56 / 62

Aplikace na hudebnı zaznam

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 57 / 62

Aplikace na hudebnı zaznam

jaky hudebnı styl reprezentuje kazdy ze zvukovych signalu?

jaky je jejich Hurstuv exponent?

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 58 / 62

Aplikace na hudebnı zaznam

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 59 / 62

Aplikace na hudebnı zaznam

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 60 / 62

Zaver

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 61 / 62

Dıky za pozornost! ;)

Martin Dlask zlomkove stochasticke procesy 3. brezna 2016 62 / 62