全球視野 全球視野 一致觀點 一致觀點 › materials › media › EBSHK_brochure_TC_l.pdf · 用黃金比例的設計象徵一 個完美的平衡,構成一個 ...
風險量測 - 長榮大學web.cjcu.edu.tw/~jdwu/epid01/lect001.pdf ·...
Transcript of 風險量測 - 長榮大學web.cjcu.edu.tw/~jdwu/epid01/lect001.pdf ·...
風險量測
分率與機率 (Rates and Probabilities)
• 在流行病學的研究,比率(rate)總是反映健康危害風險,機率(probability)也是一種廣泛使用的風險量測方法,但它和分率不同。
– 比率
• 單位時間內某一個瞬間變化的量測。
– 機率
• 某一個事件發生的次數除以所有可能結果的總數,它沒有考慮到時間因素。
流行病學常用的風險量測 (1)
• 比例(proportion)
– 兩個數量相除所得的值,比率(rate)、分率(ratio)、百分比、盛行率等都是比例,比例的分子不一定包括在分母之中,比例並無單位和大小的限制。
• 比率(rate)
– 是一種比例,其分母包含時間因素,分子可以是測量值或計數值,比率有單位且其數值介於0和無限大。
• 分率(ratio)
– 也是一種比例,其分子包括於分母當中,它是部分佔整體的比值,其數值介於0和1之間,而且沒有單位,其分子和分母可以是測量值或計數值。
流行病學常用的風險量測 (2)
• 發生率(incidence rate)
– 著重於描述單位時間的變化量。
– 單位時間疾病率的變化量,是一種比率。
– 一段期間內,罹患疾病的新病例數除以有罹患此疾病風險(at-risk)的人時(person-time)的總數。
– 常用來評估個別危險性或病因推論。
• 發生比例(incidence proportion)
– 一段期間內,罹患疾病的新病例數除以在此期間開始時有罹患此疾病風險(at-risk)的總人數。
流行病學常用的風險量測 (3)
• 盛行率(prevalence rate)
– 著重於描述罹患疾病的靜止量。
– 觀察單位人口疾病率的高低量,是屬於分率。
– 常用於衛生保健需求的估計。
• 點盛行比率(point prevalence proportion)或稱盛行率(prevalence rate)
– 在一個特定的時間點上,罹患疾病的人數除以所考慮的族群人數。
– 盛行率與時間無關,它和比例一樣,沒有單位。
流行病學常用的風險量測 (4)
• 發生危險性(risk)
– 在特定的一段期間內,一個可感受宿主在不死於其他疾病的條件下,發生某疾病的機率。
– 估計危險性的方法,最常見的是以觀察期間新發病總人數,除以觀察開始時未患病(亦即可感受性)之總人數。
– 由於其所推算的是每單位人口某時段累積的新發病人數,危險性也可稱為累積發生率(cumulative incidence),它是屬於一種分率而非比率。
流行病學常用的風險量測 (5)
• 發生比率
– 發生比率指每單位人時(person-time)在某時間點上發生疾病狀況瞬間變化(即發生新病例)的可能性,這種瞬間的發病概念,也稱為瞬間危險性(instantaneous risk)、危害性(hazard)、人時發生率(person-time incidence rate)或疾病力(morbidity force)。
– 由於瞬間人口數不易獲得,流行病學上常以特定時段的平均比率(average rate)來估計發生比率。計算平均比率的方法,是以觀察期間新病例總人數,除以該期間所觀察到的人時數。這種平均比率,也有人稱為發生密度(incidence density)。
疾病發生狀況的統計量數估算需注意因素
• 發病時間 – 採用時間最早也最客觀的事件來推算疾病的發生時間。
• 觀察期間 – 通常為一年,但期間的長短是可以依研究的需要而定。
• 分析族群 – 固定族群(fixed population or fixed cohort)或動態族群(dynamic
population)
– 穩定族群(stable population):人口結構及特定疾病的所有危險因子的分布都維持固定。
• 新發病數(分子)的特性 – 急性疾病:發病人數。
– 慢性疾病:新發生的病例人次數或病例人數。
• 人口數或人年數(分母)的選定 – 可感受性的人口數或人年數,只有有危險性的族群(population at risk)列入計算。
存活機率與危害率 (1)
• 存活機率(survival probability)
– 一個個體從某一個時間點到另一個時間點存活或免於疾病的機會,一般以符號 S(t) 表示。
• 危害率 (hazard rate)
– 在特定一個時間點,一個個體至此時間點免於疾病的瞬時風險的量測。以符號 λ(t) 表示。
)(
)()(
tS
dttdSt
存活機率與危害率 (2)
• 平均死亡率(average mortality rate)、存活機率(survival rate)和危害率(hazard rate)的關係
– 一個個體存活到時間 t (單位:週) 的存活機率以下式表示:
– 假如一個人存活超過 40 週的機會為何?
) 1000 ( 100
1)( 週 tt
tS
6.0100
401)40( 40
100
1)(
St
ttS
存活機率與危害率 (3)
– 假如有 n 個人,期望他們能存活超過時間 t 的人數為何?
– 而在這段時間內死亡的人數(D)為何?
– 此 n 個人在 t0 和t1 時間之間累積的人週數(person-weeks)
)(tSn
終止時間
起始時間
死亡人數
:
:
:
100
)()()(
1
0
0110
t
t
D
ttntStSnD
100
)(5.01)(
})()(5.0)(){(
1001
10101
ttttn
tStStSttnriskattime
存活機率與危害率 (4)
• 危害率是一個在特定時間 t 的瞬時危害風險量測,而平均死亡率(average mortality rate)成為一個在某一段時間( t0 和
t1 間),更精確的危害率近似估計值。
)(5.0100
1
100
)(5.01)(
100/)(
10
1001
01
tt
ttttN
ttN
有風險的時間
死亡人數平均死亡率
存活機率與危害率 (5)
• 當t1=t0=t,平均死亡率變成與 S(t) 存活曲線有關的危害率。
危害率平均死亡率 )(-100
1t
t
死亡率或疾病資料的機率統計特性(1)
• 一個用於從死亡率或疾病資料計算機率的統計模式(二項分布模式)有二個假設:
– 對於所定義的群體中的每一個個人,死亡或罹患疾病的機率都相同;
– 死亡或罹患疾病的發生,完全是獨立事件。
• 符號定義:
– n :群體中的總人數
– D :死亡人數
– q:死亡或罹病機率
死亡率或疾病資料的機率統計特性(2)
• 以常態分佈近似估計 – 在群體中期望的死亡人數為 nq,變異數Variance(D)=nq(1-q)。
– 因為一般罹患疾病和死亡率均低,所以
2
ˆ)1()ˆ(var
ˆ
n
D
n
q
n
qqqiance
n
Dq
DDDqnD
n
)error( standardor ˆ)variance(
ˆ)ˆerror( standard
死亡率或疾病資料的機率統計特性(3)
– 當 q 很小時,𝑞 的分佈變為偏態,以常態分佈不能準確的代表𝑞 的分佈。估計的平均值±2個標準差的經驗法則不再適用。
– 當 n 很大時,以常態分佈近似估計二項分佈的信賴區間估計,準確估計𝑞 的隨機變異,因此95%信賴區間估為:
– 當用於估計 q 的樣本數小時,對於𝑞 的估計會有相當的偏差,因此應該使用精確方法計算(exact method)。
– 流行病學研究一般樣本數不大,使用精確方法計算(exact method)
通常是必要的,使用近似估計必須非常小心。
nqqq /)ˆ1(ˆ96.1ˆ
死亡率或疾病資料的機率統計特性(4)
• 母群體均質性問題
– 也就是,母群體中不同分組死亡率或罹病率 q 為常數的問題。
– 假定 4 個個體的樣本從均質群體中抽出,則這4個個體死亡或罹病的機率,以二項分佈計算如下。
死亡率或疾病資料的機率統計特性(5)
• 在 n=4, q=0.09 的情況下,二項分佈的變異數為:variance(D)=4 × 0.09 × 0.91= 0.328。
• 當假定 4 個個體的樣本從非均質群體中抽出,則這4個個體死亡或罹病的機率,以各種組合情況計算如下。
死亡率或疾病資料的機率統計特性(6)
死亡率或疾病資料的機率統計特性(7)
• 在非均質群體,它的變異數的估計不再簡單。
• 這4個個體死亡或罹病的機率,以各種組合情況計算如下:
• D的機率分佈比均質群體的變異來得小,非均質群體的variance(D)=0.307,比均質群體的variance(D)= 0.328,此主要是因為極端值(D=2、3和4)比較不可能發生。因此忽略群體非均質問題,會造成估計變異增加。
• 只要 ,則均質群體變異大於非均質群體。
死亡率或疾病資料的機率統計特性(8)
)1(s)homogeneou|variance( qqnqD
)1(us)hetergeneo|variance( iii qqnqD
0q
死亡率或疾病資料的機率統計特性(9)
• 僅有當母體是完全均質( ),由二項分佈模式估計的變異數和 會完全正確,否則估計的變異數會高估真實的變異。
– 回到上述的例子:
0q
09.0q
0.3074
0.00990.04750.090.16
0.990.010.950.050.90.10.80.2
)1(
)|(var
1
01.0 05.0 10.0 20.0
09.0
4
4321
4321
iii qqn
ousheterogeneqDiance
nnnn
qqqq
q
k
然後,
死亡率或疾病資料的機率統計特性(10)
• 實例演練
– 假定一個人數為14700的群體中,因盲腸炎而死亡的病例為67人,則此群體罹患盲腸炎死亡的機率為:
– 此估計值的標準偏差為:
– 這些估計值,建立在假定群體中每一個人有相同的機率得到盲腸炎。但事實上,群體中的人因所居住的區域和其他各種因素,不可能有相同的罹病機率,因而標準偏差的估計可能太大了。
0046.014700
67 qq
00056.014700/9954.00046.0/)ˆ1(ˆ nqq
死亡率或疾病資料的機率統計特性(11)
• 特別案例---估計發生率為0的情形
– 美國加州 Oakland 城市非洲裔美國人直腸癌發生率如表1-10。
– 此城市隔壁舊金山灣區非洲裔美國人的直腸癌發生率卻是每100000人有15.5。問題:Oakland城市沒有直腸癌病例是否有任何特別的地方?或是對一個稀有疾病,沒有病例出現是很可能發生的事情嗎?
• 為了評估統計估計值受抽樣變異的影響,需要進行區間估計。
• 根據常態分佈,以(估計值±2×標準差)作為95%信賴區間估計。顯然地,這樣的估計結果會不符合邏輯,因為會有小於0的值出現,且變藝術估計值也會是0。如此,需要以觀察值為0,作真實的區間估計。
死亡率或疾病資料的機率統計特性(12)