close

流病:病例世代研究法

>先前,講到巢式病例對照研究nested case-control study時,我說過病例對照研究可以變形出不同的類型,巢式病例對照僅是其中的一種。因為很多方法都是在1990年代以後才發展出來的,所以絕大部分的教科書都沒提到,學校也都沒教。

>今天我們來介紹一種變形,也就是病例世代研究(case-cohort study),又稱為以病例為基礎的對比研究 (case-base reference study),這是Preentice於1986年所發表的方法 (Prentice RL: A case-cohort design for epidemiologic cohort studies and disease prevention trials. Biometrika, 73:1-11, 1986)。

在流行病學研究中,我們常常會遇到在一個大樣本的世代中,追蹤一段時間之後只能得到少量的病例,其他大多數的對象只能得到設限 (censored) 的觀察結果。

什麼是設限資料 (censored data)?簡單地說,就是不知道正確的存活時間。比如我們現在觀察一個研究對象發病的情況,從開始觀察到研究結束時,事件並無發生;而他在未來某個時間點是有可能會發生出事件的,只是我們目前並無法知道。會造成設限的因素,可能是到了觀察截止時都沒有事件發生,或是被觀察的對象失去了追蹤,即lost to follow-up,又或者是觀察的對象主動地退出了研究 (現在的倫理審查都要求可以讓對象退出喔)。

我們舉個例子好了,研究開始到結束假設為五年。
A------------------------X (第二年)
B----------------------------------------------------------------研究結束
C 第一年後才加入--------退出研究 (第二年)
D 第一年後才加入--------X (第二年)
A從研究開始到第二年發生事件 (生病或死了),因此A的存活時間為兩年,這是非設限的資料。
B從研究開始到結束,都沒有觀察到事件發生,存活時間至少超過五年,所以這是設限的censored資料。
C從第一年後才加入,而在第二年後退出研究,存活時間為至少一年,並且這是設限的censored資料。
D從第一年後才加入,但在第二年時發生事件,存活時間為一年,這是非設限的資料。

所以,大家可以對於設限censored資料,所有概念了吧!其實,上面所提的設限資料,是一個右設限資料right-censored data;意即我們認為研究對象會在研究截止後發生事件,但是我們並不知道事件確切的發生時間。

相對於右設限資料,也就有左設限資料,不過這比較少見。左設限資料,也就是說對於一些研究對象,我們知道他們在研究截止前發生了事件,但是我們不知道事件確切的發生時間。比如說,我們知道一個病人已經感染了B型肝炎病毒HBV,但是我們並不知道他是在那個時間點被感染的;所以,我們也無法得到真正的存活時間。注意喔,右設限是研究截止後發生了事件 (右邊),而左設限是研究截止前發生了事件 (左邊)。 那會不會兩邊都設限的資料呢?那就作double censored data!
懂了嗎,我們常常會得到的資料是設限的,如果要獲得所有對象的共變量資料來進行統計分析,則需花費大量的資源。為此,Prentice提出了病例世代研究(case-cohort study),這種研究僅收集全部研究對象 (全部世代) 中的一個隨機樣本 (子世代, subcohort) 和所有發病者 (不論是否在子世代內) 的共變量資料來分析,因此極具研究效率。該方法融入了病例對照研究與世代研究的許多優點,因此慢慢地被應用於醫學研究中。

>病例世代研究怎麼進行呢?先根據研究目的確定合適的對象來當作研究世代,然後按照一定的抽樣比例在世代中抽取一部分對象作為對照組(也就是子世代);追蹤一段預定的時間,將追蹤期間內於世代中所發生的所有患者當作病例组,並與上述的隨機對照組進行比較。然後,以病例對照研究的分析方法來估計OR值;也可估計RR值;也可運用Cox模型來進行多因子的分析和計算RR值。

>那你還記得我們說過的巢式病例對照研究嗎?我們復習一下,這是將世代研究與病例對照研究相結合的一種雙向研究設計;在進行世代研究時,我們會收集世代成員的暴露資料以及有關的訊息,並且在追蹤期間內追蹤到所發生的病例數,然後以世代中所發現的病例作為病例組,對照組則來自同一個世代,進而從中進行病例對照研究。

那病例世代研究與傳統的病例對照研究有何不同呢?OK,病例世代研究的對照是隨機選取的,並不與病例進行配對;並且在隨機對照的成員如果發生了被研究的疾病時,他可既作為對照,也又同時可作為病例。由於病例與對照組的成員有可能會產生重疊,如果想要達到同樣的統計效力,在相同的病例數目下,病例世代研究通常需要比病例對照研究選擇更多的對照。當然,如果疾病是不常見的,病例世代研究所需的額外對照數目將不會很多。因為它兼具了世代的特質,所以可以同時研究多種疾病。

>在台灣,台大于明暉老師在探討B型肝炎病毒量的長期變化趨勢和肝細胞癌的危險性,就曾利用過病例世代研究法 (Ref: Wu CF et al. Long-term tracking of hepatitis B viral load and the relationship with risk for hepatocellular carcinoma in men. Carcinogenesis, 29: 106-112, 2008)。

>我們以于老師的研究,來說明病例世代研究是怎樣進行的。
先說明這項研究的背景,B型肝炎病毒(hepatitis B virus,HBV)量之長期變化與肝細胞癌 (hepatocellular carcinoma,HCC) 發展的關係,知之甚少。于老師在一項具有2874名HBV表面抗原陽性且年齡在30歲以上的男性台灣公務人員之世代中,執行了一項病例世代研究。從112名病例和1031名非病例的血漿樣本中,分析HBV基因型和DNA濃度 (即病毒負載量);診斷前血漿HBV DNA濃度是從每個人的多重樣本中加以測量 (共7706個樣本),在診斷前最長的期間達到16年。基線的病毒負載量可影響HBV基因型所相關的肝細胞癌危險,並且在基線時所測得的病毒量可以預測高病毒負載量的持續性,而這可導致肝細胞癌。而在(追蹤)九年內,都可看到中度到高度的病毒負載量。B型肝炎e抗原(P <0.0001)、B肝病毒的基因型C感染(P=0.0369)、和長期的ALT升高(ALT異常的定義為大於受訪時的≥50%)(P=0.0005)是正相關於高病毒負載量之較長持續時間。在多變項的調整後,HBV基因型C [勝算比(OR)= 5.97,95%信賴區間(CI)=3.44-10.34]、高病毒負載量大於受訪時的≥50%(相較於持續低病毒負載量:OR = 5.04,95% CI = 2.31-11.00)、以及長期的ALT升高(相較於持續的正常ALT濃度:OR = 2.84,95% CI = 1.46-5.51)分別佔了肝細胞癌 (族群可歸因危險性,population attributable risks,PARs;這以後我們再講) 的43.5%、57.2%和24.9%。

原文如下:Baseline viral load influenced HBV genotype-specific HCC risks and predicted the persistence of high viral load (≥4.39 log copies/ml) that can cause HCC. Moderate to high tracking of viral load was observed within 9 years. Hepatitis B e antigen (P<0.0001), genotype C HBV infection (P=0.0369) and longitudinal alanine aminotransferase (ALT) elevation (defined as ALT abnormality in ≥50% of the visits) (P=0.0005) were positively related to longer duration of persistence for high viral load. After multivariate adjustment, HBV genotype C [odds ratio (OR)=5.97, 95% confidence interval (CI)=3.44–10.34], high viral load detected at ≥50% of the visits (compared with sustained low viral load: OR=5.04, 95% CI=2.31–11.00) and longitudinal ALT elevation (compared with sustained normal ALT levels: OR=2.84, 95% CI=1.46–5.51) accounted for 43.5, 57.2 and 24.9% of HCCs, respectively. 

重點是,我們要看看于老師怎樣進行這項研究。

這項研究在一項具有2874名HBV表面抗原陽性且年齡在30歲以上的男性台灣公務人員之世代中,執行一項病例世代研究 (這是一項4841名HBsAg陽性帶原者世代的一部份)。從1989年起開始追蹤,研究對象被邀請回來進行健康檢查,而血清ALT濃度是測量基線時與在1994年之後的濃度。研究對象的存活資料是連結死亡檔與癌症登記檔來確認。當然,研究對象也有一些排除條件,最後總數為2410名合格之研究對象。到了2005年,確認有112名肝細胞癌病例。 

關鍵來了喔,于老師使用病例世代研究設計,從2410名研究對象中,隨機抽取出1084名 (45.0%) 的子世代;在這子世代中,包含了原先112名肝細胞癌病例中的53名。當然,在估計危險性是還是要作點加權,可參考以下文獻:Barlow WE. Robust variance estimation for the case-cohort design. Biometrics 1994; 50:1064-1072.

arrow
arrow
    全站熱搜

    Irene 湘棋 發表在 痞客邦 留言(0) 人氣()