體外診斷試劑臨床試驗(yàn)技術(shù)指導(dǎo)原則定性檢測(cè)的樣本量估算解析
前言
國(guó)家藥品監(jiān)督管理局發(fā)布的《體外診斷試劑臨床試驗(yàn)技術(shù)指導(dǎo)原則》(2021年第72號(hào)通告)(下文簡(jiǎn)述指導(dǎo)原則)中,給出了有確定的臨床可接受標(biāo)準(zhǔn)和不設(shè)定臨床可接受標(biāo)準(zhǔn)的兩種情況下估算樣本量的方法和公式,為體外診斷試劑臨床試驗(yàn)計(jì)算樣本量提供了依據(jù),成為臨床試驗(yàn)方案設(shè)計(jì)與統(tǒng)計(jì)學(xué)考量的重要因素之一。但是目前一般是直接使用公式,對(duì)公式建立的依據(jù)缺乏了解,為了加強(qiáng)對(duì)上述公式底層邏輯的了解,做到知其然,也知其所以然,更好地利用公式,下面對(duì)這兩種情況下的估算公式的建立依據(jù)和推導(dǎo)過(guò)程進(jìn)行解析。
對(duì)于定性體外診斷試劑的臨床試驗(yàn),從統(tǒng)計(jì)學(xué)的角度出發(fā),根據(jù)伯努利大數(shù)定律

樣本量越趨近于無(wú)窮大越能越能真實(shí)反應(yīng)試劑的性能,同時(shí)可以減少范Ⅰ類(lèi)錯(cuò)誤α(消費(fèi)者風(fēng)險(xiǎn))或Ⅱ類(lèi)錯(cuò)誤β(研究者風(fēng)險(xiǎn))的風(fēng)險(xiǎn)。但是實(shí)際臨床試驗(yàn)過(guò)程中出于成本和時(shí)間等因素的考慮,企業(yè)不希望也不可能做到無(wú)窮大的樣本量。因此,一般情況下,制造商在進(jìn)行臨床試驗(yàn)設(shè)計(jì)時(shí)為滿足試劑的臨床性能的要求,通過(guò)統(tǒng)計(jì)分析確定一定樣本量和檢測(cè)結(jié)果數(shù)學(xué)期望的效應(yīng)值可以滿足Ⅰ類(lèi)錯(cuò)誤概率α或Ⅱ類(lèi)錯(cuò)誤概率β的設(shè)定即可。
有臨床可接受標(biāo)準(zhǔn)的樣本量估算
指導(dǎo)原則中第1個(gè)舉例是需證明產(chǎn)品評(píng)價(jià)指標(biāo)滿足評(píng)價(jià)指標(biāo)預(yù)期值且優(yōu)于臨床可接受標(biāo)準(zhǔn)要求情況下的最低樣本量估算方法,公式為

公式中,n為樣本量;Z1-α/2、Z1-β為顯著性水平和把握度的標(biāo)準(zhǔn)正態(tài)分布的分?jǐn)?shù)位,P0為評(píng)價(jià)指標(biāo)的臨床可接受標(biāo)準(zhǔn),PT為試驗(yàn)體外診斷試劑評(píng)價(jià)指標(biāo)預(yù)期值。

這里的邏輯需要解釋一下,如下圖所示,Ⅱ類(lèi)錯(cuò)誤β是指原假設(shè)H0為假但被接受的概率,即假陰性,也就是說(shuō)存在Ⅱ類(lèi)錯(cuò)誤時(shí)就不存在犯Ⅰ類(lèi)錯(cuò)誤的說(shuō)法。但為了根據(jù)檢驗(yàn)效能(1-β)計(jì)算樣本量就需要得到H0的拒絕域,即下圖中橙色面積,所以我們雖然預(yù)期H0不成立但只能先假設(shè)H0成立。在例1中,Ⅱ類(lèi)錯(cuò)誤是指產(chǎn)品效應(yīng)值符合評(píng)價(jià)指標(biāo)預(yù)期值,卻僅僅認(rèn)為效應(yīng)值滿足臨床可接受標(biāo)準(zhǔn),即圖中藍(lán)色面積。根據(jù)給定的Ⅱ類(lèi)錯(cuò)誤概率β計(jì)算的檢驗(yàn)效能1-β即圖中藍(lán)色斜線部分的面積,此例中檢驗(yàn)效能的意義是臨床可接受標(biāo)準(zhǔn)為假而拒絕臨床可接受標(biāo)準(zhǔn),從而選擇評(píng)價(jià)指標(biāo)預(yù)期值的概率。了解計(jì)算思路后我們開(kāi)始進(jìn)行最低樣本量計(jì)算公式的推導(dǎo)。




此時(shí)計(jì)算所得n值是在取Z1-α/2、Z1-β的臨界狀態(tài)下的樣本量,因?yàn)轱@著性水平和把握度均會(huì)隨著樣本量的增加而增大,因此臨床試驗(yàn)的樣本量應(yīng)不低于n值且應(yīng)盡量增加以更真實(shí)反應(yīng)試劑性能。
沒(méi)有臨床可接受標(biāo)準(zhǔn)的樣本量估算
指導(dǎo)原則中第2個(gè)舉例是只保證評(píng)價(jià)指標(biāo)滿足期望精度水平(置信區(qū)間的寬度一定),而不設(shè)定臨床可接受標(biāo)準(zhǔn)的情況下最低樣本量的計(jì)算方法,公式為



這里需要注意的是,因?yàn)棰奘街泄潭甩ず惋@著水平1-α/2,因此估算的是最大的樣本量,而不是最少的。當(dāng)⑥式中的取最大值時(shí),顯著水平1-α/2下不拒絕H0的風(fēng)險(xiǎn)最高,或者說(shuō)試驗(yàn)結(jié)果最可信。這里理解起來(lái)有些混淆,舉個(gè)例子,我們的檢測(cè)試劑靈敏度的期望是80%,如果我們只試驗(yàn)4次,靈敏度是75%,那我們會(huì)繼續(xù)做更多的試驗(yàn)去進(jìn)行驗(yàn)證;而如果我們?cè)囼?yàn)了4000次,靈敏度是75%,直觀上我們會(huì)更容易相信試劑的靈敏度確實(shí)達(dá)不到期望。
實(shí)際上,效應(yīng)值、檢驗(yàn)水準(zhǔn)(即α)和樣本量三者是緊密相連的,其中之一發(fā)生變化,如果保持另一個(gè)不變,則第三個(gè)變量必定變化,從⑥式中也可以體現(xiàn)。臨床試驗(yàn)過(guò)程中,我們往往是設(shè)置一個(gè)檢驗(yàn)水準(zhǔn),再根據(jù)效應(yīng)值和樣本量去計(jì)算P值(假設(shè)檢驗(yàn)統(tǒng)計(jì)量)并與檢驗(yàn)水準(zhǔn)進(jìn)行比較,來(lái)檢驗(yàn)效應(yīng)值是否滿足評(píng)價(jià)指標(biāo)預(yù)期值。當(dāng)臨床試驗(yàn)樣本量增加同時(shí)檢驗(yàn)水準(zhǔn)不變時(shí),就需要效應(yīng)值更接近評(píng)價(jià)指標(biāo)預(yù)期值,即Δ更小。所以⑥式只是設(shè)定Δ情況下的樣本估算量,只是一個(gè)參考值。如果實(shí)際臨床試驗(yàn)時(shí)Δ小于設(shè)定值時(shí),那么計(jì)算的樣本量不是試驗(yàn)結(jié)果最可信情況;當(dāng)Δ大于設(shè)定值時(shí),可能會(huì)出現(xiàn)拒絕H0的情況。
總之,指導(dǎo)原則中給出的估算公式是最低樣本量的參考量,在此基礎(chǔ)上應(yīng)以臨床性能得到充分評(píng)價(jià)為目標(biāo),盡可能的增加臨床試驗(yàn)的樣本量。