技術(shù)轉(zhuǎn)讓

详细内容

藥物臨床試驗的生物統(tǒng)計學指導原則

一、概述

新藥經(jīng)臨床前研究后，其有效性和安全性由人體臨床試驗進行最終驗證。臨床試驗是根據(jù)研究目的，通過足夠數(shù)量的目標受試者（樣本）來研究藥物對疾病進程、預后以及安全性等方面的影響。

臨床試驗除了遵循《藥物臨床試驗質(zhì)量管理規(guī)范》（GCP）以外，還必須事先應用統(tǒng)計學原理對試驗相關的因素作出合理、有效的安排，最大限度地控制混雜與偏倚，減少試驗誤差，提高試驗質(zhì)量，并對試驗結(jié)果進行科學的分析和合理的解釋，在保證試驗結(jié)果科學、可信的同時，盡可能做到高效、快速、經(jīng)濟。因此，統(tǒng)計學是臨床試驗設計、實施和分析的有力工具，在藥物的臨床研發(fā)過程中發(fā)揮不可或缺的重要作用。

本指導原則以臨床試驗的基本要求和統(tǒng)計學原理為核心，闡述統(tǒng)計學在臨床試驗中的作用和地位，以及在試驗設計階段、試驗實施階段和結(jié)果分析階段的統(tǒng)計學考慮，旨在為藥品注冊申請人和臨床試驗的研究者針對臨床研發(fā)中如何進行設計、實施、分析和評價提供技術(shù)指導，以保證藥物臨床試驗的科學、嚴謹和規(guī)范。

本指導原則適用于以注冊為目的的藥物（化學藥物、生物制品、中藥民族藥和天然藥物）的確證性臨床試驗，對探索性臨床試驗以及上市后臨床試驗也同樣具有指導意義。

二、臨床試驗的總體考慮

（一）臨床研發(fā)規(guī)劃

藥物臨床試驗的主要目標是評價和確定受試藥物的風險/獲益比，同時也要確定可能從該藥獲益的特定適應癥人群及適宜的用法與用量。為此，需要設計一系列的臨床試驗，而每一個臨床試驗都有其特定的目的，其設計、執(zhí)行和擬采用的分析方法等細節(jié)均應在試驗方案中予以明確。所以每個研究藥物都應首先考慮其臨床研發(fā)的總體規(guī)劃。

創(chuàng)新藥物的臨床研發(fā)一般由Ⅰ期臨床試驗開始，進入Ⅱ期概念驗證試驗（Proof-Of-Concept，POC）和劑量探索（Dose Finding）試驗，然后是Ⅲ期確證試驗，每期試驗由于研究目的的不同，可能包含著多個試驗項目。臨床研發(fā)規(guī)劃就是這些試驗研究的總體規(guī)劃。

在新藥申請時，應當清晰地描述該藥臨床研發(fā)規(guī)劃的主要內(nèi)容，以及每個臨床試驗在其中的地位和作用。在解釋和評價受試藥物的總體證據(jù)時，通常需要把幾個試驗的數(shù)據(jù)進行綜合分析。因此，同一臨床研發(fā)規(guī)劃中，不同臨床試驗的多個方面應該盡量采用相同的標準，如醫(yī)學編碼詞典、主要指標的定義和測量時間點、對于方案違背的處理方式等等。在藥物的臨床研發(fā)規(guī)劃中應預先闡明是否需要對涉及共同醫(yī)學問題的多個試驗進行薈萃分析（Meta-Analysis），并明確它們的設計共同點及關鍵統(tǒng)計問題。

（二）探索性試驗和確證性試驗

臨床試驗的早期，需要進行一系列的探索性試驗，這些試驗也應有清晰和明確的目標。探索性試驗有時需要更為靈活可變的方法進行設計并對數(shù)據(jù)進行分析，以便根據(jù)逐漸積累的結(jié)果對后期的確證性試驗設計提供相應的依據(jù)。雖然探索性試驗對有效性的確證有參考價值，但不能作為證明有效性的關鍵性證據(jù)。臨床試驗的后期，需要經(jīng)過確證性試驗為評價藥物的有效性和安全性提供有力證據(jù)。確證性試驗是一種事先提出假設并對其進行統(tǒng)計檢驗的試驗，以說明所開發(fā)的藥物對臨床是有益的，一般為隨機對照的臨床試驗。因此，對涉及藥物有效性和安全性的每一個關鍵性的問題都需要通過確證性試驗予以充分的回答。

在確證性試驗中，最關鍵的假設應根據(jù)試驗主要目的產(chǎn)生。主要假設應于試驗開始前在試驗方案中預先設定并于試驗結(jié)束后嚴格按照預先設定的分析計劃完成假設檢驗。除此之外，在試驗方案中還應闡明試驗設計方法、統(tǒng)計分析方法及相關理由。確證性試驗對于試驗方案和標準操作程序（SOP）的嚴格遵從是非常重要的。如果在試驗過程中對方案有不可避免的修訂，應給予說明并記載。對方案修訂可能對結(jié)果產(chǎn)生的影響應予以評估。

確證性試驗還應對試驗藥物的療效進行準確的估計。對于藥物療效的說明除了需要證明關鍵假設的統(tǒng)計學意義之外，還需要評估試驗藥物療效具有臨床意義。

（三）觀察指標

觀察指標是指能反映臨床試驗中藥物有效性和安全性的觀察項目。統(tǒng)計學中常將觀察指標稱為變量。觀察指標分為定量指標和定性指標。觀察指標必須在研究方案中有明確的定義和可靠的依據(jù)，不允許隨意修改。

對于觀察指標，在研究的設計階段，首先需要根據(jù)研究目的，嚴格定義與區(qū)分主要指標和次要指標，其次是根據(jù)主要指標的性質(zhì)（定量或定性）和特征（一個或多個、單一指標或復合指標、臨床獲益或替代指標、客觀/主觀指標或全局評價指標等），調(diào)整研究的統(tǒng)計設計策略，以達到研究的預期目的。

1.主要指標和次要指標

主要指標又稱主要終點，是與試驗主要研究目的有本質(zhì)聯(lián)系的，能確切反映藥物有效性或安全性的觀察指標。主要指標應根據(jù)試驗目的選擇易于量化、客觀性強、重復性高，并在相關研究領域已有公認標準的指標。

一般情況下，主要指標僅為一個，用于評價藥物的療效或安全性。若一個主要指標不足以說明藥物效應時，可采用兩個或多個主要指標。方案中應詳細描述所關注的主要指標的設計參數(shù)及其假設、總Ⅰ類錯誤率和Ⅱ類錯誤率的控制策略。主要指標將用于臨床試驗的樣本量估計，多個主要指標的情況下，將制定對總Ⅰ類錯誤概率的控制策略并保證研究有足夠的把握度。

主要指標，包括其詳細定義、測量方法（若存在多種測量方法時，應該選擇臨床相關性強、重要性高、客觀并切實可行的測量方法）、統(tǒng)計分析模型等，都必須在試驗設計階段充分考慮，并在試驗方案中明確規(guī)定。方案中主要指標在試驗進行過程中不得修改，若須做修改則應在充分論證的基礎上謹慎行事，并在揭盲前完成，不允許揭盲后對主要指標進行任何修改。

次要指標是與次要研究目的相關的效應指標，或與試驗主要目的相關的支持性指標。在試驗方案中，也需明確次要指標的定義，并對這些指標在解釋試驗結(jié)果時的作用以及相對重要性加以說明。一個臨床試驗，可以設計多個次要指標，但不宜過多，足以達到試驗目的即可。

2.復合指標

當難以確定單一的主要指標時，可按預先確定的計算方法，將多個指標組合構(gòu)成一個復合指標。臨床上采用的量表（如神經(jīng)、精神類、生活質(zhì)量量表等）就是一種復合指標。將多個指標組綜合成單一復合指標的方法需在試驗方案中詳細說明。主要指標為復合指標時，可以對復合指標中有臨床意義的單個指標進行單獨的分析。

當采用量表進行療效評價（如精神類藥物、中藥、民族藥），應該采用國際或領域內(nèi)公認的量表。采用國外量表作為主要療效指標時，由于可能存在語言、文化、生活習俗、宗教信仰等多方面的差異，需提供跨文化調(diào)適、翻譯對等性的研究結(jié)果；采用自制量表時，需提供效度、信度和反應度（對疾病嚴重程度及其變化的區(qū)分程度）的研究結(jié)果。沒有對效度、信度和反應度進行過研究，或者效度、信度和反應度都很低的量表不建議作為臨床試驗的主要療效指標。

3.全局評價指標

全局評價指標是將客觀指標和研究者對受試者療效的總印象有機結(jié)合的綜合指標，它通常是等級指標，其判斷等級的依據(jù)和理由應在試驗方案中明確。全局評價指標可以評價某個治療的總體有效性或安全性，帶有一定的主觀成份，因此，其中的客觀指標常被作為重要的指標進行單獨分析。

以全局評價指標為主要指標時，應該在方案中考慮：該全局評價指標與主要研究目的臨床相關性、信度和效度、等級評價標準和單項缺失時的估計方法。不建議將“綜合療效和安全性”的全局評價指標作為臨床試驗的主要指標，因為這樣會掩蓋藥物之間在療效和安全性方面的重要差異，從而導致決策失誤。

4.替代指標

替代指標是指在直接評價臨床獲益不可行時，用于間接反映臨床獲益的觀察指標。例如降壓藥物的臨床獲益，常被認為是降低或延遲“終點事件”（心腦血管事件）的發(fā)生，但若要評價“終點事件”發(fā)生率，需要長時間的觀察。在實際中，降壓藥的臨床試驗，采用替代指標“血壓降低值/血壓達標”來評價藥物的療效，因為臨床研究和流行病學業(yè)已證實：將“血壓”控制在正常范圍內(nèi)，可以降低“終點事件”的發(fā)生。

一個指標能否成為臨床獲益的替代指標，需要考察：1）指標與臨床獲益的關聯(lián)性和生物學合理性；2）在流行病學研究中該指標對臨床結(jié)局的預測價值；3）臨床試驗的證據(jù)顯示藥物對該指標的影響程度與藥物對臨床結(jié)局的影響程度一致。

選擇替代指標為主要指標，可以縮短臨床試驗期限，但也存在一定的風險，尤其是“新”替代指標。藥物在替代指標上的優(yōu)良表現(xiàn)并不一定代表藥物對受試者具有長期的臨床獲益，藥物在替代指標上的不良表現(xiàn)也不一定表示沒有臨床獲益。例如，在抗腫瘤藥物早期臨床試驗中，“無進展生存時間”等指標被作為“總生存時間”的替代指標被廣泛使用，但其與總生存時間的關聯(lián)性在不同的腫瘤臨床試驗中程度不一，因此仍需強調(diào)Ⅲ期臨床研究中，采用臨床終點的重要性。

5.定性指標

在某些臨床試驗中，有時需要將定量指標根據(jù)一定的標準轉(zhuǎn)換為等級指標、或?qū)⒌燃壷笜宿D(zhuǎn)化為定性指標，如：用藥后血壓降低到“140/90mmHg”以下、糖化血紅蛋白降低到7.0%以下的受試者比例（達標率）。定量或等級指標轉(zhuǎn)換定性指標的標準，應該具有臨床意義、為相關領域公認、并在試驗方案中明確規(guī)定。由于將定量指標轉(zhuǎn)換為定性指標會損失部分信息導致檢驗效能的降低，在樣本量計算時需加以考慮。如方案定義主要指標為定量指標轉(zhuǎn)化的定性指標時，則研究結(jié)論應主要依據(jù)該定性指標，而不是其所源于的定量指標。

（四）偏倚的控制

偏倚又稱偏性，是臨床試驗在設計、執(zhí)行、測量、分析過程中產(chǎn)生的、可干擾療效和安全性評價的系統(tǒng)誤差。在臨床試驗中，偏倚包括各種類型的對研究方案的違背與偏離。由于偏倚會影響療效、安全性評價結(jié)果，甚至影響臨床試驗結(jié)論的正確性，因此在臨床試驗的全過程中均須控制偏倚的發(fā)生。隨機化和盲法是控制偏倚的重要措施。

1.隨機化

隨機化是臨床試驗的基本原則，也是療效和安全性評價的統(tǒng)計學方法的基礎。

臨床試驗中隨機化原則是指臨床試驗中每位受試者均有同等的機會被分配到試驗組或?qū)φ战M中的實施過程或措施，隨機化過程不受研究者和/或受試者主觀意愿的影響。隨機化的目的是使各種影響因素（包括已知和未知的因素）在處理組間的分布趨于相似。隨機化與盲法相結(jié)合，可有效避免處理分組的可預測性，控制對受試者分組的選擇偏倚。臨床試驗的隨機化的方法，一般采用區(qū)組隨機化法和/或分層隨機化法。

如果受試者的入組時間較長，區(qū)組隨機化是臨床試驗所必須的，這樣有助于減少季節(jié)、疾病流行等客觀因素對療效評價的影響，也可減少因方案修訂（如入選標準的修訂）所造成的組間受試者的差異。區(qū)組的大小要適當，太大易造成組間不均衡，太小則易造成同一區(qū)組內(nèi)受試者分組的可猜測性。研究者及其相關人員，應該對區(qū)組長度保持盲態(tài)，這在開放的臨床試驗中尤為重要。也可設定2個或多個區(qū)組長度，或采用中央隨機化系統(tǒng)以盡可能減少分組的可預測性。

如果藥物的效應會受到一些預后因素（如受試者的病理診斷、年齡、性別、疾病的嚴重程度、生物標記物等）的影響時，可采用分層隨機化，以保持層內(nèi)的組間均衡性。

當需要考慮多個分層因素，如腫瘤類臨床試驗，需考慮年齡、病理類型、基線水平等因素，采用分層隨機化，可能導致試驗無法進行，此時可采用“動態(tài)隨機”使被控制的預后因素組間有良好的均衡性。在動態(tài)隨機化中，已入組的受試者特征將影響下一個受試者的分組，系統(tǒng)將根據(jù)各層面上的組間均衡性決定受試者的隨機化組別。

盡管“動態(tài)隨機”可以實現(xiàn)多分層因素下的隨機化，但不建議設計過多的分層因素，因為過多的分層因素可能造成其他因素在處理組間的不均衡，建議分層因素一般不宜超過3個。臨床試驗中通常采用區(qū)組隨機化的方法，如采用動態(tài)隨機化，被控制的因素應包括在主要指標分析模型中，用以控制混雜因素對主要指標評價的影響。特別指出的是在Ⅲ期臨床試驗中，應避免使用基于主要指標觀察結(jié)果的動態(tài)隨機化。

隨機化的方法和過程包括隨機分配表的產(chǎn)生方法、隨機分配遮蔽的措施、隨機分配執(zhí)行的人員分工等，應在試驗方案中闡明，但使人容易猜測分組的隨機化的細節(jié)（如區(qū)組長度等）不應包含在試驗方案中。在臨床試驗中，隨機分配表應該是一份獨立的文件，以記錄受試者的處理（或處理順序）安排。隨機分配表應具有重現(xiàn)性，即可以根據(jù)種子數(shù)、分層因素、區(qū)組長度重新產(chǎn)生相同的隨機分配表。試驗用藥物將根據(jù)隨機分配表進行編碼，在臨床操作中，要求研究者嚴格按照入組受試者的隨機分配結(jié)果及藥物編碼分配藥物，任何偏離，都應該如實記錄，以待數(shù)據(jù)分析前進行評估。值得注意的是動態(tài)隨機化中的隨機表僅僅起到遮蔽作用，真正的隨機分配表是由動態(tài)隨機化系統(tǒng)根據(jù)已入組的受試者信息采用最小隨機化原理產(chǎn)生的，因此隨機化系統(tǒng)中的隨機分配表應作為獨立文件在申報資料中提交。

2.盲法

臨床試驗的偏倚可能來自于臨床試驗的各個階段、各方面人員。由于對隨機化分組信息的知曉，研究者可能選擇性入組受試者，受試者可能受到主觀因素的影響，可能產(chǎn)生療效與安全性的評價偏倚或選擇性確定分析人群等。盲法是控制臨床試驗中因“知曉隨機化分組信息”而產(chǎn)生的偏倚的重要措施之一，目的是達到臨床試驗中的各方人員對隨機化處理分組的不可預測性。

根據(jù)設盲程度的不同，盲法分為雙盲、單盲和非盲（開放）。在雙盲臨床試驗中，受試者、研究者（對受試者進行篩選的人員、終點評價人員以及對方案依從性評價人員）、與臨床有關的申辦方人員對處理分組均應處于盲態(tài)；單盲臨床試驗中，僅受試者或研究者一方對處理分組處于盲態(tài)；開放性臨床試驗中，所有人員都可能知道處理分組信息。臨床試驗的設盲程度，應綜合考慮藥物的應用領域、評價指標和可行性，應盡可能采用雙盲試驗。當雙盲難度大、可行性較差，可考慮單盲臨床試驗，甚至開放性研究。一般情況下，神經(jīng)、精神類藥物的臨床試驗采用量表評價效應、用于緩解癥狀（過敏性鼻炎、疼痛等）的藥物或以“受試者自我評價”等主觀指標為主要指標的臨床試驗、以安慰劑為對照的臨床試驗，均應采用“雙盲”；在一些以臨床終點（如死亡）為主要評價指標的臨床試驗中（抗腫瘤藥物），也可以接受開放性研究。

雙盲的臨床試驗，要求試驗藥和對照藥（包括安慰劑）在外觀（劑型、形狀、顏色、氣味）上的一致性；如果試驗藥與對照藥在用藥方式有差異，還需要做到試驗組與對照組在藥物使用上的一致性。若要達到雙盲的目的，可采用雙模擬技術(shù)。在使用雙模擬技術(shù)的臨床試驗中，受試者的用藥次數(shù)與用藥量將會增加，可能導致用藥依從性的降低。

若雙盲實施起來有相當?shù)睦щy或根本不可行時（例如，手術(shù)治療與藥物治療的對比研究；不同藥物在劑型、外觀或用法上存在很大的差異；因中藥組方不同導致氣味上的差異等），可以采用單盲或開放性臨床試驗，其理由必須在方案中詳細說明，而且尤為重要的是這種信息的知曉不得影響受試者分配入組的隨機性，方案中還須有控制偏倚的具體措施，例如采用客觀的主要指標，或采用中央隨機化系統(tǒng)管理受試者的入組，或參與療效與安全性評價的研究者在試驗過程中盡量處于盲態(tài)等。

無論是雙盲、單盲臨床試驗，盲態(tài)的執(zhí)行（隨機化分配表的產(chǎn)生、保存以及釋放）應該有標準操作程序進行規(guī)范，且在方案中明確規(guī)定破盲人員的范圍。即使是開放性臨床試驗，研究相關人員也應盡可能保持盲態(tài)。方案中應該規(guī)定隨機分配表的釋放條件與流程。隨機分配表釋放的基本條件為：已完成數(shù)據(jù)庫的鎖定和分析人群及統(tǒng)計分析計劃的確定工作。

三、試驗設計的基本考慮

（一）試驗設計的基本類型

1.平行組設計

平行組設計是最常用的臨床試驗設計類型，可為試驗藥設置一個或多個對照組，試驗藥也可設多個劑量組。對照組可分為陽性或陰性對照。陽性對照一般采用按所選適應癥的當前公認的有效藥物，陰性對照一般采用安慰劑，但必須符合倫理學要求。試驗藥設一個或多個劑量組完全取決于試驗的目的。

2.交叉設計

交叉設計是按事先設計好的試驗次序，在各個時期對受試者逐一實施各種處理，以比較各處理間的差異。交叉設計是將自身比較和組間比較設計思路綜合應用的一種設計方法，它可以較好地控制個體間的差異，以減少受試者人數(shù)。

最簡單的交叉設計是2種藥物2個階段的形式，又稱2×2交叉設計，對每個受試者安排兩個試驗階段，分別接受A、B兩種試驗用藥物，而第一階段接受何種試驗用藥物是隨機確定的，第二階段必須接受與第一階段不同的另一種試驗用藥物。因此，每個受試者接受的藥物可能是先A后B（AB順序），也可能是先B后A（BA順序），故這種試驗又簡記為AB/BA交叉試驗。兩階段交叉試驗中，每個受試者需經(jīng)歷如下幾個試驗過程，即準備階段、第一試驗階段、洗脫期和第二試驗階段。

每個試驗階段的用藥對后一階段的延滯作用稱為延滯效應。前個試驗階段后需安排足夠長的洗脫期或有效的洗脫手段，以消除其延滯效應。采用交叉設計時應考慮延滯效應對試驗數(shù)據(jù)分析評價的影響。

2×2交叉設計難以區(qū)分延滯效應與時期-藥物的交互作用。如需進一步分析和評價延滯效應，則可考慮采用2個處理多個階段的交叉設計（例如：2×4的ABBA/BAAB交叉設計）。

多種藥物多個階段的交叉設計也是經(jīng)常用到的，例如：3×3交叉設計，即3種處理（A、B、C）、3個階段、6種順序（ABC/BCA/CAB/ACB/CBA/BAC）的交叉設計。

由于每個受試者接受了所有處理組的治療，提供了多個處理的效應，因此交叉試驗中應盡量避免受試者的失訪。

3.析因設計

析因設計是通過試驗用藥物劑量的不同組合，對兩個或多個試驗用藥物同時進行評價，不僅可檢驗每個試驗用藥物各劑量間的差異，而且可以檢驗各試驗用藥物間是否存在交互作用，或探索兩種藥物不同劑量的適當組合，常用于復方研究。析因設計時需考慮兩種藥物高劑量組合可能帶來的毒副反應。

如果試驗的樣本量是基于檢驗主效應的目的而計算的，關于交互作用的假設檢驗，其檢驗效能往往是不足的。

（二）多中心試驗

多中心試驗系指由一個單位的主要研究者總負責，多個單位的研究者參與，按同一個試驗方案同時進行的臨床試驗。多中心試驗可以在較短的時間內(nèi)入選所需的病例數(shù)，且入選的病例范圍廣，臨床試驗的結(jié)果更具代表性。但影響因素亦隨之更趨復雜。

多中心試驗必須遵循同一個試驗方案在統(tǒng)一的組織領導下完成整個試驗。各中心試驗組和對照組病例數(shù)的比例應與總樣本的比例大致相同。多中心試驗要求試驗前對人員統(tǒng)一培訓，試驗過程要有良好的質(zhì)控措施。當主要指標易受主觀影響時，需進行統(tǒng)一培訓并進行一致性評估。當主要指標在各中心的實驗室的檢驗結(jié)果有較大差異或參考值范圍不同時，應采取相應的措施進行校正或標化以保證其可比性，如采用中心實驗室檢驗等。如預期多中心間檢驗結(jié)果有較大差異，應在臨床試驗方案中預先規(guī)定可能采用的差異性的檢驗及校正方法。

在多中心臨床試驗中，可按中心分層隨機；當中心數(shù)較多且每個中心的病例數(shù)較少時，可不按中心分層。

國際多中心試驗可視為一種特殊形式的多中心試驗，在不同國家或地區(qū)所觀察的試驗結(jié)果可能作為相應國家或地區(qū)藥品注冊申請的重要依據(jù)。在這種特殊的需求下，國家或地區(qū)間的臨床實踐差異有可能對臨床結(jié)果的解讀產(chǎn)生較大的影響。在臨床試驗設計時應提前對這種差異進行預估，并在臨床試驗方案中對將采用的分析不同國家地區(qū)結(jié)果差異性/一致性的統(tǒng)計方法做預先規(guī)定。常用的一致性的評價方法有（但不限于）以國家或地區(qū)為預設亞組的亞組分析，或采用適當?shù)慕y(tǒng)計分析模型等。當單獨以某特定國家或地區(qū)試驗數(shù)據(jù)作為主要注冊申請依據(jù)時，應說明樣本量能夠合理的支持相對應的安全性及有效性的評價。

（三）比較的類型

臨床試驗中比較的類型，按統(tǒng)計學中的假設檢驗可分為優(yōu)效性檢驗、等效性檢驗和非劣效性檢驗。在臨床試驗方案中，需要明確試驗的目的和比較的類型。

優(yōu)效性檢驗的目的是顯示試驗藥的治療效果優(yōu)于對照藥，包括：試驗藥是否優(yōu)于安慰劑；試驗藥是否優(yōu)于陽性對照藥；或劑量間效應的比較。等效性檢驗的目的是確證兩種或多種治療的效果差別大小在臨床上并無重要意義，即試驗藥與陽性對照藥在療效上相當。而非劣效性檢驗目的是確證試驗藥的療效如果在臨床上低于陽性對照藥，其差異也是在臨床可接受范圍內(nèi)。

在顯示后兩種目的試驗設計中，陽性對照藥的選擇要慎重。所選陽性對照藥需是已廣泛應用的、對相應適應癥的療效和用量已被證實，使用它可以有把握地期望在目前試驗中表現(xiàn)出相似的效果；陽性對照藥原有的用法與用量不得任意改動。陽性藥物選擇時應考慮以下兩個方面：

1.陽性對照有效性的既有證據(jù)

陽性對照效應來源于文獻報道的有良好試驗設計的試驗結(jié)果，這些歷史試驗已明確顯示本次非劣效試驗中采用的陽性對照或與其類似的藥物優(yōu)于安慰劑，且隨時間遷移，陽性對照的療效基本維持穩(wěn)定。根據(jù)這些試驗結(jié)果可以可靠地估計出陽性對照的效應大小。陽性對照的效應量是非劣效試驗的關鍵設計參數(shù)（用以確定非劣效界值），既不能用歷史研究中最好的療效作為其效應量的估計，也不能僅用薈萃分析的點估計作為效應量的估計，效應量估計時要充分考慮歷史研究間的變異。

2.陽性對照藥物效應的穩(wěn)定性

陽性對照效應的估計來源于歷史研究，雖然考慮了歷史研究間的變異，但仍有歷史局限性，受到很多因素諸如當時的受試人群、合并用藥、療效指標的定義與判定、陽性對照的劑量、耐藥性以及統(tǒng)計分析方法等的影響。因此，采用非劣效試驗設計時要盡可能地確保本次臨床試驗在以上提及的諸多因素方面與歷史研究一致。另外非劣效/等效性設計，良好的偏倚控制和質(zhì)量控制是此類設計的關鍵。因此，在試驗設計和實施階段都應該提高試驗質(zhì)量要求，只有高質(zhì)量的臨床試驗才能保證非劣效/等效臨床試驗的檢定靈敏度。

進行等效性檢驗或非劣效性檢驗時，需預先確定一個等效界值（上限和下限）或非劣效界值（上限或下限），這個界值應不超過臨床上能接受的最大差別范圍，并且應當小于陽性對照藥與安慰劑的優(yōu)效性試驗所觀察到的差異。非劣效界值確定一般采用兩步法，M₁是陽性對照扣去了安慰劑效應的絕對療效的保守估計，一般借助薈萃分析法并考慮歷史試驗間的變異后確定；M₂是非劣效界值，其確定要結(jié)合臨床具體情況，在考慮保留陽性對照療效的適當比例f后，由統(tǒng)計專家和臨床醫(yī)學專家共同確定。在等效界值的確定中，可以用類似的方法確定下限和上限。從技術(shù)層面講，等效性檢驗雙側(cè)置信區(qū)間等同于兩個同時進行的單側(cè)假設檢驗，而非劣效檢驗是單側(cè)檢驗。非劣效/等效檢驗統(tǒng)計推斷一般采用置信區(qū)間法。值得注意的是兩組之間差別無統(tǒng)計學意義并不能得出兩組等效或非劣的結(jié)論。

（四）樣本量

臨床試驗中所需的樣本量應具有足夠大的統(tǒng)計學檢驗把握度，以確保對所提出的問題給予一個可靠的回答，同時也應綜合考慮監(jiān)管部門對樣本量的最低要求。樣本的大小通常以試驗的主要療效指標來確定，如果需要同時考慮主要療效指標外的其他指標時（如安全性指標或重要的次要指標），應明確說明其合理性。一般來說，在樣本量的確定中應該說明以下相關因素，包括設計的類型、主要療效指標的明確定義（如在降壓藥的臨床試驗中應明確說明主要指標是從基線到終點的血壓改變值，或試驗終點的血壓達標率）、臨床上認為有意義的差值、檢驗統(tǒng)計量、檢驗假設中的原假設和備擇假設、Ⅰ類和Ⅱ類錯誤率以及處理脫落和方案違背的比例等。在以事件發(fā)生時間為主要療效指標的生存分析中，可以根據(jù)統(tǒng)計學檢驗把握度直接得到試驗所需事件數(shù)。在此情況下需要根據(jù)事件發(fā)生率，入組速度以及隨訪時間推算試驗所需樣本量。

樣本量的具體計算方法以及計算過程中所需用到的主要指標的統(tǒng)計參數(shù)（如均值、方差、事件發(fā)生率、療效差值等）的估計值應在臨床試驗方案中列出，同時需要明確這些估計值的來源依據(jù)。在確證性臨床試驗中，一般只有一個主要療效指標，參數(shù)的確定主要依據(jù)已發(fā)表的資料或探索性試驗的結(jié)果來估算，其中所預期療效差值還應大于或等于在醫(yī)學實踐中被認為是具有臨床意義的差異。需要強調(diào)的是，計劃中的試驗應與前期試驗或文獻中的試驗具有一致的試驗設計和目標人群。如果不完全一致，需對相應統(tǒng)計量的估值進行調(diào)整。Ⅰ類錯誤概率一般設定為雙側(cè) 0.05。在非劣效檢驗等單側(cè)檢驗中，I類錯誤概率一般設定為0.025。此外，如果試驗設計中存在多重性的問題時，應考慮對I類錯誤概率進行必要的控制，以保證試驗的總體I類錯誤概率不超過預設值。Ⅱ類錯誤概率一般情況下設定為不大于0.2，在探索性試驗中可適當放寬。

通過估計得到的試驗所需樣本量一般僅針對試驗中指定的主要指標的主要分析（相對其他分析如敏感性分析或亞組分析而言）。在一個以“全分析集（Full Analysis Set，簡稱FAS）”為主要分析的試驗中，應考慮統(tǒng)計參數(shù)估計值所依據(jù)的前期試驗或資料是否使用了相同的分析集或者具有相似的脫落率及方案違背率�？紤]到脫落患者或違背方案者對療效的稀釋效應，全分析集的療效往往小于符合方案集。此外，在全分析集中也常會觀測到比符合方案集更大的變異。

另外，等效或非劣效試驗中通常事先假設試驗組與對照組療效相同而進行樣本量估算，當試驗組的真實療效差于陽性對照組時則試驗的檢驗把握度將低于設定目標。

（五）適應性設計

適應性設計（Adaptive Design）是指事先在方案中計劃的在臨床試驗進行過程中利用累積到的數(shù)據(jù)，在不影響試驗的完整性和合理性的前提下，對試驗的一個或多個方面進行修改的一種設計。

好的適應性設計可以加快藥物研發(fā)的速度，或更有效地利用研發(fā)資源。但適應性設計要特別考慮：（1）試驗的修改是否會引起Ⅰ類錯誤增大；（2）試驗的修改是否導致試驗結(jié)果難于解釋。因此，無論對試驗進行何種修改, 其修改計劃和分析策略必須在試驗數(shù)據(jù)揭盲之前在試驗方案中進行明確嚴謹?shù)谋硎觥Ｔ谶m應性設計計劃的期中分析中，保持申辦者和研究者的盲態(tài)非常重要，通常需要一個獨立的數(shù)據(jù)監(jiān)查委員會（Independent Data Monitoring Committee，IDMC）來通知申辦者是否按照事先擬定的方案修改進一步進行試驗。

適應性設計有多種可能，包括：（1）試驗組和對照組入組分配方式的改變，如由固定區(qū)組分配變更為動態(tài)隨機入組分配；（2）入組人數(shù)的改變，如樣本量的重新計算；（3）試驗終止條件的改變，如根據(jù)期中分析結(jié)果提示有效或無效性而提前終止試驗；（4）或其他設計方法（如臨床終點，統(tǒng)計方法）的改變。目前應用的適應性設計中，成組序貫試驗和盲態(tài)下樣本量的重新計算被認為是在理論和實踐中比較廣泛被接受的。而其他的諸多設計對于深入認識試驗結(jié)果的影響因素或提高研究效率（如富集設計）是有幫助的，但對于非盲態(tài)下改變臨床終點或受試人群等適應性設計，由于可能引入偏倚而影響對結(jié)論的判斷，故不宜應用于確證性試驗中，可在早期探索性試驗中使用。

1.成組序貫設計

成組序貫設計常用于有期中分析的臨床試驗中。適用于下列三種情況：（1）懷疑試驗藥物有較高的不良反應發(fā)生率，采用成組序貫設計可以較早終止試驗；（2）試驗藥療效較差，采用成組序貫設計可以因無效較早終止試驗；（3）試驗藥與對照藥的療效相差較大，但病例稀少，或臨床觀察時間過長�？梢�，成組序貫設計一般用于創(chuàng)新藥物的臨床試驗，而不用于仿制藥的臨床試驗。

成組序貫設計是把整個試驗分成若干個連貫的分析段，每個分析段病例數(shù)可以相等也可以不等，但試驗組與對照組的病例數(shù)比例與總樣本中的比例相同。每完成一個分析段，即對主要指標（包括有效性和/或安全性）進行分析，一旦可以做出結(jié)論即停止試驗，否則繼續(xù)進行。如果到最后一個分析段仍不拒絕無效假設，則作為差異無統(tǒng)計學意義而結(jié)束試驗。

成組序貫設計的優(yōu)點是當試驗藥與對照藥間確實存在差異時，或試驗藥與對照藥不可能達到統(tǒng)計學意義時，可較早地得到結(jié)論，從而縮短試驗周期。

成組序貫設計的盲底要求一次產(chǎn)生，分批揭盲。由于多次重復進行假設檢驗會使I類錯誤增加，故需對每次檢驗的名義水準進行調(diào)整，以控制總的I類錯誤率不超過預先設定的水準（比如α=0.05）。試驗設計中需明確α消耗函數(shù)的方法。

采用成組序貫設計，由于需要進行多次期中分析，需特別注意盲態(tài)的保持，以免引入新的偏倚。同時，在試驗開始前應預先明確統(tǒng)計分析方法，規(guī)定提前終止試驗的標準。期中分析的數(shù)據(jù)需由獨立的第三方進行統(tǒng)計分析，并由審核，以便做出是否繼續(xù)下一階段臨床試驗的決策建議。

2.盲態(tài)下的樣本量的重新計算

當原設計中樣本量是在不確切信息的假設條件下估計的，對時間比較長的臨床試驗，可以在試驗進行中對這些假設進行驗證，以便對樣本量進行重新估計。為了避免揭盲對試驗的Ⅰ類錯誤及試驗的科學完整性的影響，這種估計應該是在不揭盲的狀態(tài)下進行的，主要是對連續(xù)變量的變異度或事件發(fā)生率進行估計。此估計可用于計算新的樣本量，新的樣本量若和原樣本量相似或比原樣本量小，應保持試驗樣本量不變。若新的樣本量比原樣本量大并且是切實可行，應通過修訂方案寫明新的樣本量。此類樣本量的調(diào)整也可由IDMC來完成，并事先應在試驗方案中對樣本量的重新估計進行計劃，樣本量再估計應不超過兩次。

3.富集設計

適應性的富集設計是指當期中分析提示某一亞組人群的療效優(yōu)于另一亞組人群的療效時而調(diào)整入組標準，對尚未入組的病例規(guī)定只入組療效好的某一亞組人群的設計。富集設計能夠減少研究人群的異質(zhì)性，從而提高研究的效率。該設計通常根據(jù)研究對象與疾病或者預后相關的某些特征把目標人群分為亞組，例如，研究心血管疾病時，可以考慮按目標人群病人是否有糖尿病、高血壓等分為高危人群和非高危人群；在腫瘤領域中，通常具有某些生物標記的人群對治療的反應比沒有生物標記的人群要好，這時可以考慮把目標人群分為生物標記陽性和陰性兩個亞組。最常用的病人分組因素包括（但不限于）人口學、病理生理學、組織學、遺傳學的等等特征；研究方案中一般必須預先明確指出期中分析是根據(jù)病人的哪些特征做的亞組分析。根據(jù)病人特征進行分組的方法必須經(jīng)過驗證。

期中分析時根據(jù)研究方案中預設的病人特征，估計療效并決定是否需要調(diào)整入組標準。由于期中對方案的調(diào)整對后續(xù)試驗在隨機、雙盲等方面都有一定的影響，方案中必須明確規(guī)定避免引入偏倚和調(diào)整I類錯誤概率的方法。最后的結(jié)果分析是根據(jù)期中分析（方案調(diào)整）之前搜集的所有研究對象的數(shù)據(jù)和之后某一亞組人群的數(shù)據(jù)加權(quán)，而不僅僅是感興趣的亞組人群的數(shù)據(jù)；而分析結(jié)果的解釋也必須明確地說明各亞組人群的構(gòu)成。值得指出的是，由于富集設計的復雜性，可能對試驗的基本原則（如，隨機化、雙盲、I類錯誤概率等）有嚴重影響，在沒有充分可靠方法處理和避免這些影響時，和在病人特征對療效的影響預先不明確的情況下，須慎用富集設計。

四、試驗進行中的基本考慮

（一）試驗數(shù)據(jù)和受試者入組的監(jiān)查

臨床試驗過程中，研究者應嚴格按照試驗方案認真進行臨床試驗，其研究過程的質(zhì)量對研究數(shù)據(jù)及結(jié)果的可靠性有著重要的影響，因此，認真進行試驗過程的數(shù)據(jù)監(jiān)查能及早地發(fā)現(xiàn)問題，并使問題的發(fā)生和再現(xiàn)達到最小。

按照GCP要求，臨床試驗的申辦者應在臨床試驗過程中委派監(jiān)查員，對整個臨床試驗的質(zhì)量進行監(jiān)查。為監(jiān)控試驗的質(zhì)量，對試驗管理的監(jiān)查應包括研究是否按計劃進行，是否遵從方案，收集的數(shù)據(jù)質(zhì)量如何，是否達到了預期收集的樣本數(shù)量目標，設計的假設是否合適，以及病人在試驗中的安全等權(quán)益是否有保障等。

在病人入組時間較長的試驗中，必須對病人入組的積累情況進行監(jiān)查。如入組率遠低于試驗方案中預定的水平，則需查明原因，并采取相應措施緩解入組選擇和質(zhì)量的其他方面問題，確保試驗的把握度。在多中心試驗中，這些考慮適用于每一個中心。

這類監(jiān)查既不需要比較處理效應的信息，也不要對試驗分組揭盲，所以對Ⅰ類錯誤沒有影響，是試驗申辦者應盡的職責，它可由試驗申辦者或由試驗申辦者委托的合同研究組織（CRO）來完成。這種監(jiān)查一般從研究地點的選定開始，到完成最后一位病人數(shù)據(jù)的收集和清理而結(jié)束。

（二）試驗方案的修改

確定的試驗方案經(jīng)倫理委員會批準后，在試驗進行過程中一般不得更改。對試驗方案的任何修改都應在修訂方案中寫明，且修訂方案一般需重新得到倫理委員會的批準。

在試驗進行過程中，如發(fā)現(xiàn)按原入選/排除標準難以選到合格的病例時，需分析原因并采取相應措施，如監(jiān)查中發(fā)現(xiàn)常有違反標準入選病例現(xiàn)象或入選病例的限制過度情況，則在不破盲的條件下可以考慮修改原入選/排除標準，但需注意入選/排除標準的修改可能導致目標受試人群的改變。修改后需調(diào)整相應的統(tǒng)計分析計劃，如對方案修改前后進行分層分析及其結(jié)果一致性的考慮等應進行詳細表述。

（三）期中分析

期中分析是指正式完成臨床試驗前，按事先制訂的分析計劃，比較處理組間的有效性和/或安全性所作的分析。其分析目的是為后續(xù)試驗是否能繼續(xù)執(zhí)行提供決策依據(jù)。基于期中分析結(jié)果中止試驗無外乎兩種情況，其一是可以預見即使試驗繼續(xù)執(zhí)行至試驗結(jié)束也不可能得出試驗藥物有效的結(jié)論，或者是發(fā)現(xiàn)試驗藥物的安全性存在隱患；另一種是得出試驗藥物有效的結(jié)論。如果根據(jù)期中分析得出試驗藥物有效而提前中止試驗，需要保證有足夠的藥物暴露時間和安全性數(shù)據(jù)，一般應繼續(xù)隨訪以收集更多的安全性數(shù)據(jù)，以避免安全性評價不充分。

期中分析的時點（包括日歷時點或信息時點）、具體實施方式和所采用的α消耗函數(shù)等應當事先制訂計劃并在試驗方案中闡明。期中分析的結(jié)果可能會對后續(xù)試驗產(chǎn)生影響，因此，一個臨床試驗的期中分析次數(shù)應嚴格控制。如果一個期中分析是為了決定是否終止試驗而設計的，則常采用成組序貫設計。

期中分析包含了已揭盲的數(shù)據(jù)及結(jié)果，因此進行期中分析的人員應該是不直接參加臨床試驗的人員，比如可由IDMC執(zhí)行，即使是開放的試驗也應如此。期中分析結(jié)果對試驗相關人員是保密的，試驗相關人員僅僅會被告知是否繼續(xù)試驗或需要對試驗方案進行修改。

對于確證性臨床試驗，原則上不得進行計劃外期中分析。因為設計不良或計劃外的期中分析可能引入偏倚，所得結(jié)論缺乏可靠性。如由于特別情況進行了計劃外的期中分析，則在研究報告中應解釋其必要性、以及破盲的程度和必要性，并提供可能導致偏倚的嚴重程度以及對結(jié)果解釋的影響。

（四）獨立數(shù)據(jù)監(jiān)查委員會

獨立數(shù)據(jù)監(jiān)查委員會（IDMC），有時也稱為數(shù)據(jù)和安全監(jiān)查委員會（Data And Safety Monitoring Board，簡稱DSMB），或數(shù)據(jù)監(jiān)查委員會（Data Monitoring Committee，簡稱DMC），是由具備相關專業(yè)知識和經(jīng)驗的一組專業(yè)人員組成的獨立委員會，通過定期評估一項或多項正在進行的臨床試驗的累積數(shù)據(jù)，評價試驗藥物的安全性和有效性。保證受試者安全和權(quán)益并確保試驗的完整可靠性是IDMC的基本職責。

IDMC通常用于以延長生命或減少重大健康結(jié)局風險為目的的大規(guī)模多中心臨床試驗，而大多數(shù)臨床試驗不要求或無需使用IDMC�？梢钥紤]聘用IDMC的情況包括（但不局限于）下列一種或多種：（1）對安全性或有效性的累積數(shù)據(jù)進行期中分析，以決定是否提前終止試驗；（2）存在特殊安全問題的試驗，如治療方式有明顯侵害性；（3）試驗藥物可能存在嚴重毒性；（4）納入潛在的弱勢人群進行研究，如兒童、孕婦、高齡者或其他特殊人群（疾病終末期病人或智障的病人）；（5）受試者有死亡風險或其他嚴重結(jié)局風險的研究；（6）大規(guī)模、長期、多中心臨床研究。

IDMC具有以下三個特點：（1）多學科性：IDMC成員應該包括有相應臨床知識及掌握期中分析原則的臨床專家、統(tǒng)計學家或醫(yī)學倫理學家等；（2）獨立性：IDMC的成員需沒有任何利益沖突；其獨立性可以防止試驗的組織者、申辦者的既得利益可能對數(shù)據(jù)評估帶來的影響；（3）保密性：由于期中分析數(shù)據(jù)是非盲態(tài)的，因此需要由與試驗無利益沖突的人員來擔任統(tǒng)計分析的工作，并且注意保密性。一般需要選定獨立統(tǒng)計師負責期中數(shù)據(jù)分析并完成期中報告。期中數(shù)據(jù)和報告在傳遞和提交過程中應采取一定的保密措施并妥善保存，避免被申辦者或其他人員不慎或不當接觸，直到試驗結(jié)束申辦者和研究者才能接觸到期中報告。

IDMC的組織和實施過程需要在試驗設計階段或IDMC啟動會之前制定詳細的IDMC工作章程和程序，并經(jīng)IDMC成員審閱、簽字、存檔，在整個IDMC運行過程中作為工作指南嚴格遵守。所有IDMC的討論需有會議紀要，以便在試驗結(jié)束后有案可查。同時，在確保保密性的基礎上，IDMC成員、IDMC支持小組和申辦者之間應進行及時有效地溝通和交流。

五、試驗的數(shù)據(jù)管理

數(shù)據(jù)管理的目的是確保數(shù)據(jù)的可靠、完整和準確。臨床試驗中的數(shù)據(jù)管理相關方包括申辦者、研究者、監(jiān)查員、數(shù)據(jù)管理員和CRO等，各相關方應各司其職、各盡其責。數(shù)據(jù)管理全過程的實施，從數(shù)據(jù)采集到數(shù)據(jù)庫的最終建立，都必須符合我國GCP的規(guī)定和監(jiān)管部門的相應技術(shù)規(guī)范要求。

臨床試驗方案確定后，應根據(jù)病例報告表和統(tǒng)計分析計劃書的要求制訂數(shù)據(jù)管理計劃，內(nèi)容涵蓋數(shù)據(jù)管理各過程，包括數(shù)據(jù)接收、錄入、清理、編碼、一致性核查、數(shù)據(jù)鎖定和轉(zhuǎn)換。數(shù)據(jù)的收集和傳送，從研究者到申辦者可通過多種媒體，包括紙質(zhì)的病例報告表、電子數(shù)據(jù)采集系統(tǒng)以及用于臨床試驗數(shù)據(jù)管理的計算機系統(tǒng)等。無論采用何種方式收集數(shù)據(jù)，資料的形式和內(nèi)容必須與研究方案完全一致,且在臨床試驗前確定，包括確定對計劃的依從性或確認違背試驗方案的前后關系的信息（如有關服藥的時間，缺失值需與“0 值”和空缺相區(qū)別）。數(shù)據(jù)管理各過程的執(zhí)行中均應遵守全面和有效的標準操作程序。

無論是采用紙質(zhì)化或電子化的數(shù)據(jù)管理，其各階段均應在一個完整、可靠的臨床試驗數(shù)據(jù)質(zhì)量管理體系（QMS）下運行，對可能影響數(shù)據(jù)質(zhì)量結(jié)果的各種因素和環(huán)節(jié)進行全面控制和管理，使臨床研究數(shù)據(jù)始終保持在可控和可靠的水平。臨床試驗的數(shù)據(jù)管理系統(tǒng)（CDMS）必須滿足三個基本要求：經(jīng)過基于風險考慮的系統(tǒng)驗證，具備可靠性；具備數(shù)據(jù)可溯源性的性能；具備完善的權(quán)限管理功能。另外，在數(shù)據(jù)管理運行過程中應該建立和實施質(zhì)量保證、質(zhì)量控制和質(zhì)量評估等措施。臨床試驗中用于數(shù)據(jù)管理和統(tǒng)計分析的計算機及其軟件系統(tǒng)均應經(jīng)過驗證且有驗證記錄可查。

為達到試驗數(shù)據(jù)共享和信息互通目的，臨床試驗過程中數(shù)據(jù)的采集、分析、交換、提交等環(huán)節(jié)，可考慮采用統(tǒng)一的標準化格式，如CDISC臨床數(shù)據(jù)交換標準體系（Clinical Data Interchange Standards Consortium）。

臨床試驗完成后，應對試驗的數(shù)據(jù)管理工作和過程進行總結(jié)并形成數(shù)據(jù)管理總結(jié)報告。數(shù)據(jù)管理計劃和總結(jié)報告應作為藥物注冊上市的申請材料之一提交給監(jiān)管部門。

六、統(tǒng)計分析和報告

（一）統(tǒng)計分析計劃

統(tǒng)計分析計劃（Statistical Analysis Plan，簡稱SAP）是比試驗方案中描述的分析要點更加技術(shù)性和有更多實際操作細節(jié)的一份獨立文件，包括對主要和次要評價指標及其他數(shù)據(jù)進行統(tǒng)計分析的詳細過程。統(tǒng)計分析計劃的內(nèi)容包括設計的類型、比較的類型、隨機化與盲法、主要指標和次要指標的定義與測量、檢驗假設、數(shù)據(jù)集的定義、療效及安全性統(tǒng)計分析的詳細細節(jié)。確證性試驗要求提供詳細分析原則及預期分析方法。探索性試驗通常描述概括性的分析原則和方法。

統(tǒng)計分析計劃由試驗統(tǒng)計學專業(yè)人員起草，并與主要研究者商定，旨在全面而詳細地陳述臨床試驗數(shù)據(jù)的分析方法和表達方式，以及預期的統(tǒng)計分析結(jié)果的解釋。

統(tǒng)計分析計劃初稿應形成于試驗方案和病例報告表確定之后，在臨床試驗進行過程中以及數(shù)據(jù)盲態(tài)審核時，可以進行修改、補充和完善，不同時點的統(tǒng)計分析計劃應標注版本及日期，正式文件在數(shù)據(jù)鎖定和揭盲之前完成并予以簽署。如果試驗過程中試驗方案有修訂，則統(tǒng)計分析計劃也應作相應的調(diào)整。如果涉及期中分析，則相應的統(tǒng)計分析計劃應在期中分析前確定。

（二）統(tǒng)計分析集

用于統(tǒng)計分析的數(shù)據(jù)集事先需要明確定義，并在盲態(tài)審核時確認每位受試者所屬的分析集。一般情況下，臨床試驗的分析數(shù)據(jù)集包括全分析集（FAS）、符合方案集（Per Protocol Set，簡稱PPS）和安全集（Safety Set，簡稱SS）。根據(jù)不同的研究目的，需要在統(tǒng)計分析計劃中明確描述這三個數(shù)據(jù)集的定義，同時明確對違背方案、脫落/缺失數(shù)據(jù)的處理方法。在定義分析數(shù)據(jù)集時，需遵循以下兩個原則：（1）使偏倚減到最小；（2）控制I類錯誤率的增加。

意向性治療的原則（Intention To Treat Principle，簡稱ITT），是指主要分析應包括所有隨機化的受試者，這種保持初始的隨機化的做法對于防止偏倚是有益的，并且為統(tǒng)計學檢驗提供了可靠的基礎，這一基于所有隨機化受試者的分析集通常被稱為ITT分析集。

理論上遵循ITT原則需要對所有隨機化受試者的研究結(jié)局進行完整的隨訪，但實際中這種理想很難實現(xiàn)，因而也常采用全分析集（FAS）來描述盡可能的完整且盡可能的接近于包括所有隨機化的受試者的分析集。

只有非常有限的情況才可以剔除已經(jīng)隨機化的受試者，通常包括：違反重要入組標準；受試者未接受試驗用藥物的治療；隨機化后無任何觀測數(shù)據(jù)。值得注意的是，這種剔除需要對其合理性進行充分的論證和說明。

符合方案集（PPS），亦稱為“可評價病例”樣本。它是全分析集的一個子集，這些受試者對方案更具依從性。納入符合方案集的受試者一般具有以下特征：（1）完成事先設定的試驗藥物的最小暴露量：方案中應規(guī)定受試者服用藥物的依從性達到多少為治療的最小量；（2）試驗中主要指標的數(shù)據(jù)均可以獲得；（3）未對試驗方案有重大的違背。

受試者的排除標準需要在方案中明確，對于每一位從全分析集或符合方案集中排除的受試者，都應該在盲態(tài)審核時闡明理由，并在揭盲之前以文件形式寫明。

安全集（SS），應在方案中對其明確定義，通常應包括所有隨機化后至少接受一次治療且有安全性評價的受試者。

對于確證性試驗，宜同時采用全分析集和符合方案集進行統(tǒng)計分析。當兩種數(shù)據(jù)集的分析結(jié)論一致時，可以增強試驗結(jié)果的可信性。當不一致時，應對其差異進行討論和解釋。如果符合方案集被排除的受試者比例太大，則將影響整個試驗的有效性。

ITT/全分析集和符合方案集在優(yōu)效性試驗和等效性或非劣效性試驗中所起的作用不同。一般來說，在優(yōu)效性試驗中，應采用ITT/全分析集作為主要分析集，因為它包含了依從性差的受試者而可能低估了療效，基于ITT/全分析集的分析結(jié)果是保守的。符合方案集顯示試驗藥物按規(guī)定方案使用的效果，但與上市后的療效比較，可能高估療效。在等效性或非劣效性試驗中，用ITT/全分析集所分析的結(jié)果并不一定保守，在統(tǒng)計分析時，可以用符合方案集和ITT/全分析集作為分析人群，兩個分析集所得出的結(jié)論通常應一致，否則應分析并合理解釋導致不一致的原因。

（三）缺失值及離群值

缺失值是臨床試驗中的一個潛在的偏倚來源，因此，病例報告表中原則上不應有缺失值，尤其是重要指標（如主要的療效和安全性指標）必須填寫清楚。對病例報告表中的基本數(shù)據(jù)，如性別、出生日期、入組日期和各種觀察日期等不得缺失。試驗中觀察的陰性結(jié)果、測得的結(jié)果為零和未能測出者，均應有相應的符號表示，不能空缺，以便與缺失值相區(qū)分。

在臨床試驗中，數(shù)據(jù)缺失是難以避免的問題。在試驗的計劃、執(zhí)行過程中應有必要的措施盡量避免缺失值的發(fā)生，在分析和報告中要正確處理缺失數(shù)據(jù)，否則會造成潛在的偏倚。缺失值的存在有可能導致試驗結(jié)果無法解釋。在分析中直接排除有數(shù)據(jù)缺失的受試者可能會（1）破壞隨機性；（2）破壞研究樣本對于目標人群的代表性。除此之外，對缺失值的直接排除還可能降低研究的把握度或減小變量的變異性引起Ⅰ類錯誤率的膨脹。

如果在一些受試者中發(fā)生主要終點的缺失，在試驗方案或統(tǒng)計計劃書中應預先指定如何處理缺失值。

缺失機制可分為完全隨機缺失（Missing Completely At Random，簡稱MCAR）、隨機缺失（Missing At Random，簡稱MAR）和非隨機缺失（Missing Not At Random，簡稱MNAR）。由于缺失機制無法通過已有數(shù)據(jù)進行判斷，并且不同的處理方法可能會產(chǎn)生截然不同的結(jié)果，應當認識到任何缺失數(shù)據(jù)處理方法本身可能是潛在的偏倚來源。對完全隨機缺失、隨機缺失數(shù)據(jù)的處理目前有末次觀測值結(jié)轉(zhuǎn)（LOCF）、基線觀測值結(jié)轉(zhuǎn)（BOCF）、均值填補、回歸填補、重復測量的混合效應模型（MMRM）、多重填補等多種不同的方法。

對于缺失值的處理方法，特別是主要療效指標的缺失值，應事先在方案中根據(jù)以往的經(jīng)驗或既有相似試驗的處理方法進行規(guī)定。然而如上所述，任何缺失數(shù)據(jù)處理方法本身都可能帶來潛在的偏倚。所以缺失數(shù)據(jù)的處理方法應遵循保守的原則。即使同一種方法在不同情況下既有可能對試驗藥保守也有可能對試驗藥有利。然而，有時在對主要療效指標的缺失值的處理方法進行預設時（如在盲態(tài)下）無法完全確定所用方法的保守性。必要時，也可以采用不同的處理缺失值的方法進行敏感性分析。

離群值問題的處理，應當從醫(yī)學和統(tǒng)計學專業(yè)兩方面去判斷，尤其應當從醫(yī)學專業(yè)知識判斷。離群值的處理應在盲態(tài)檢查時進行，如果試驗方案未預先指定處理方法，則應在實際資料分析時，進行包括和不包括離群值的兩種結(jié)果比較，評估其對結(jié)果的影響。

（四）數(shù)據(jù)變換

分析之前對關鍵變量是否要進行變換，最好根據(jù)以前的研究中類似資料的性質(zhì)，在試驗設計時即做出決定。擬采用的變換（如對數(shù)、平方根等）及其依據(jù)需在試驗方案中說明，數(shù)據(jù)變換是為了確保資料滿足統(tǒng)計分析方法所基于的假設，變換方法的選擇原則應是公認常用的。一些特定變量的常用變換方法已在某些特定的臨床領域得到成功地應用。

（五）統(tǒng)計分析方法

統(tǒng)計分析應建立在真實、可靠、準確、完整的數(shù)據(jù)基礎上，采用的統(tǒng)計方法應根據(jù)研究目的、試驗方案和觀察指標來選擇，一般可概括為以下幾個方面：

1.描述性統(tǒng)計分析

一般多用于人口學資料、基線資料和安全性資料，包括對主要指標和次要指標的統(tǒng)計描述。

2.參數(shù)估計、置信區(qū)間和假設檢驗

參數(shù)估計、置信區(qū)間和假設檢驗是對主要指標及次要指標進行評價和估計的必不可少的手段。假設檢驗應說明所采用的是單側(cè)還是雙側(cè)檢驗，如果采用單側(cè)檢驗，應說明理由。單側(cè)檢驗的I類錯誤概率往往選擇為雙側(cè)檢驗的一半，以保證單雙側(cè)檢驗的邏輯性。主要指標效應分析要說明采用的是固定效應模型還是隨機效應模型。統(tǒng)計分析方法的選擇要注意考慮指標的性質(zhì)及數(shù)據(jù)分布的特性。無論采用參數(shù)方法或非參數(shù)方法，處理效應的估計應盡量給出效應大小、置信區(qū)間和假設檢驗結(jié)果。除主要指標和次要指標外，其他指標的分析以及安全性數(shù)據(jù)的分析也應簡要說明所采用的方法。在確證性試驗中，只有方案或統(tǒng)計分析計劃中事先規(guī)定的統(tǒng)計分析才可以作為確證性證據(jù)的依據(jù)，而其他的分析只能視作探索性的。

3.基線與協(xié)變量分析

評價藥物有效性的主要指標除受藥物作用之外，常常還有其他因素的影響，如受試者的基線情況、不同治療中心受試者之間差異等因素，這些因素在統(tǒng)計分析中可作為協(xié)變量處理。在試驗前應認真考慮可能對主要指標有重要影響的協(xié)變量以及采用的可以提高估計精度的方法（如采用協(xié)方差分析方法），補償處理組間由于協(xié)變量不均衡所產(chǎn)生的影響。對于確證性分析，應事先在方案中規(guī)定在統(tǒng)計模型中校正的協(xié)變量，以及校正的依據(jù)。當采用分層隨機時，分層因素應作為協(xié)變量進行校正。對于事先沒有規(guī)定校正的協(xié)變量，通常不應進行校正。也可以采用敏感性分析方法，將校正后的結(jié)果作為參考，而不應該取代事先規(guī)定的分析模型。

4.中心效應

多中心臨床試驗中，不同中心在受試者基線特征、臨床實踐等方面可能存在差異，導致不同中心間的效應不盡相同，這種中心之間的效應差異稱為中心效應。常見三種情況：（1）無中心效應，即各中心試驗組效應同質(zhì)，對照組效應亦同質(zhì)，此時各中心間效應是一致的；（2）有中心效應，但中心與處理組間不存在交互作用，即各中心試驗組與對照組效應之差是同質(zhì)的；（3）有中心效應，且中心與處理組間存在交互作用，此時，各中心試驗組與對照組效應之差是異質(zhì)的。中心與處理組間的交互作用，又分為定量的交互作用（各中心試驗組與對照組效應之差方向一致）和定性的交互作用（至少一個中心的處理組與對照組的效應之差與其他中心方向不一致）。

分析主效應時，對于情況（1），模型中應不包括中心效應；對于情況（2），模型中可包括中心項，但不包含中心與處理的交互項效應以提高檢驗效能；對于情況（3），若存在定量交互作用，則需要采用合適的統(tǒng)計學方法來估計處理效應，以保證結(jié)果的穩(wěn)健性，結(jié)果解釋時須非常謹慎，應努力從試驗的管理、受試者的基線特征、臨床實踐等方面尋找原因；當存在定性的交互作用時，需找到合理的解釋并重新進行的臨床試驗。

當中心數(shù)較多，或每個中心樣本數(shù)均較少，一般無需考慮中心效應對主要變量及次要變量的影響，因為此時中心效應不會影響臨床效果。

采用何種策略分析中心效應需事先在試驗方案或統(tǒng)計分析計劃中闡明。

5.亞組分析

臨床試驗中的亞組分析是對整體中根據(jù)某種因素分層的部分數(shù)據(jù)進行分析。

試驗藥物的療效或安全性在不同的亞組中可能不同，而且這種差異往往具有特殊的臨床意義。除非在方案設計時考慮到了計劃的亞組分析，并且在樣本量計算和多重性比較等方面事先給予了考慮，這樣的亞組分析結(jié)果才能夠被接受。由于亞組分析通常是小樣本，且未按亞組隨機化，故對于非確證性亞組分析的解釋應當慎重，通常只能作為探索性研究的參考。

6.多重性問題

多重性問題是指在臨床試驗中，由于存在多個主要指標、多個比較組、多個時間點的比較、期中分析、亞組分析、多個分析集等情況，進行多次假設檢驗而導致Ⅰ類錯誤概率增加的現(xiàn)象。如果試驗將重要的次要指標結(jié)果也納入關鍵性證據(jù)的情況下，即主要指標和重要次要指標共存時的假設檢驗亦需要考慮多重性問題。對于主要指標是復合指標的試驗，如果宣稱的療效是基于復合指標中某個或某些成分時，需事先定義這些成分并納入多重性考慮的確證性分析策略。

將假陽性率控制在事先設定的水平以內(nèi)是非常重要的原則，在確證性臨床試驗結(jié)果的評價中具有重要的意義。在試驗方案或統(tǒng)計分析計劃中應預先說明對多重性問題的考慮、控制Ⅰ類錯誤概率的原因及方法。處理多重性問題的方法有多種，如單步法、閉合檢驗程序、固定順序的檢驗、序貫結(jié)構(gòu)的策略等，在選擇方法時可考慮將能夠估計出療效的可信區(qū)間作為選擇的一個標準。

在對Ⅰ類錯誤概率進行控制的同時可能會導致Ⅱ類錯誤概率的增加，在估計樣本量時應有所考慮。

（六）安全性與耐受性分析

安全性主要關注于藥物對受試者的風險，在臨床試驗中，通常通過實驗室檢查結(jié)果（包括生化學和血液學指標）、生命體征、臨床不良事件（疾病、體征、癥狀）及其他特殊的安全性檢驗（如心電圖、眼科檢查）等手段來評價。耐受性指受試者對于明顯的不良反應的耐受程度。

大多數(shù)試驗中，對安全性與耐受性的分析，常采用描述性統(tǒng)計分析方法，必要時輔以置信區(qū)間進行說明。也可應用圖表來描述治療組間和個體間不良事件的發(fā)生模式（時間、空間、人群、性別分布）。不良事件的發(fā)生率通常以出現(xiàn)不良事件的病例數(shù)與暴露病例數(shù)之比來表示。此外，暴露強度（如人-年）也有可能作為分母。在各個階段的臨床研究過程中，應考慮對安全性評價指標定義的一致性，應考慮采用統(tǒng)一的不良事件編碼詞典（如MedDRA、WHOART和WHO-DD等）。

安全性和耐受性分析的數(shù)據(jù)集通常包括至少接受過一次治療且有安全性評價的受試者。安全性的統(tǒng)計分析方法可以采用不同方式，可在方案及統(tǒng)計分析計劃中結(jié)合臨床判斷，對不同的安全性指標按其重要性及與治療的相關性劃分為不同的類別：重要性較低且與治療方法相關性較弱的安全性指標，可采用描述性分析方法；對于重要性適中且與治療方法有一定相關性的安全性指標，建議加入置信區(qū)間分析；而對于重要性較高且與治療方法相關性較強的安全性指標，可提供相應的統(tǒng)計檢驗p值以供參考。

（七）統(tǒng)計分析報告

統(tǒng)計分析報告是臨床試驗統(tǒng)計師根據(jù)事先擬定的統(tǒng)計分析計劃書，應用統(tǒng)計分析軟件編寫分析程序輸出的統(tǒng)計分析表格和統(tǒng)計分析圖形加以整理的重要文檔，也是提供給臨床主要研究者作為撰寫臨床試驗總結(jié)報告的重要素材，并和統(tǒng)計分析計劃一起作為藥物注冊上市的申請材料之一提交給監(jiān)管部門用于對臨床試驗結(jié)果的評價。

七、名詞解釋

安全集（Safety Set，SS）：安全性與耐受性評價時，用于匯總的受試者集稱為安全集。安全集應考慮包括所有隨機化后至少接受一次治療的且有安全性評價的受試者受試者。

安全性和耐受性（Safety & Tolerability）：醫(yī)療產(chǎn)品的安全性是指受試者的醫(yī)學風險，通常在臨床試驗中由實驗室檢查（包括臨床生化和血液學）、生命體征、臨床不良事件（疾病、體征和癥狀），以及其他特殊的安全性檢查（如心電圖、眼科檢查）等來判定。醫(yī)療產(chǎn)品的耐受性是指受試者能耐受明顯不良反應的程度。

處理效應（Treatment Effect）：是指歸因于臨床試驗中處理的效果。在大多數(shù)臨床試驗中感興趣的處理效應是兩個或多個處理間的比較（或?qū)Ρ龋?/span>

等效性試驗（Equivalence Trial）：是指主要目的為確認兩種或多種治療效果的差別大小在臨床上并無重要意義的試驗。通常以真正的治療效果差異落在臨床上可接受的等效性界值上下限之間來表明等效性。

獨立數(shù)據(jù)監(jiān)查委員會（Independent Data Monitoring Committee，IDMC）：也稱數(shù)據(jù)和安全監(jiān)查委員會、監(jiān)查委員會、數(shù)據(jù)監(jiān)查委員會。獨立數(shù)據(jù)監(jiān)查委員會由申辦者建立可用于定期評價臨床試驗進度、安全性數(shù)據(jù)以及關鍵療效指標，并可向申辦者建議是否繼續(xù)、修改或停止試驗。

多中心試驗（Multicentre Trial）：多中心試驗系指由多個單位的研究者合作，按同一個試驗方案同時進行的臨床試驗。

非劣效性試驗（Non-Inferiority Trial，NI）：是指主要目的為顯示試驗藥物的效應在臨床上不劣于對照藥的試驗。

符合方案集（Per Protocol Set，PPS）：又稱有效病例、療效樣本、可評價病例樣本。是由充分依從于試驗方案的受試者所產(chǎn)生的數(shù)據(jù)集，以確保這些數(shù)據(jù)可能會展現(xiàn)出治療的效果。依從性包括以下一些考慮：如所接受的治療、指標測量的可獲得性以及對試驗方案沒有大的違背等。

交互作用（Interaction）：是指處理間的對比（如研究產(chǎn)品與對照之間的差異）依賴于另一因素（如中心）的情況。定量的交互作用是指對比差異的大小在因素的不同水平時不同；定性交互作用是指對比差異的方向至少在因素的一個水平上不同。

薈萃分析（Meta-Analysis）：是指對同一個問題的兩個或多個試驗的量化證據(jù)進行的規(guī)范評價。這常是將不同試驗的總結(jié)性的統(tǒng)計量進行統(tǒng)計合并，但此名詞有時也用于對原始數(shù)據(jù)的合并。

盲態(tài)審核（Blind Review）：是指在試驗結(jié)束（最后一位受試者最后一次觀察）到揭盲之前對數(shù)據(jù)進行的核對和評估，以便最終確定統(tǒng)計分析計劃。

偏倚（Bias）：是指與設計、實施、分析和評價臨床試驗有關的任何因素導致的處理效應估計值與其真值的系統(tǒng)偏離。臨床試驗實施的偏離所引入的偏倚稱為“操作”偏倚。上述其他來源的偏倚稱為“統(tǒng)計學”偏倚。

期中分析（Interim Analysis）：是指正式完成臨床試驗前，按事先制訂的分析計劃，比較處理組間的有效性或安全性所作的任何分析。

全分析集（Full Analysis Set，FAS）：是指盡可能接近符合意向性治療原則的理想的受試者集。該數(shù)據(jù)集是從所有隨機化的受試者中以最少的和合理的方法剔除受試者后得到。

全局評價指標（Global Assessment Variable）：為單一變量，是將客觀指標和研究者對病人的病情及其改變總的印象綜合起來所設定的指標，通常是一個有序分類等級指標。

隨機分配表的釋放（Randomization Code Release）：是指臨床試驗中對最后一例受試者的隨訪結(jié)束，且所計劃的數(shù)據(jù)采集工作全部完成后，為進一步完成計劃的統(tǒng)計分析工作而將一直保持盲態(tài)的受試者的隨機分組信息對相關研究人員進行公開的解盲過程。

試驗統(tǒng)計學專業(yè)人員（Trial Statistician）：是指接受過專門培訓且有經(jīng)驗，可以執(zhí)行本指導原則并負責臨床試驗統(tǒng)計方面的統(tǒng)計學專業(yè)人員。

雙模擬（Double-Dummy）：是指在臨床試驗中當兩種處理（如治療）不能做到完全相同時，使試驗處理（或治療）仍能保持盲態(tài)的一種技術(shù)。先準備處理A（活性藥和不能區(qū)分的安慰劑）和處理B（活性藥和不能區(qū)分的安慰劑），然后受試者接受兩套處理：活性藥處理A和安慰劑處理B，或者安慰劑處理A和活性藥處理B。

替代指標（Surrogate Variable）：是指在直接測定臨床效果不可能或不實際時，用于間接反映臨床效果的指標。

統(tǒng)計分析計劃（Statistical Analysis Plan，SAP）：是比試驗方案中描述的分析要點更加技術(shù)性和有更多實際操作細節(jié)的一份獨立文件，包括對主要和次要指標及其他數(shù)據(jù)進行統(tǒng)計分析的詳細過程。

脫落（Dropout）：是指受試者由于任何原因不能繼續(xù)按試驗方案進行到所要求的最后一次隨訪。

意向性治療原則（Intention-To-Treat Principle）：是指基于有治療意向的受試者（即計劃好的治療）而不是實際給予治療的受試者進行評價的處理策略。是可以對結(jié)果做出評定的最好原則。其結(jié)果是計劃分配到每一個治療組的受試者即應作為該組的成員被隨訪、評價和分析，而無論他們是否依從于所計劃的治療過程。

優(yōu)效性試驗（Superiority Trial）：是指主要目的為顯示試驗藥物的效應優(yōu)于對照藥（陽性藥或安慰劑）的試驗。

置信區(qū)間（Confidence Interval，CI）：是指按一定的概率或可信度(1-α)用一個區(qū)間來估計總體參數(shù)所在的范圍，該范圍通常稱為參數(shù)的置信區(qū)間。

中央隨機化系統(tǒng)（Centralized Randomization System）：是指在多中心臨床試驗中為克服人為或其他未知因素對研究結(jié)果的偏倚影響，由一個獨立的組織或機構(gòu)基于電話語音或網(wǎng)絡方式實施藥物隨機分配的自動化計算機管理系統(tǒng)。常見有基于電話的交互式語音應答系統(tǒng)（IVRS，Interactive Voice Response System）和基于網(wǎng)絡的交互式網(wǎng)絡應答系統(tǒng)（IWRS，Interactive Web Response System）。

八、參考文獻

1.SFDA：藥物臨床試驗質(zhì)量管理規(guī)范（GCP）2003

2.CDE：臨床試驗數(shù)據(jù)管理工作技術(shù)指南（征求意見稿）2016

3.CCTS：非劣效臨床試驗的統(tǒng)計學考慮。中國衛(wèi)生統(tǒng)計，2012，29（2）：270-274

4.CCTS:臨床試驗中多重性問題的統(tǒng)計學考慮。中國衛(wèi)生統(tǒng)計，2012，29（3）：1-6

5.ICH E9：Statistical Principles for Clinical Trials 1998

6.ICH E8：General Considerations for Clinical Trials 1997

7.FDA：Adaptive Design Clinical Trials for Drugs and Biologics(Draft Guidance) 2010

上一篇人體生物等效性試驗豁免指導原則下一篇藥物臨床試驗質(zhì)量管理規(guī)范（修訂稿）

歡迎登陸山東特譜藥物研發(fā)有限公司官方網(wǎng)站

藥物臨床試驗的生物統(tǒng)計學指導原則

技術(shù)轉(zhuǎn)讓

關于我們

聯(lián)系我們