一、概述
貝葉斯方法是基于貝葉斯定理,將先驗知識與觀測數(shù)據(jù)整合,通過定量計算得到后驗分布再進行推斷的統(tǒng)計學方法。在臨床試驗中,貝葉斯方法可以高效地利用已有信息,對于提高藥物研發(fā)效率和縮短研發(fā)周期具有重要作用和意義。目前貝葉斯方法在臨床試驗中已有較為廣泛的應用,尤其在探索性臨床試驗中的藥物劑量選擇、安全性評價等方面。本指導原則的適用范圍是以貝葉斯方法作為主要分析方法的關鍵性臨床試驗,通常作為主要證據(jù)支持藥物上市。探索性臨床試驗或者確證性臨床試驗中的敏感性分析、補充分析、亞組分析、次要療效終點的貝葉斯統(tǒng)計分析可參考本指導原則。
貝葉斯方法在臨床試驗中所涉及的方法多樣且復雜。為保證本指導原則更具針對性和實用性,結合目前藥物臨床試驗發(fā)展現(xiàn)狀,本指導原則主要關注貝葉斯外部信息借用方法在臨床試驗中的應用。關于貝葉斯外部信息借用方法的具體定義見本指導原則第二章第四節(jié)。
本指導原則在介紹貝葉斯統(tǒng)計相關基礎理論和定義基礎上,重點闡述了在臨床試驗中使用貝葉斯方法時應開展的適用性評估內容,以及具體試驗設計和統(tǒng)計分析建議、模擬技術要求,并且介紹了貝葉斯框架下統(tǒng)計分析結果的臨床解讀和綜合評價。最后說明了不同情形下溝通交流的要求。
本指導原則僅代表藥品監(jiān)管部門當前的觀點和認識,不具有強制性的法律約束性。隨著科學研究的進展,本指導原則中的相關內容將不斷完善與更新。應用本指導原則時,還請同時參考藥物臨床試驗質量管理規(guī)范(GCP)、國際人用藥品注冊技術協(xié)調會(ICH)和其他國內外已發(fā)布的相關指導原則。
二、理論基礎
(一)貝葉斯統(tǒng)計數(shù)學原理和應用背景
貝葉斯方法是一種基于貝葉斯定理的統(tǒng)計方法,它通過整合先驗信息與觀測數(shù)據(jù)得到后驗分布以進行統(tǒng)計推斷和決策。記觀測數(shù)據(jù)為,參數(shù)的后驗分布由以下貝葉斯公式給出:
其中表示給定參數(shù)的條件下,數(shù)據(jù)的概率(或密度),也被稱作似然。是先驗,反映在獲得數(shù)據(jù)之前對于參數(shù)的信念。為邊際似然,用于確保后驗分布具有概率的歸一性。后驗分布是在獲得觀測數(shù)據(jù)之后,于先驗分布基礎之上對參數(shù)信念的更新。可能包括冗余參數(shù),即模型中存在但不直接關注的參數(shù)。此時常通過積分處理冗余參數(shù),從而得到關注參數(shù)的邊際后驗分布以支持進一步的統(tǒng)計推斷。貝葉斯統(tǒng)計和頻率學統(tǒng)計是兩種不同的統(tǒng)計推斷框架,它們在統(tǒng)計思想和統(tǒng)計推斷(包括統(tǒng)計決策和參數(shù)估計)方面存在差異。
在統(tǒng)計思想方面,貝葉斯統(tǒng)計視參數(shù)為隨機變量,通過概率分布來描述參數(shù)的不確定性。頻率學統(tǒng)計視參數(shù)為固定的未知常數(shù),基于抽樣分布理論量化參數(shù)估計的不確定性。在統(tǒng)計決策方面,貝葉斯方法通過計算關注事件的后驗概率評估假設的可信度。例如,當為試驗組的有效率時,貝葉斯方法能夠基于后驗分布)給出> 30%> 50%的后驗概率;而頻率學統(tǒng)計通常基于假設檢驗給出的值來判斷統(tǒng)計學顯著性。在參數(shù)估計方面,貝葉斯方法基于后驗分布給出點估計(例如后驗均值估計)和可信區(qū)間;頻率學統(tǒng)計通常使用最大似然估計等方法給出參數(shù)的點估計,并結合抽樣分布理論構造置信區(qū)間。
在錯判概率方面,本指導原則主要關注的“假陽性率”,定義為試驗藥物無效但決策為試驗藥物有效的概率;“假陰性率”定義為試驗藥物有效但決策為試驗藥物無效的概率。同理,定義“統(tǒng)計效能”為試驗藥物有效并決策為試驗藥物有效的概率。總體而言,在藥物研發(fā)和臨床試驗中,貝葉斯統(tǒng)計為處理不確定性和整合已有信息提供了一種新工具、新方法,在適用場景中能夠更加高效地達到試驗目的,充分利用已有信息優(yōu)化試驗設計,提高決策可靠性和研發(fā)效率。此外,貝葉斯統(tǒng)計框架對關注內容給出概率形式結果,便于決策者進行風險獲益分析,輔助綜合評價治療價值。同時需要關注到貝葉斯統(tǒng)計使用過程中的挑戰(zhàn)。例如,不恰當?shù)南闰灧植迹ㄓ绕涫切畔⑾闰灧植迹┑倪x擇,可能會導致誤導性的結果。其次,貝葉斯統(tǒng)計通常涉及復雜的數(shù)值計算,尤其是在高維參數(shù)空間中計算后驗分布可能需要耗費較多的時間和計算資源。再者,出于對先驗及模型穩(wěn)健性評估的需要,貝葉斯臨床試驗設計往往需要大量的模擬研究支持,這會增加其應用的復雜度。
(二)后驗概率和預測概率
在使用貝葉斯方法的臨床試驗中,基于后驗分布的后驗概率和基于后驗預測分布的預測概率常作為決策的重要依據(jù)。后驗分布反映了在現(xiàn)有證據(jù)下對參數(shù)的認識,量化了參數(shù)的不確定性,是貝葉斯統(tǒng)計推斷的核心。后驗概率是在后驗分布基礎上,對某一特定情況(例如藥物有效率大于30%)的概率描述。后驗預測分布是在后驗分布基礎上得到的未來樣本的概率分布,在考慮參數(shù)不確定性的同時還反映了抽樣的不確定性。后驗預測概率是指在后驗預測分布的基礎上,預測未來某一事件發(fā)生的概率。在一個具體試驗中,后驗概率常用于統(tǒng)計決策,而預測概率通常用于試驗過程中預測試驗后續(xù)達到試驗成功標準的概率。
(三)貝葉斯統(tǒng)計計算原理
在一些簡單情形中,關注參數(shù)的后驗分布存在解析形式。例如,對于服從二項分布的隨機變量,若以貝塔分布作為事件發(fā)生率的先驗分布,則其后驗分布仍為貝塔分布。這種后驗分布與先驗分布能夠屬于同一分布族的簡單貝葉斯模型被稱作共軛模型。雖然共軛模型具有簡單的后驗分布推導,但此類模型并不能適用于所有的統(tǒng)計分析需求。更加復雜的貝葉斯模型,通常不能推導出后驗分布的解析形式。此時可采用數(shù)值計算方法進行抽樣近似,包括馬爾可夫鏈蒙特卡洛方法、變分推斷法等。在得到抽樣樣本后,可從中得到關注參數(shù)的后驗分布和估計量,包括點估計和區(qū)間估計等。
(四)貝葉斯信息借用方法
在貝葉斯統(tǒng)計中,參數(shù)的先驗分布可以反映來自已有數(shù)據(jù)或專家意見的外部信息,從而實現(xiàn)在當前研究中借用信息的目的。在信息借用方法中,可交換性假設是支撐統(tǒng)計模型合理性的核心理論基礎。它是指觀測序列的聯(lián)合概率分布在所有可能的排列下保持不變。根據(jù)可交換性假設,不同亞組、外部數(shù)據(jù)或相關數(shù)據(jù)源的參數(shù)可被視為同一潛在分布的隨機實現(xiàn),從而允許模型借用信息。可交換性假設的判斷需結合科學背景,例如外部數(shù)據(jù)與當前研究人群特征的匹配程度,不同人群中的治療效應一致性等。信息借用分為外部信息借用和內部信息借用。外部信息借用是指作為主要證據(jù)的臨床試驗數(shù)據(jù)外的信息借用,例如罕見病研究將少量受試者分配至對照組,并借用歷史外部對照信息進行統(tǒng)計推斷。本指導原則主要介紹兩項常使用的先驗分布形式,包括冪先驗和混合先驗。冪先驗是一種簡單直觀的信息借用方法。具體地,記外內部信息借用是指作為主要證據(jù)的臨床試驗數(shù)據(jù)中各亞組/亞群間的數(shù)據(jù)信息借用。例如在籃子試驗中對某適應癥的療效估計借用其他適應癥的信息、在多區(qū)域臨床試驗中對區(qū)域療效的估計借用其他區(qū)域的信息等。此類內部信息借用的統(tǒng)計分析結果常用于補充分析和亞組分析。
三、適用性評估
在臨床試驗中采用貝葉斯外部信息借用的設計階段,應從科學合理性、可靠性、可行性、可解讀性方面進行充分評估,并與監(jiān)管部門積極溝通,以確保貝葉斯設計和分析方法在具體試驗中的適用性。主要評估內容包含但不限于以下各項:
(一)科學合理性評估
需要基于研究背景和臨床開發(fā)計劃,通過統(tǒng)計、臨床醫(yī)學、臨床藥理等多學科的綜合評價,說明采用貝葉斯外部信息借用方法的適用原因,例如:無法納入足夠的受試者、存有高質量的具有相似性的臨床試驗數(shù)據(jù)等。評估應包含定量分析及模擬研究,以闡述說明本研究使用貝葉斯信息借用的科學合理性。此外,評估內容應重點闡述以下兩方面內容:
1.先驗信息
通過評估外部信息與當前研究的相關性和一致性判斷可交換假設是否滿足,以及先驗信息和當前研究是否能夠滿足統(tǒng)計模型和統(tǒng)計分析方法的基本假設。
2.假陽性率和假陰性率
通過評估試驗中信息借用量、決策標準、樣本量下的假陽性率和假陰性率表現(xiàn),確保錯判概率在一定的合理范圍內。還需通過對假陽性率的評估確保信息借用量不會主導試驗結果。
(二)借用信息來源的數(shù)據(jù)質量與可靠性評估
常見借用信息來源包括既往的藥物臨床試驗數(shù)據(jù)、真實世界證據(jù)、同類藥物的研究成果、專家意見等。應詳細展示和說明選擇借用信息來源的過程和結果,并充分評估借用信息數(shù)據(jù)來源是否真實、可靠、全面,以及系統(tǒng)評估信息來源的證據(jù)強度和與擬開展研究的可比性。相關評價內容和方法還可參考其他相關指導原則,例如《真實世界證據(jù)支持藥物研發(fā)與審評的指導原則》中關于數(shù)據(jù)的適用性評價、其他監(jiān)管機構發(fā)布的外部數(shù)據(jù)相關指導原則等。
(三)實施可行性和對試驗完整性影響的評估
需在試驗前全面評估使用貝葉斯信息借用方法對試驗設計、操作、模擬可行性的影響和要求。如果試驗涉及適應性設計和/或期中分析,需參照相關指導原則以維持試驗的完整性。
(四)分析結果的可解讀性和穩(wěn)健性評估
應事先明確貝葉斯統(tǒng)計分析計劃,并需確保統(tǒng)計分析結果及呈現(xiàn)方式具有臨床可解讀性。同時應預設合理且充分的敏感性分析以評估分析結果的穩(wěn)健性。
四、試驗設計與統(tǒng)計分析
貝葉斯外部信息借用的臨床試驗通過完整全面的信息構建對關注臨床問題的準確已有認識和先驗分布,之后通過先驗分布和新開展臨床試驗的觀測數(shù)據(jù)計算得到后驗分布,并基于后驗分布進行統(tǒng)計推斷,以此對試驗藥物的風險獲益進行評估。總體試驗設計原則和似然分布的計算原則可參考 ICH E9 及 E9(R1)等相關指導原則,額外需重點關注貝葉斯相關設計參數(shù),主要包括先驗分布的構建、決策標準、樣本量的設計等。此外,應認識到存在先驗數(shù)據(jù)沖突的可能性,試驗設計時建議考慮納入相應的處理方案。
(一)借用信息來源及評價
借用信息須有明確的數(shù)據(jù)來源。應在構建借用信息的先驗分布前,充分評價信息來源的數(shù)據(jù)質量,并提供所選擇數(shù)據(jù)來源的理由和依據(jù)。還需要重點評價借用數(shù)據(jù)來源和擬開展研究數(shù)據(jù)來源的可比性。信息來源的主要評價內容包括但不限于:
1.臨床背景
對于信息來源主要從受試者特征和疾病治療兩方面進行評估。受試者特征的評估包括入選標準、排除標準、診斷標準/方法、流行病學特征、疾病特征、既往用藥特征等。疾病治療的評估,不僅包括研究藥物,還應包括基礎治療。所關注內容包括藥物制劑、劑量、給藥途徑、時間、用藥頻次和持續(xù)時間,以及劑量調整、中斷、停藥和依從性的具體規(guī)則。如必要且適用,還需從研究藥物的 PK/PD 特征方面進行評價。
2.研究設計
已完成的臨床研究通常作為借用信息的主要數(shù)據(jù)來源,可以從研究設計和研究結果兩方面,對借用信息來源的證據(jù)強度和與擬開展臨床試驗間的可比性進行評估。研究設計特征包括研究類型(注冊研究、非注冊研究)、試驗階段(確證性臨床、探索性臨床)、設計類型(對照研究、單臂研究、非干預研究)、比較類型(優(yōu)效、非劣、等效)、樣本量、統(tǒng)計分析計劃等內容。觀察指標結果通常為被借用的信息,因此需要重點關注觀察指標的定義和評價標準,包括臨床意義、評估標準、評估方法、評估結果等。同時還需關注具體統(tǒng)計分析方法、伴發(fā)事件處理策略、缺失值處理方式、協(xié)變量調整等。
3.時效性
借用信息的數(shù)據(jù)來源具有一定時效性,其各方面可能會隨著時間而改變。例如,受試者人群特征以及疾病反應或進展的判斷標準、疾病的臨床實踐、治療結局、觀察指標的定義與評價、后續(xù)治療的影響等方面發(fā)生變化,從而導致歷史數(shù)據(jù)與當前數(shù)據(jù)存在差異。申辦者應充分考慮信息來源的時效影響,慎重選擇已有較長歷史的信息來源。信息來源的完整性和全面性,是確保其能準確代表對于關注問題已有認識的基礎。申辦者應充分考察所有相關數(shù)據(jù)源,尤其是與當前研究問題具有高度相關性的內容。為避免在借用信息時產生潛在的選擇性偏倚,不應僅選擇對試驗藥物有利而排除對試驗藥物不利的數(shù)據(jù)來源,以確保現(xiàn)有認識不被過高估計,從而避免認知偏差導致的結論偏倚。通過以上內容對借用信息來源進行系統(tǒng)并全面的證據(jù)強度和可比性評價,為借用信息量的選擇提供依據(jù)。通常情況下,以注冊為目的的隨機、對照、雙盲的確證性臨床研究被認為是證據(jù)強度較高的信息來源。
(二)先驗分布構建
1.信息借用方式
擬開展臨床試驗可以通過多種方式借用外部信息,例如僅借用對照組(安慰劑或者陽性藥物)信息,僅借用試驗組信息,同時借用試驗組和對照組信息,借用試驗組和對照組的療效差異信息等。選擇合適的信息借用方式是開展貝葉斯信息借用臨床試驗的前提,這與擬開展臨床試驗需解決的臨床問題、外部信息的可比性等方面有關。
例如,在兒童等特殊人群的藥物研發(fā)中借用成人臨床試驗的數(shù)據(jù),在針對罕見病的研究中借用歷史對照數(shù)據(jù),此類借用情形通常出于倫理考慮或者將有限臨床資源集中于試驗藥物;在橋接研究中借用已完成的其他人群研究數(shù)據(jù),在臨床比對研究中借用已完成的陽性藥物臨床試驗數(shù)據(jù),此類借用情形可以提高試驗效率和參數(shù)估計精度。
2.先驗分布形式
先驗分布的構建首先應基于數(shù)據(jù)類型(連續(xù)數(shù)據(jù)、離散數(shù)據(jù)、時間事件數(shù)據(jù)等)采用不同的分布類型,例如正態(tài)分布,貝塔分布,伽馬分布等。之后根據(jù)信息來源構建明確的先驗分布,需要注意的是構建的先驗分布應能準確表達關于參數(shù)的已有認識。當先驗信息來自多個信息來源,應通過合適的統(tǒng)計學方法整合為一個信息先驗分布。先驗分布形式的選擇需要綜合考慮各種因素,包括臨床背景、信息來源的特征和質量、借用信息與擬開展研究數(shù)據(jù)的相關性、擬開展研究的試驗設計和相關假設等。
3.權重的意義與選擇
由于借用信息和擬開展臨床研究在試驗背景、受試者人群特征、療效評價等方面可能存在差異,外部信息并不能完全等同于和替代擬開展研究數(shù)據(jù)。或者外部信息的借用量過大會導致先驗信息主導擬開展臨床試驗的試驗結果。因此在借用外部信息時,需通過調整先驗分布中的權重來控制外部信息借用量。在不同先驗分布形式中,權重表現(xiàn)形式略有不同:冪先驗法的權重表現(xiàn)形式為冪次參數(shù);混合先驗中信息先驗和弱信息(無信息)先驗的權重比例反映了當前試驗參數(shù)和擬采用的信息先驗的一致性程度。需注意,由于權重在不同先驗形式中意義不同,因此不同先驗形式中使用相同權重值對試驗的影響是不同的。先驗分布中的權重值不僅應體現(xiàn)外部信息在科學和臨床層面的先驗信念,也應體現(xiàn)先驗信息對最終結果的影響程度。因此權重的選擇,是結合外部信息的證據(jù)強度和可比性評估結果,與擬開展研究中參數(shù)操作特征的綜合考慮,需要在研究開始前與審評機構就先驗分布權重值進行溝通并達成一致。
(三)試驗假設和決策標準
與常規(guī)試驗設計相同,貝葉斯統(tǒng)計臨床試驗設計也需要在開展前針對關鍵問題提出明確試驗假設,并在研究方案或者統(tǒng)計分析計劃中明確決策標準以判斷研究是否達到預設試驗目的。合理的決策標準有利于提高決策的準確率和可靠性,降低決策風險和確保研究的科學性。制定決策標準時應考慮擬開展研究的借用情形和決策目的。在采用貝葉斯外部信息借用的臨床試驗中,需要決策的情形包括但不限于對主要觀察指標的優(yōu)效性、非劣效性、或等效性的確證性結論、橋接一致性結論、基于期中分析數(shù)據(jù)的決策。例如,在優(yōu)效性臨床試驗中,假設更高的療效參數(shù)反映更好的療效,使用觀察指標的效應量大于預設效應量的后驗概率,以其是否大于預設概率閾值作為達到試驗目的如果該后驗概率超過預設的概率閾值,則認為當前試驗結果支持達到預設試驗目的的結論。除可用于支持試驗的最終結論以外,后驗概率也可能用于期中決策,后驗預測分布可以提供期中分析的支持性證據(jù)。概率閾值的選擇應基于臨床意義和當前決策標準下操作特征的綜合評估。對閾值的設定特別要考慮其對錯判概率的控制和影響,尤其關注其對假陽性率的控制。
申辦者需充分評估決策標準的合理性、科學性、可靠性,并在研究開始前與審評機構就決策標準(包括預設的效應值和概率閾值)進行溝通并達成一致。
(四)樣本量
合理的借用數(shù)據(jù),可以為擬開展臨床研究的樣本量設計提供多種選擇和靈活性,常見情形有:1)保持與頻率學方法設計相同的樣本量,借用數(shù)據(jù)可以提高擬開展試驗的統(tǒng)計效能和估計可靠性;2)保持與頻率學方法設計相同的統(tǒng)計效能,通過借用信息減少擬開展臨床試驗的樣本量,從而降低研究成本和/或縮短試驗周期;3)保持與頻率學方法設計相同的樣本量,但調整隨機分配比例,將更多受試者分配到試驗組,從而獲得更多試驗組的直接數(shù)據(jù)。例如,通過借用對照組信息減少對照組分配的樣本量。
在采用貝葉斯外部信息借用方法的臨床試驗中,樣本量的設計并非完全依賴于數(shù)學公式計算結果,而是需要結合實際研發(fā)背景、臨床實踐、安全性、有效性、先驗信息、決策標準、試驗設計等因素進行的綜合評價。尤其是通過試驗中重要參數(shù)的操作特征表現(xiàn)選擇出合適的樣本量。需要認識到擬開展研究作為關注臨床問題的直接數(shù)據(jù)來源,是確證藥物有效的主要證據(jù),因此鼓勵招募更多數(shù)量受試者以滿足安全性評價和監(jiān)管要求。對于極少樣本量的臨床試驗,應尤其關注應用貝葉斯外部信息借用的適用性。對于借用信息所代表的樣本量,應進行充分評估,例如使用有效樣本量。
(五)統(tǒng)計分析的考慮
在使用貝葉斯外部信息借用的臨床試驗中,通過整合先驗分布和觀測數(shù)據(jù)的似然分布得到的后驗分布,是貝葉斯統(tǒng)計推斷的主要對象。因此需重點關注后驗分布計算的正確性,包括解析公式的正確性、抽樣模擬的模型正確性和結果收斂性。貝葉斯統(tǒng)計臨床試驗通過提供參數(shù)點估計和可信區(qū)間描述后驗分布的特征,反映主要關注的觀測指標估計值的不確定性范圍,然后計算后驗概率并與預設概率閾值比較以確定試驗成功與否,而不再依賴于值判斷試驗成功與否。
在貝葉斯統(tǒng)計分析中,評估試驗方案中預設內容對試驗結論穩(wěn)健性的影響非常重要,因此需要事先設置合理的敏感性分析,尤其關注先驗信息及先驗借用量的影響。例如通過臨界點敏感性分析評估先驗信息借用量的影響,計算不同先驗權重值下的更新后驗分布及得出的相應統(tǒng)計決策結論,找出將結果從成功變?yōu)槭〉奶囟嘀嘏R界值。敏感性分析還可用于評估先驗分布中超參數(shù)的預設值、不同的借用信息來源下統(tǒng)計推斷的穩(wěn)健性等。需要注意,在研究結束后發(fā)現(xiàn)借用數(shù)據(jù)與當前試驗數(shù)據(jù)存在數(shù)據(jù)沖突,或借用信息源不滿足全面性,則需要從已知和未知的關鍵因素方面結構化分析其原因,并增加額外的補充分析以評估影響或校正偏倚。在適應性設計中應用貝葉斯方法時,需重點關注多次決策引起的假陽性率的膨脹。需事先在試驗方案和統(tǒng)計分析計劃中明確期中分析的時間點和決策標準,并設置相應的假陽性率控制方案并體現(xiàn)在決策標準的概率閾值中。同樣在處理多個比較時,也需考慮多重決策引起的假陽性率膨脹風險。
在進行期中分析決策時,需關注預設的借用信息量是否適用于期中分析。由于期中分析時所獲得的試驗數(shù)據(jù)量要少于最終分析,因此期中分析直接使用最終分析時的借用信息量,可能會造成借用信息主導期中分析結果的情況。因此應慎重考慮基于期中分析的有效性終止設計。
總體而言,在應用貝葉斯外部信息借用的臨床試驗中,先驗分布構建的重要部分是確定先驗信息的借用量,以體現(xiàn)信息來源的證據(jù)強度并防止借用量過大導致先驗信息完全主導試驗結果;決策標準是判斷擬開展研究達到預設試驗目的的直接標準,與試驗錯判概率具有直接關系,應重點關注是概率閾值的設定;樣本量是試驗實施的主要關注內容,也通常是試驗使用貝葉斯外部信息借用的主要原因,需要通過多因素綜合評價從而選擇合適的樣本量。這些設計參數(shù)并非獨立確定,也非先后確定,而是結合試驗關注的臨床問題和操作參數(shù)的表現(xiàn)選擇合適的設計組合,例如通過錯判概率的表現(xiàn)選擇合適的先驗分布權重值,決策預設概率閾值和樣本量的組合。
五、模擬技術要求
臨床試驗模擬技術是復雜試驗設計中重要的工具,在貝葉斯試驗設計中尤為重要。模擬技術在貝葉斯臨床試驗中的應用主要分為兩方面,分別是設計模擬和計算模擬。在試驗設計層面,通過模擬不同假設情形下的試驗表現(xiàn)優(yōu)化試驗設計;在統(tǒng)計分析計算層面,通過抽樣模擬進行后驗分布計算、統(tǒng)計推斷等。申辦者在實施模擬技術之前,需在統(tǒng)計分析計劃(或獨立模擬計劃)中詳細說明終點數(shù)據(jù)類型、分布特征、先驗分布、模型選擇、抽樣算法、抽樣數(shù)量、計算方法、決策標準等細節(jié)從而確保模擬方法的適用性和結果的可靠性。
(一)試驗設計模擬
在試驗設計階段,可以通過不同假設情形下的大量模擬試驗,開展操作特征的優(yōu)化、錯判概率的控制、不同設計框架和信息借用模型的對比分析等,為試驗設計中參數(shù)設置提供充分依據(jù)。當使用模擬技術評估貝葉斯臨床試驗設計時,首先需明確說明模擬研究與擬開展研究試驗目的關系,以及需解決的問題。為更好理解和評估所提出的貝葉斯試驗設計,申辦者可考慮在模擬研究中加入與其他試驗設計方案的比較,例如貝葉斯方法與頻率學方法的比較。試驗模擬應基于合理全面的參數(shù)假設范圍,同時覆蓋合理的冗余參數(shù)的變化范圍(例如入組速度,脫落率)。除常規(guī)試驗設計參數(shù)外,在貝葉斯外部信息借用試驗設計中還需重點評估貝葉斯方法相關參數(shù),例如:1)不同的信息借用模型(例如單臂借用或雙臂借用,療效借用或療效差異借用,冪先驗分布或混合先驗分布等);2)借用信息量;3)擬開展研究樣本量和借用信息所代表樣本量;4)試驗假設下的決策標準。
模擬研究應針對試驗設計的操作特征進行評價,包括但不限于假陽性率、假陰性率、試驗時長、試驗成功率等。對于操作特征的評價,既要關注點估計,也需要關注估計的變異性和范圍。對于通過模擬研究驗證試驗假陽性率的可控性,應事先確定藥物無效假設的研究范圍以及冗余參數(shù)的變異范圍。雖然在大多數(shù)情況下不可能窮盡模擬所有可能的假陽性情況,
但應盡可能確保研究范圍的合理性與全面性,并選擇充分的無效場景,這對于證明試驗的假陽性可控和合理性是至關重要的。如果模擬結果顯示假陽性率過高,可以考慮變更先驗分布、信息借用量、統(tǒng)計模型、決策標準等辦法。建議申辦者在模擬研究中選擇具有代表性的參數(shù)設定場景進行詳細說明,這將有助于更加精準地理解試驗設計。模擬結果應盡可能使用簡顯易懂、可視化的形式進行展示。需要注意,當臨床試驗設計發(fā)生變更或最終觀測數(shù)據(jù)不在模擬研究預設范圍內時,申辦者應考慮進行補充模擬研究。對于在各種試驗情形下的操作特征優(yōu)化研究,應考慮不同操作特征對精度的要求選擇充分的模擬次數(shù)。例如,對于假陽性率的模擬研究精度要求會高于對試驗檢驗效能的模擬研究,因此一般會要求更多的模擬次數(shù)(例如至少 100000次)。
(二)統(tǒng)計分析模擬
在試驗完成后,對試驗結果進行統(tǒng)計分析,包括計算后驗分布、參數(shù)估計、統(tǒng)計決策等。在某些情況下,比如先驗分布為共軛分布時,可直接根據(jù)公式推導得到后驗分布。在大部分情況下,尤其是復雜分布或者高維數(shù)據(jù)時,無法直接通過公式推導得到后驗分布,此時一般需要通過模擬的方式得到后驗分布。
計算模擬應重點關注抽樣的正確性,模型的收斂性以及估計的準確性等。當使用 MCMC 方法時,需要注意產生的數(shù)值鏈應在生滅周期后收斂。在進行推斷時,需要剔除來自生滅周期的樣本,并使用收斂診斷工具檢查收斂性。貝葉斯方法的統(tǒng)計決策主要基于后驗分布,參數(shù)估計包括點估計和區(qū)間估計。首先采用模擬技術得到后驗分布的樣本,然后可用后驗分布的模擬樣本得到參數(shù)的點估計值和可信區(qū)間。應事先考慮模型適用性、模型假設、模型擬合度、迭代次數(shù)等內容,以保證后驗分布估計的準確性。復雜模型的模擬可能需要高性能計算資源,過于復雜的情形會導致模擬可行性較差。因此,申辦者應合理規(guī)劃硬件需求和時間成本以優(yōu)化模擬計劃。不同模擬情形建議使用不同的隨機數(shù)種子,避免產生系統(tǒng)性異常結果。貝葉斯模型比較復雜,應保證統(tǒng)計編程的正確性并確保算法得以正確實施。在提交臨床試驗結果時,應包括隨機種子、軟件(版本)、運行環(huán)境說明、程序(包括程序說明文件和詳細程序批注),以及其他必要信息,確保監(jiān)管機構可以復現(xiàn)和檢驗模擬結果。建議采用表格和/或可視化圖形的方式展示結果(如收斂性,主要結論,敏感性分析)。
(三)文檔要求
當基于試驗模擬證明使用貝葉斯方法的合理性時,申辦者應向監(jiān)管方提交獨立模擬研究報告,該報告也可作為研究方案或統(tǒng)計分析計劃的附件提交。模擬研究報告應該詳細展試驗設計、借用信息來源、模擬方法、模擬結果、模擬結論。模擬研究報告應包含以下要點,可根據(jù)不同試驗情況可做增刪。模擬研究報告示例文檔見附錄 2。
六、結果的解讀
對于使用貝葉斯信息外部借用方法的試驗,正確呈現(xiàn)和解讀統(tǒng)計分析結果并結合臨床實踐進行獲益風險評估是監(jiān)管決策的關鍵環(huán)節(jié)。與采用其他統(tǒng)計方法設計和決策的臨床試驗類似,在貝葉斯框架下基于方案中提前設定的決策標準進行統(tǒng)計決策,是評價試驗成功的重要標準之一。貝葉斯方法的決策主要基于后驗概率。后驗概率可直觀展示對關注的臨床觀測指標的描述:例如“治療組優(yōu)于對照組的(后驗)概率為 97.5%”。貝葉斯方法的統(tǒng)計分析結果需結合臨床意義進行綜合評價,重點說明治療效果的點估計大小及其對患者的實際影響,結合可信區(qū)間討論結果的不確定性及其對臨床決策的影響。同時還需關注貝葉斯方法相關敏感性分析評估結論的穩(wěn)健性,以及避免先驗信息主導試驗決策。若適用,還需通過結構化分析以評估和說明當前觀測數(shù)據(jù)和先驗數(shù)據(jù)的不一致情形。為了更加全面的評價試驗結果,在貝葉斯外部信息借用方法結果的基礎上,可參考弱信息(無信息)先驗或頻率學方法的結果進行比對解讀。
七、溝通交流
申辦者在藥物臨床試驗申請前、藥物臨床試驗過程中以及藥品上市許可申請前等關鍵階段,可以就重大問題與審評機構進行溝通交流。關于溝通交流的具體要求和內容參考《藥品研發(fā)與技術審評溝通交流管理辦法》、《藥物研發(fā)與技術審評溝通交流會議申請資料參考》等。
目前應用貝葉斯外部信息借用方法的臨床試驗涉及三種溝通交流情形:第一種情形是在通過溝通交流對臨床試驗方案及相關統(tǒng)計分析計劃、模擬計劃達成一致意見,例如 pre-IND 溝通交流、Ⅱ期臨床試驗結束/Ⅲ期臨床試驗啟動前溝通交流。在該階段中,申辦者需要與審評機構就臨床試驗中涉及的貝葉斯方法相關細節(jié)達成一致意見,包括前文中提到的適用性評估、試驗設計、統(tǒng)計分析、模擬計算等內容。第二種情形是新藥上市許可申請前溝通交流,即 pre501 NDA 溝通交流。該情形下會議目的主要是,探討當前臨床試驗數(shù)據(jù)和貝葉斯統(tǒng)計分析結果是否滿足藥品上市許可的技術要求。第三種情形是藥物臨床試驗期間方案變更的溝通交流。根據(jù)《藥物臨床試驗期間方案變更技術指導原則》,對于不會顯著增加受試者安全風險,但可能顯著影響試驗科學性以及數(shù)據(jù)可靠性的實質性變更,應與審評機構進行溝通交流。臨床試驗中涉及到的貝葉斯相關設計因素的變更,例如先驗信息來源的變更、信息借用量的變更、統(tǒng)計分析方法的變更等,均屬于實質性變更。申辦者應說明變更原因,并提交充分模擬結果。
貝葉斯定理 Bayes' theorem
先驗分布 Prior distribution
似然 Likelihood
后驗分布 Posterior distribution
后驗概率 Posterior probability
后驗預測分布 Posterior predictive distribution
后驗預測概率 Posterior predictive probability
信念 Belief
冗余參數(shù) Nuisance parameter
邊際后驗分布 Marginal posterior distribution
可交換性 Exchangeability
共軛先驗 Conjugate prior
共軛模型 Conjugate model
最大似然估計 Maximum likelihood estimation
置信區(qū)間 Confidence interval
可信區(qū)間 Credible interval
統(tǒng)計效能 Power
錯判概率 Probability of erroneous conclusions
假陽性率 False positive rate
假陰性率 False negative rate
馬爾可夫鏈蒙特卡洛
Markov chain Monte Carlo (MCMC)
變分推斷 Variational Inference (VI)
操作特征 Operating characteristics
冪先驗 Power prior
混合先驗 Mixture prior
Meta 分析預測先驗
Meta-analytic-predictive (MAP) prior
決策標準 Decision criterion
有效樣本量 Effective sample size (ESS)
生滅周期 Burn-in period
先驗數(shù)據(jù)沖突 Prior-data conflict
附錄 2、模擬研究報告示例文檔
一、試驗目的和估計目標
簡要介紹擬開展臨床試驗的研究目的與估計目標。
二、試驗設計
簡要介紹擬開展臨床試驗背景和設計、試驗目的等內容。可以圖示方式呈現(xiàn)試驗設計、流程和不同治療組治療情況。
三、分析計劃
簡要介紹擬開展臨床試驗的統(tǒng)計分析計劃,重點闡述貝葉斯相關信息,包括介紹借用信息來源及其評價,先驗分布的構建,后驗分布的計算和基于后驗分布的統(tǒng)計推斷。
四、模擬目的
闡述模擬報告需解決的核心問題和目的。
五、模擬方法
(一)研究設計選項
擬開展臨床研究計劃使用的試驗設計方案及其備選方案,以及試驗設計中重點參數(shù)設置計劃。
(二)模型設置
1、臨床數(shù)據(jù)生成模型基于不同預設臨床情形的參數(shù)設置,生成模擬臨床試驗數(shù)據(jù)的模型。
2、統(tǒng)計分析模型
例如包括主要療效分析模型、缺失數(shù)據(jù)處理等。
(三)分析和決策標準
模擬研究中的統(tǒng)計分析方法和決策標準。
(四)操作特征
用于評估試驗設計表現(xiàn)的具體指標。
六、模擬結果
(一)操作特征結果
模擬操作特征結果的關鍵總結內容,例如假陽性率、功效和其他操作特征、先驗分布對結果的影響、與其他備選方法的比較。
(二)代表性場景
選擇模擬試驗中的代表性場景進行說明,解釋試驗設計的邏輯和結果呈現(xiàn)與解讀,描述是否滿足決策規(guī)則。
七、總結和建議
(一)模擬過程總結
概括總結整個模擬過程,結合模擬結果進行試驗設計的優(yōu)劣勢和適用性評估,基于決策規(guī)則所獲試驗建議,以及針對潛在問題的解決方案。
(二)方案設計建議
對于試驗方案設計的建議,重點闡述貝葉斯相關特征的設計結論。
八、參考文獻
九、附錄
建議包括:縮略語、模擬代碼與說明文件(用于驗證模擬過程的可重復性)、模擬結果圖表等。
來源:CDE
原文下載:《藥物臨床試驗中應用貝葉斯外部信息借用方法的指導原則(征求意見稿)》.pdf