ICH E20 臨床試驗的適應性設計指導原則
1.前言和范圍
本指導原則為采用適應性設計的確證性臨床試驗提供指導,旨在整體開發計劃的背景下評估給定醫學疾病的治療方法。就本指導原則而言,適應性設計是指允許根據試驗參與者積累數據的期中分析結果,對試驗的一個或多個方面進行前瞻性計劃修改的臨床試驗設計。這里“前瞻性計劃”是指在試驗開始前,臨床試驗方案中預先設定了潛在的試驗調整內容。本指導原則的范圍不包括對設計進行計劃外修改的試驗,如獨立的數據監查委員會(IDMC)根據非預期的期中分析結果提出的方案修訂。該范圍也不包括完全依據試驗外部來源的信息做出的設計變更。對入組率、數據質量或試驗參與者退出程度等操作方面的常規監測也超出該范圍。
本指導原則目的在于對適應性設計試驗的計劃、實施、分析和結果解讀提供指導,旨在確認治療的有效性并支持獲益-風險評估。重點聚焦于保障試驗產生可靠且可解讀信息的關鍵原則,以及采用適應性設計時需特殊考慮的要點。本指導原則不涉及具體統計方法的討論。盡管本指導原則主要側重于確證性臨床試驗,但所概述的原則與臨床開發的所有階段相關。
2. 適應性設計的優勢和挑戰
在確證性試驗的計劃階段,即使經過藥物開發早期階段的仔細計劃和實施,在設計方面仍可能存在不確定性,如適當的樣本量。然而,對于非適應性設計,這些方面必須在試驗開始前確定,并且在試驗執行期間不能改變。適應性設計具有靈活性,可通過利用試驗期間試驗參與者的累積數據對設計進行預設的修改來避免不準確的假設。適應性設計的靈活性可帶來多方面的優勢:首先,具有倫理方面的優勢。例如,在成組序貫設計中,若已有充分證據表明治療有效并且具有正向的獲益-風險特征時,可提前終止試驗,從而減少暴露于劣效對照治療的試驗參與者人數。其次,適應性設計可以提高試驗的效率。例如,通過給定預期樣本量提高試驗的把握度。第三,適應性設計有助于提高對療效和決策的理解。例如,在兩階段適應性確證性臨床試驗中,通過期中分析在兩種劑量中選擇更具優勢的劑量,既可降低對最佳獲益-風險劑量選擇的不確定性,同時也能確證所選劑量的有效性。
然而,適應性設計也帶來諸多挑戰,可能會增加與第 3 章節中討論的關鍵原則相關的復雜性和不確定性。例如,采用適應性設計可能會增加對期中分析結果保密的困難度,若處理不當,可能對試驗完整性構成風險,最終導致試驗結果不可靠以及試驗結束時出現試驗結果解讀困難。此外,與未采用適應性設計的試驗相比,適應性設計臨床試驗的合理計劃與評估可能更復雜,并且需要更多的時間。具體而言,在適應性設計臨床試驗中,采用非適應性設計的常規分析方法,往往會導致I類錯誤概率升高及療效估計的偏倚。例如,根據期中分析的療效估計對樣本量進行調整,最終分析時采用常規分析方法,I 類錯誤概率可能會增加一倍以上。再例如,由于試驗會在觀察到極端數據時優先停止,因此提前因療效顯著而停止試驗可能會導致療效估計出現偏倚。因此,通常需要采用考慮適應性設計的特殊分析方法進行假設檢驗和療效估計。此外,一些采用適應性設計的試驗提供的安全性信息可能較少,從而可能導致獲益-風險評估過程中出現更多的不確定性。適應性設計也并非在所有臨床試驗環境中都能獲益。例如,如果試驗參與者入組速度快于適應性調整所依據的終點評估時間,或者無法及時獲取數據以支持期中分析時作出可靠的調整決策,則適應性設計可能不宜采用。
臨床試驗中是否采用特定的適應性設計,需綜合考慮包括上述因素在內的多項條件。后期臨床試驗的確證性質和在試驗進行中對試驗進行調整的建議之間可能存在矛盾。因此,在計劃適應性設計時,必須詳細論證調整試驗的必要性,并評估所涉及調整類型、數量和復雜性的潛在影響。論證內容應包括臨床和統計學方面的考慮。應當權衡設計的優勢,以及擬調整內容可能對試驗結果可靠性和可解讀性帶來的不確定性影響。例如,增加詳細計劃的因有效或無效而提前終止試驗的期中分析,采用預設的合理終止規則,并確保提供足夠信息以支持安全性和獲益-風險評估,同時使用 IDMC 來保持試驗完整性,這樣可以最大限度地減少不確定性。
另一方面,涉及多個試驗要素調整的復雜設計可能會極大增加與保持試驗完整性相關的不確定性。這種不確定性可能包括對信息流和數據訪問規范充分性的存疑,或調整本身對試驗實施及療效可解釋性造成的潛在影響。針對特定患者人群擬定治療劑量的有效性和獲益-風險特征,此類情況可能會給評估結果和監管決策帶來挑戰。擬采用的適應性設計必須提供清晰且具有說服力的論證。該論證應闡述適應性設計是否滿足臨床環境的固有需求,并評估其與替代設計(包括非適應性設計)相比的優勢和局限性,包括比較不同候選設計之間重要的試驗操作特征(比如把握度、預期樣本量、調整決策的可靠性)。
3. 關鍵原則
就本指導原則而言,原則是指試驗設計的特征,對于確保結果的可靠性和可解讀性至關重要。本章節對適應性設計需要特別考慮的原則進行介紹。重點對確證性臨床試驗的適應性設計提供建議。無論采用何種調整類型或統計方法(比如頻率論或貝葉斯方法),都應遵循所有這些原則。
3.1 開發計劃的充分性
臨床試驗需要經過適當的設計、實施和分析,以在整體開發計劃的背景下解決相關臨床研究問題,這一點非常重要。對已完成的探索性試驗進行仔細分析和評估,有助于為后續確證性試驗的目標設定和設計選擇提供依據,并最終生成監管決策所需的數據。完整的開發計劃應關注以下幾個方面:描述劑量反應關系在有益及不利效應方面的特征;確定適當的治療患者人群;選擇具有臨床意義和敏感性的終點;在預期患者人群中可靠地確認療效并支持安全性和獲益-風險評估。在確證性試驗階段,適應性調整的次數和復雜性通常應受到限制。如果為了替代一系列的多項試驗而增加調整次數或提高復雜性,可能會損害試驗對重要臨床問題的回答能力,也會影響通過仔細評估既往結果以最有效地設計進行計劃開發的機會。在計劃進行包含多次適應性調整的確證性試驗之前,申辦者應針對擬調整內容所涉及的問題,討論是否還需開展額外的必要的探索性試驗。
例如,考慮采用一種確證性兩階段適應性臨床試驗設計,通過期中分析在兩種劑量中進行選擇,并確認所選劑量的療效。在進行劑量探索試驗之后,仍不確定兩個候選劑量哪一個最合適的情況下,這種設計可能有助于確定在預期患者人群中具有更好的獲益-風險特征的劑量。但是,如果在開發計劃的早期階段沒有進行適當的劑量探索試驗,則可能無法很好地支持選擇兩種劑量進行確證性試驗,從而增加了開發計劃無法確定出合理劑量的風險。一般而言,適應性設計不應替代適當的劑量探索試驗。通常,在進行確證性試驗以確定療效和評估獲益-風險之前,需預計申辦者已經完成了必要的、以評估更大范圍和更多數量的劑量的試驗。
3.2 試驗計劃的充分性
充分的計劃對所有臨床試驗都很重要,以確保設計是預先規定的,試驗實施和分析是合理的,結果是可靠的和可解釋的。如果確證性臨床試驗計劃采用適應性設計,則通常應限制調整的次數和復雜性,并應提供在藥物開發的這個階段對試驗各方面進行調整的理由。在開始一項適應性設計的試驗之前,除試驗計劃的常規內容外,還需額外明確以下要素并提供充分依據:包括期中分析的次數和時間、適應性調整類型、生成期中分析結果的統計方法、適應性決策的預期規則、與每個估計目標對應的主要分析方法、以及保持試驗完整性的方法。對于計劃在期中分析階段選擇估計目標的適應性設計,例如治療或人群選擇設計(第 4.3 和 4.4 章節),所有候選估計目標均須是完全預設的并與臨床相關。
某些類型的適應性設計可能比其他類型需要更多的計劃。例如,與采用盲態樣本量調整的設計相比,非盲態樣本量調整需要采用額外的方法來保持試驗的完整性。如果模擬對于理解適應性設計的操作特征至關重要,則應仔細計劃、實施和報告模擬研究(第 5.2 章節)。所有與適應性試驗設計計劃相關的細節都應妥善記錄(第 6 章節)。充分的計劃有助于評估各類適應性調整所采用的統計方法是否恰當。例如,I 類錯誤概率的控制要求預先制定早期有效性終止的標準或跨階段合并證據的規則。再例如,若在方案中規定盲態樣本量調整內容以及調整規則,可進一步確保適應性選擇的樣本量不受非盲數據影響。充分的計劃也有助于評估試驗操作特征,并能夠與 IDMC(比如參與適應性調整)進行有根據的討論。申辦者應與 IDMC 詳細討論適應性調整類型和預期的調整規則,以確認其理解和支持。這能夠確保 IDMC 做好在試驗期間審查期中分析結果并做出適應性調整建議的準備,同時保護試驗參與者個體的安全。
對于適應性調整所依據的預期規則必須描述清晰。然而,在期中分析中需要多大程度遵循該預期規則,可能因適應性調整類型和所使用的統計推斷方法的不同而有所差異。通常建議使用既能提供有效的推斷結果,又允許在期中分析時根據整體獲益-風險評估靈活偏離預期調整規則的分析方法。例如,考慮進行一項確證性兩階段適應性臨床試驗,在期中分析時選擇兩種劑量中的一種,以確認所選劑量的療效并支持其獲益107 風險評估。在試驗計劃階段,如果預計不會出現重大安全性問題,則可以制定一項基于有效性的期中劑量選擇的規則。然而,可能會出現期中數據顯示兩種劑量療效相似,但較高劑量存在非預期安全性問題的情況。若采用的統計方法允許在期中分析中靈活納入此類獲益-風險考慮,則預設的計劃應承認偏離規則的可能性,并列出可能導致此類偏離的因素。如果計劃的統計方法要求嚴格遵守期中決策規則以確保推斷的有效性(比如控制 I 類錯誤概率),則應在試驗方案中說明遵守該規則的重要性。
3.3 限制得出錯誤結論的可能性
限制對擬定治療的有效性、安全性和獲益-風險特征得出錯誤結論的可能性非常重要。監管決策的一個基本要素是控制出現假陽性療效結論(即真實無效的治療被認為有效的結論)的可能性。常見的方法是采用頻率學派方法來限制試驗中假陽性療效結論的可能性,此類方法將主要估計目標假設檢驗中的I類錯誤概率控制在預先設定的閾值內(ICH E9)。對于大多數適應性設計,有必要使用特定的方法來控制I類錯誤概率。例如,若試驗設計包含可能因有效性而提前終止的期中分析,則需預先設定合適的終止規則。當適應性設計包含采用多重檢驗方法來控制多個主要和/或次要終點的 I 類錯誤概率時,這些方法還應額外考慮因適應性調整可能導致 I 類錯誤概率增加的可能性。
盡管臨床試驗設計和分析的主要方法基于頻率學派統計方法,但如果其他方法的使用理由明確且所得結論足夠可靠時,也可被采用(ICH E9)。第 5.3 章節描述了在使用貝葉斯學派方法的適應性設計中,限制假陽性療效結論可能性的重要考慮。理解擬采取的適應性設計如何影響其他類型錯誤結論的可能性也很重要。這包括要求試驗需要提供關于安全性、重要的次要療效終點和相關患者亞組的充分信息,以確保能夠進行可靠的獲益-風險評估。例如,當計劃一項可能因有效性結論而提前終止的試驗時,需證明期中分析時的樣本量和隨訪時間能夠充分支持可靠的獲益-風險評估。還包括評估適應性設計對期中分析結論的影響,以及適應性設計可能無法實現試驗目的的風險。例如,申辦者應基于療效和獲益-風險考慮,評估適應性劑量選擇設計在期中分析時從兩個劑量中選擇更優劑量的能力。最后,適應性調整可以影響假陰性療效結論的發生概率(即缺乏證明真實有效治療的證據),因此評估試驗是否具有足夠的檢驗效能非常重要。
3.4 估計的可靠性
在確證性臨床試驗中,需要控制假陽性療效結論的可能性(第 3.3 章節)。此外,對主要有效性終點的療效與其他關鍵有效性和安全性結局進行可靠的估計,對于促進獲益-風險評估和為監管決策提供信息至關重要。因此,適應性設計試驗的主要分析應提供可靠且與估計目標一致的療效估計。申辦者應評估療效估計的偏倚和變異性,包括均方誤差等指標。在偏倚和方差的權衡中,通常期望主要療效估計中偏倚有限或沒有偏倚。主要分析還應支持對不確定性的準確度量的計算,如目標覆蓋概率的置信區間。如果適應性設計試驗在主要分析中采用的估計方法未考慮設計本身的適應性特征,則可能會出現不可靠的療效估計和對不確定性不正確的估計(比如置信區間覆蓋率不正確)。例如,在期中分析時,從多個治療組中選擇估計效應量最大的治療,一般而言,會導致該治療效應的過高估計。即使選擇是基于預期可預測療效的終點而非主要終點本身,這一偏倚依然存在。同理,在存在適應性調整的情況下,次要終點的療效估計也可能存在偏倚。因此,采用適應性設計應評估療效估計的偏倚和變異性,并為其可靠性提供支持。在部分情況下,可以解析計算偏倚和變異性。在其他情況下,必須依賴于模擬進行評估。對于某些設計,應采用已得出的可靠性更高的特定估計方法。以成組序貫設計為例,現有方法可通過調整估計量來減少或消除與早期終止可能相關的偏倚,并提升均方誤差等指標的性能。
除了確保主要分析中療效的可靠估計外,還需保證期中分析的估計結果能夠支持促進可靠的適應性調整決策。例如,在適應性劑量選擇設計中,若過早進行期中分析,可能導致估計結果變異過大,從而選擇較差劑量。因此,申辦者應評估設計的整體操作特征(比如選擇更優劑量的概率),以便慎重確定期中分析的時間節點和調整規則。
3.5 試驗完整性的保持
保持試驗完整性對于確保試驗可靠、符合倫理且及時的達成既定目標非常重要。第 3.3章節和第 3.4章節已對試驗適應性調整對試驗結果的統計有效性可能帶來的影響進行了討論。保持試驗完整性還依賴于試驗的恰當執行以及關于設想的調整對試驗實施的潛在影響進行仔細評估,這是本章節的重點。申辦者、研究者或試驗參與者對個體治療分配、累積數據或某些試驗變更的知曉會以難以預測且無法調整的方式影響期望和行為,從而影響試驗完整性。
對此類信息的知曉可能會對試驗實施造成不易察覺的變化,例如入組試驗參與者的速度和特征、研究治療藥物或其他藥物給藥的具體細節,或終點評估等的變化,這些都可能影響對試驗結果的解讀。例如,研究者和試驗參與者根據正在進行的試驗期間累積的數據了解到治療的估計療效較低甚至呈負向趨勢,可能會將此誤解為治療無效的可靠證據,導致試驗參與者的入組率下降、依從性減弱和脫落率上升,最終導致結果不可靠,并在試驗結束時難以解讀。推薦的方法是使試驗參與者、研究者和申辦者不僅對個體治療分配保持盲態,同時也對累積的匯總數據的分組標簽(使用實際治療或標簽如 A 和 B)保持盲態,此舉有助于最大程度避免此類信息對試驗實施造成有意或無意的干擾。許多類型的適應性設計的一個基本要素是需要獲取一定程度的非盲態期中分析結果。能夠接觸累積的非盲態數據的人員應保持獨立性,即不應存在利益沖突、不參與試驗相關活動,并且應為獨立于申辦者的外部人員。為實現這一要求,當適應性設計需要獲取非盲態期中數據時,應設立 IDMC 來對相關數據進行審核。在確證性試驗中,通常已經預先設立 IDMC 以確保試驗參與者的安全并保護試驗的科學完整性。
此時,IDMC 可承擔額外的職責,即審查期中數據,以對是否實施預先計劃的適應性調整做出建議。若尚未計劃設立 IDMC,也可根據適應性設計的實施組建一個新的 IDMC,其設立目標和成員專業背景應與設計要求相匹配。此外,應制定標準操作程序和保密協議,以限制 IDMC 以外人員訪問非盲態期中分析結果。關于 IDMC 和其他數據監查考慮的更多討論內容,見第 5.1 章節。即使僅知曉試驗中發生了適應性調整這一信息,也可能導致研究者或試驗參與者出現非預期的行為改變,甚至可能泄露非盲態期中分析結果的有關信息。例如,如果實施非盲態樣本量調整,其中修改后的樣本量是期中療效估計量的函數,那么了解調整規則并知道修改后樣本量的人可以推測出期中療效的估計。因此,在確保符合倫理標準(比如提供充分的知情同意書)和操作可行性(比如保障充足的藥品供應)的前提下,應采取相應措施,最大限度減少可被推測的信息內容;有關操作性考慮的進一步討論內容,見第 5.6章節。為降低試驗過程中信息被推測的風險,可以采用特定的調整規則,將期中分析估計值劃分為較大的區間范圍,在同一區間內,無論估計值具體如何,都會觸發相同的調整措施(比如樣本量調整規則中,事先預設了一小部分可供選擇的潛在樣本量水平)。調整規則的細節可以保留在特定文件而非方案中,例如 IDMC章程的機密附錄,該文件僅限獨立于臨床試驗管理和執行團隊的申辦者指定人員查閱。此外,可對申辦者人員、研究者及試驗參與者實施屏蔽,使其不獲知特定的適應性變化。例如,在樣本量調整后,可告知試驗中心目標招募人數尚未達到,或僅告知試驗中心或地區特定的入組目標,而非告知總體樣本量目標。
申辦者應在計劃階段與監管機構討論適應性調整對試驗實施的潛在影響,包括入組試驗參與者的類型,以及試驗結束時對結果的解讀。討論內容還應包括試驗階段的規模是否足以用來評估適應性調整的影響。申辦者應建立保持試驗完整性的方法。應記錄流程以提高對這些方法的依從性并向利益相關者(比如監管機構和研究者)保持透明。為此需開展適當培訓并制定周密計劃,盡可能降低試驗完整性受損風險。由于即使是最嚴格的流程也可能無法完全確保試驗完整性,因此試驗結束時的結果解讀應考慮不同階段試驗結果之間的異質性、適應性設計的性質(比如調整次數、類型以及試驗階段的規模)、現行的流程及試驗期間各類數據和信息的訪問人員和權限,以及期中分析前后任何試驗執行方面的顯著變化(比如入組試驗參與者類型變化)。若發現了非預期的異質性,申辦者應進行討論,因其可能影響對試驗結果的解讀。
上述保持試驗完整性的原則,在開放性試驗中尤為關鍵,因為在該類試驗中,試驗參與者和/或研究者已知曉每例試驗參與者的個體治療分配情況。需要強調的是,盡管這些試驗中個體試驗參與者的治療分配信息已知,確保試驗參與者、研究者及申辦者無法獲取按治療組別累積的匯總數據依然是可行的,也是強烈建議的。
4. 適應性設計類型
本章節將討論常見的適應性設計類型,并重點關注與第 3 章節所述原則相關的具體考慮,同時闡述第 2 章節中概述的適應性設計的一些優勢和挑戰。本章節的討論聚焦于使用頻率學方法進行統計分析的適應性設計,有關使用貝葉斯方法的適應性設計的特殊考慮,請參見第 5.3 章節。
4.1 提前終止試驗
在臨床試驗進行期間,累積的數據可能提示繼續開展試驗已不再合適。為解決這一問題,申辦者可以考慮采用一種包含前瞻性計劃的序貫分析的試驗設計,對累積的非盲態數據進行序貫分析,并按照預設的終止規則,在出現充分的有效性證據時終止試驗(因有效性而終止),或在試驗不太可能證明有效性時終止試驗(因無效性而終止)。這種允許在試驗過程中,基于預設時間點累積的各組試驗參與者數據,通過序貫分析提前因療效而終止試驗的臨床試驗設計,稱為成組序貫設計。
在設計允許因療效而提前終止的試驗時,應為序貫分析設置適當的終止邊界,以控制類錯誤概率。期中分析的時間點及具體的終止規則應基于多個因素進行確定,例如,終止試驗所需的早期結果的說服力、提前終止的概率,以及可能累積的預期和最大樣本量或事件數。可考慮采用允許偏離預設期中分析時間點的方法。這種方法有助于配合 IDMC 在特定日歷時間召開會議,使得期中分析時的實際樣本量可以與預設的目標略有差異。此外,應預設校正期中分析影響的主要療效估計及其置信區間的計算方法,以控制偏倚并提高在均方誤差等指標上的性能(第 3.4 章節)。
因有效性而提前終止的試驗,為安全性、重要次要療效終點及相關患者亞組評估提供的信息較少(比如樣本量較小和/或隨訪期較短),而這些信息對整體獲益-風險評估十分重要。因此,期中分析時點的選擇應考慮樣本量足夠大且隨訪時間足夠長,以確保有充分的信息用于決策。 一般情況下,由于充分的安全性評估需要最低樣本量和/或最短隨訪時間,這會限制期中分析的最早實施時間或是否應該設置期中分析。這通常是一個相關聯的標準,例如,在預防性疫苗試驗中,以及用于非危及生命疾病的長期治療藥物需滿足人群暴露程度的監管要求(ICH E1)時。此外,當存在充分的倫理依據時(比如生存期為主要終點),更常考慮設置具有提前終止可能的期中分析,且有效性終止規則通常要求在療效的估計大小和證據強度兩方面均需具有高度說服力的結果。若符合期中分析終止規則并決定因有效性提前終止試驗,在最終數據庫鎖定之前,試驗可能會繼續收集除納入期中分析之外的試驗參與者數據。這可能是由于數據收集與期中分析之間存在時間差,期間需完成數據裁決和清理工作所致。申辦者應確保這些額外的信息被恰當的記錄,并報告期中分析結果和基于所有可用數據的分析結果,兩種結果對監管決策均具有重要意義。例如,若兩次分析之間的療效估計變化可能會影響獲益-風險評估,則需調查潛在原因,并可能對試驗結果的解釋存在挑戰。
當試驗設計包含無效性終止可能性時,雖然預期的無效規則應該預先設定和論證,但通常建議采用非約束性無效性規則。這意味著無效性終止標準僅作為參考,根據期中分析結果進行偏離時不會增加I類錯誤概率。這種靈活性至關重要,因為是否因無效性而終止或繼續試驗的決策過程通常并非純粹的算法化過程,可能需要考慮除主要有效性終點以外的信息,如安全性或其他療效數據。相比之下,雖然有建議采用約束性無效性規則,并根據預設的無效性標準調整有效性決策標準,但此類方法的弊端在于要求申辦者必須遵守預設的無效性終止標準,否則將無法控制住I類錯誤概率并影響對試驗結果的解讀。
4.2 樣本量調整
即使經過精心策劃和實施的早期開發計劃,影響臨床試驗樣本量計算的參數假設中仍可能存在較大的不確定性。其中一個不確定性的來源是關于干擾參數的假設,這些參數并非主要關注參數,但可能會影響試驗的樣本量。干擾參數的示例包括連續結局的標準差和二分類結局中對照組的發生率,這些參數在某些疾病領域的不同試驗中可能存在巨大差異。當干擾參數存在較大不確定性,且有合理理由的情況下,申辦者可能會考慮根據干擾參數的期中分析估計結果來調整初始樣本量,以確保試驗具有足夠的檢驗效能。參數假設中的另一個不確定性來源是對預期治療效應大小的假設。當有合理依據認為仍存在不確定性(比如經過適當的探索性試驗后;見第 3.1 章節)的情況下,申辦者可能會考慮根據期中分析的療效估計進行樣本量調整。其目的是確保在一系列合理且具有臨床意義的療效范圍內,試驗均能保持足夠的檢驗效能。在設計包含樣本量調整的試驗時,應預先設定和論證潛在樣本量的最小值與最大值、預期的樣本量調整決策規則以及統計分析方法。需注意的是,最小樣本量須仍能夠為獲益-風險評估(比如安全性、次要終點和亞組分析的評估)提供充分依據,這與早期終止試驗時的考慮相一致(第 4.1 章節)。
基于干擾參數估計值進行樣本量調整時應使用盲態數據,該方法不包含試驗分組信息,可最大限度降低破壞試驗完整性的風險。應預先設定預期的樣本量調整規則,以確保調整的樣本量不受非盲態數據的影響。預先設定的規則也有助于評估試驗的操作特征(比如把握度和預期樣本量)。申辦者應提出一種能控制 I 類錯誤概率的檢驗方法并論證該方法的合理性。在某些情況下(比如采用連續終點且有合理樣本量的雙臂優效性試驗),若依據充分,可采用適用于非適應性設計的常規分析方法進行主要分析。在其他情況下(比如采用連續終點的雙臂非劣效性試驗),使用這些常規方法可能會導致 I 類錯誤概率膨脹,此時需采用不同的分析方法。對于基于非盲態數據的期中分析療效估計進行樣本量調整的試驗,應建立 IDMC 和充分的控制措施來保持試驗的完整性,包括最大限度降低從樣本量調整中反推療效信息的措施(第 3.5 章節)。由于此類設計通常會使樣本量有所增加(相對于初始計劃樣本量),故而即使觀察到的療效弱于初始計劃值仍有可能達到統計學顯著性。因此,在計劃此類設計時,需判斷具有臨床意義的療效大小、論證額外試驗參與者暴露的合理性,并確保在該適應性設計下的潛在樣本量從臨床角度來看仍是合理的。
通常建議采用無需嚴格遵循預設調整規則的樣本量調整方法,例如采用基于預先設定的權重加權合并各試驗階段信息的假設檢驗方法。但盡管如此,仍需預先設定預期調整規則,以便評估試驗操作特征(比如預期樣本量和檢驗效能),并確保 IDMC 理解并認同該調整規則。
對于大多數基于期中分析療效估計進行樣本量調整的試驗設計而言,用于非適應性設計的常規檢驗方法并不適用,需要使用特定的統計方法來控制I類錯誤概率。此外,療效大小的常規點估計可能存在偏倚,常規的置信區間也可能無法達到預期的覆蓋率。因此,建議在試驗設計階段進行估計值的可靠性評估。該評估將有助于判斷提出的適應性設計的可接受性,或指導試驗結果的解讀。在某些情況下,可采用調整估計值的方法來減少或消除適應性調整帶來的偏倚,通常此類方法在該情況下更為可取。
4.3 人群選擇
在某些情況下,對于哪些患者應該接受新療法,可能仍然存在不確定性。例如,某種療法可能會使整體人群中的某個目標亞群獲益,而非目標(補充)亞群的獲益可能尚不明確。此類目標亞群可通過人口統計學特征、或假定與治療作用機制相關的基因/病理生理學標志物等來界定。如果治療對目標亞群確實有效,但對補充亞群無效或療效甚微,則在整體人群中進行試驗可能因為統計效能不足而無法確定療效,并且可能使試驗參與者不必要地暴露于對他們無效的治療。反之,如果治療對整體人群均有效,則僅針對目標亞群進行的試驗將無法獲得補充亞群的療效數據,并將導致治療適應癥僅限于可獲益的整體人群中的一個亞群。此類不確定性通常可以通過探索性試驗進行研究。然而,在某些情況下,也可考慮在整體人群中進行確證性試驗,并制定包含目標亞群有效性評價的分析計劃(比如采用多重檢驗方法來控制整體人群和亞群分析中的 I 類錯誤概率)。或者,更高效的可能做法是考慮采用帶有適應性人群調整選項的確證性試驗設計,即可根據非盲態的期中分析結果調整患者人群的試驗設計。試驗可能會在期中分析前從整體人群中招募試驗參與者,在期中分析時將決定是否繼續在整體人群中招募,或者將后續的招募限制在目標亞群中。如果繼續在整體人群中招募,則需要決定在試驗結束時的分析中僅評估整體人群的療效,還是同時評估整體人群和目標亞群的療效。如果后續招募僅限于目標亞群,則試驗結束時的分析將重點關注該亞群的療效。在這種情況下,應適當合并期中分析前后累積的數據,以推斷選定人群的療效。
對此類設計的充分計劃應包括:預先設定在期中分析中可能被選為后續招募目標的候選人群,在期中分析時需做出的關于統計推斷目標人群的決策及其在試驗結束時的分析方式,以及預期的適應性調整規則。還應制定相應計劃,用于管理那些基于期中分析而停止進一步招募和評估的人群中已參與試驗的人群。在根據期中療效估計選擇人群進行后續招募和分析的設計中,通常需要采用特定的統計方法來控制I類錯誤概率。通常建議采用允許靈活偏離預期適應性調整規則的方法,因為在期中分析時綜合考慮所有的可用信息有助于確保人群選擇的適當性。申辦者還應確保期中估計有助于進行可靠的人群選擇,包括在合適的時間點進行期中分析。此外,鑒于此類設計傾向于選擇期中結果更有利的人群,試驗結束時常規的療效估計可能存在偏倚。應評估不同人群中療效估計的可靠性,并考慮采用可減少或消除偏倚的調整后的估計。
值得注意的是,帶有適應性人群調整的試驗必須有合理的科學依據。例如,在整體人群中進行的試驗包括期中分析,且可能將后續的招募和分析集中在特定亞群上,那么這種設計應基于既往試驗結果和/或生物學證據,證明獲益-風險特征在目標亞群中可能表現更優。對于此類試驗,試驗設計還需確保能夠在期中分析后繼續對整體人群進行招募,為可靠的決策提供支持。包括確保試驗能夠提供關于評估補充亞群獲益-風險特征的足夠信息;也包括制定具體標準(包含補充亞群中估計療效的評估標準),以支論證整體人群是否獲益的結論。如果用于定義亞群的基線特征非二分類變量,則應在計劃階段對用于界定亞群的閾值進行合理論證。
4.4 治療選擇
部分試驗旨在評估多種治療方案,這些方案可能涉及不同藥物或同一藥物的不同劑量水平。例如,在藥物開發的探索性階段結束時,某藥物的兩種潛在有效劑量的獲益-風險特征可能仍存在不確定性,此時可在確證性試驗中將這兩種劑量與對照組進行比較,以確認其療效并在試驗結束時選擇最合適的劑量。在這種情況下,可考慮能基于期中分析累積的非盲態數據來進行劑量選擇的試驗設計:試驗參與者最初將被隨機分配到兩個劑量組或對照組;在期中分析時,選擇一種或兩種劑量進入第二階段繼續隨機;最終分析旨在根據兩個階段的數據確認所選劑量的療效并評估其獲益-風險特征。
采用適應性治療選擇設計的臨床試驗應進行充分計劃,包括明確待評估的治療、在期中分析時需作出的決策、以及治療選擇的預期規則,同時包括對隨機化方案和總樣本量的影響。此外,還應制定方案以妥善管理那些正在接受治療的參與者,而這些治療在期中分析后決定停止后續評估。在基于期中療效估計選擇一種(或多種)治療的設計中,需要采用特定的統計方法來控制I類錯誤概率。通常建議使用允許靈活偏離預期調整規則的方法,這種靈活性使得在期中分析時能夠綜合考慮所有可用信息,從而幫助支持更明智、更合理的治療選擇決策。申辦者還應確保期中分析結果能夠支持進行可靠的治療選擇,包括計劃合適的時間點進行期中分析。鑒于此類設計傾向于選擇期中分析結果更優的治療,試驗結束時常規的療效估計可能存在偏倚。因此,應對估計的可靠性進行評估,并考慮采用可減少或消除偏倚的調整后的估計。
4.5 試驗參與者分配調整
在隨機試驗中,通常根據固定的隨機分配概率將試驗參與者分配至各治療組。或者也可以考慮采用其他的適應性分配方案,即根據早期入組試驗參與者的數據動態調整分配。這些方法包括協變量適應性隨機分配,即分配情況取決于累積的基線協變量數據,以及應答適應性隨機分配,即分配情況取決于累積的結局數據。本章節重點討論應答適應性隨機分配(Response-Adaptive Randomization, RAR),即根據先前非盲狀態下結局數據調整隨機分配概率。其核心思想在于,將新試驗參與者以更高概率分配至比當前其他組結局更佳的治療組。
RAR 對試驗參與者的優勢體現在例如減少暴露于療效較差治療的試驗參與者數量,或在二分類療效終點試驗中減少預期的試驗參與者治療失敗事件數。然而,RAR 在確保有效統計推斷方面也帶來諸多挑戰。其中最值得關注的是,順時間趨勢下 RAR 設計容易產生偏倚并導致I類錯誤概率膨脹。例如,如果早期入組試驗參與者比晚期入組試驗參與者更有可能被分配至對照組,且預后較差(比如由于背景治療或試驗參與者特征隨時間變化),則 RAR 設計更有可能出現假陽性療效結論。此外,采用基于療效的算法修改隨機化方案,可能會導致樣本量不足,無法支持對療效較弱但獲益-風險比更優的治療進行決策。
任何采用 RAR 的建議都應解決這些潛在問題。需預先明確具體的 RAR 方法并論證其合理性。應詳細說明能控制I類錯誤概率并提供可靠估計的分析方法。還需解決由于時間趨勢而造成混雜的可能性,這種混雜的程度可能取決于諸如試驗預期持續時間、背景治療或預后因素隨時間變化的可能性(比如在快速演變的傳染病場景中更為常見)。控制 I 類錯誤概率的一種方法是僅允許在單次或少數幾次期中分析時調整隨機分配比例,同時利用基于預設權重的適應性假設檢驗來整合各試驗階段的信息。針對時間趨勢問題也可采用特定方法(比如重隨機化檢驗)來處理,但使用此類檢驗的 RAR 設計可能不如固定隨機化方案的設計強大。
為降低對試驗完整性的風險,應預先制定一種無需申辦者干預即可隨時間推移實現隨機化方案變更的方法。鑒于 RAR 方法和適應性選擇的隨機化比例可能泄露關于期中療效估計的信息,應采取措施最大限度減少從調整中可推斷出的內容(第 3.5 章節)。最后,該方法還可能面臨其他挑戰,例如確保持續及時獲取高質量的期中數據,并將算法集成至隨機化系統中。
此外,還存在某些非隨機化的、確定性的調整,例如在雙臂試驗中,若試驗參與者出現治療應答,則下一例試驗參與者繼續接受相同治療,若無應答則接受替代治療。由于存在較高的偏倚風險以及可能預測后續治療分配的問題,此類確定性調整方法不推薦使用(ICH E9)。
5. 專題討論與注意事項
本章節將擴展探討適應性設計中的其他若干專題,包括數據監查、模擬、貝葉斯方法的應用、至事件發生時間的終點指標、探索性試驗及操作實施等。
5.1 關于數據監查的特別考慮
本章節重點探討在基于累積非盲態數據進行期中分析的適應性設計確證性試驗中,數據監查需特別考慮的事項。對于采用適應性設計的試驗,IDMC 除履行常規職責(即在維護試驗完整性的同時保障試驗參與者個體安全)外,還應具備提出調整建議所需的全部專業能力。IDMC 應至少包含一名在期中監查及相關適應性設計與統計分析方法方面具備專業知識和經驗的統計人員。IDMC 通常有權限獲取非盲態有效性和安全性數據。應在指定的章程中明確操作規范,包括但不限于:擬提交報告的內容與提交頻率、會議日程與后勤保障、保密程序、監查計劃的統計學要求,以及形成建議的具體流程。申辦者需提前與IDMC就以下事項達成共識:試驗目標與設計方案、對IDMC的履職要求(包括超出常規職責的部分)、適應性調整的類型及影響,以及預設的適應性調整規則。應設立一個獨立的統計團隊,負責對累積的非盲態數據進行分析,并為 IDMC 生成期中分析報告。該團隊不得包含監查委員會成員,且不應參與試驗的其他相關工作。當有權限訪問非盲態數據的該統計團隊獨立于申辦者時,最能有效的維護試驗的完整性。組成該團隊的統計人員和程序員應具備實施適應性設計所需分析以及為 IDMC 提供支持的專業能力,并有權限訪問履行其職責所需的全部試驗數據。強烈建議非盲態的期中數據和分析結果僅由獨立統計團隊和 IDMC 掌握,同時需建立完善的保密流程比如標準操作程序和保密協議)。
IDMC 在審查非盲態期中分析結果后,應將調整建議提交給與試驗團隊隔離的申辦者指定人員。在 IDMC 建議提前終止試驗的特定情況下,可向申辦者披露相關充分信息(比如關鍵有效性和安全性結果)以支持其決定是否終止試驗。但通常情況下,試驗方案應設計為:申辦者無需訪問任何非盲態期中分析結果,即可實施 IDMC 關于試驗調整的建議,例如在成組序貫設計中 IDMC 建議繼續試驗,或在樣本量調整設計中確定具體樣本量時。這要求申辦者與 IDMC 在試驗設計階段進行充分討論和計劃,就監查流程和預期調整規則達成共識。
最大限度降低試驗完整性風險的方式是完全限制申辦者訪問非盲態期中分析結果。但在特定情況下,申辦者可能會提出有限訪問非盲態數據。這一點應在試驗計劃階段明確說明,且任何申辦者的訪問申請都需要提供令人信服的依據。若允許申辦者接觸數據,則應制定周密的措施來維護試驗完整性,例如嚴格限制有訪問權限的人數,確保有訪問權限的人員完全獨立于試驗實施人員,并建立完善的保密流程。所有關于“何人接觸何種數據”的信息都應被詳細記錄,以便監管機構在試驗結束后評估適應性調整前后的結果時,能夠確信試驗完整性未受到損害。
5.2 模擬研究的計劃、實施和報告
模擬研究通常在適應性設計的試驗計劃中發揮重要作用。模擬指重復執行大量的假設性臨床試驗,以了解在一系列特定配置的假設(場景)下試驗設計的操作特征。模擬可用于探究擬定適應性設計在不同場景下的操作特征,這些場景包括:基于不同療效和干擾參數假設、存在不同脫落率或入組率、或者當分析方法的分析特性依賴于大樣本量而采用特定樣本量時的情況。例如,在假設無治療獲益的情況下模擬數據時,可通過計算導致得出“治療有效”的錯誤陽性結論的模擬臨床試驗比例,來估計假陽性結論的概率。模擬有助于比較適應性和非適應性設計、不同適應性設計方案以及不同藥物開發計劃的差異(即比較一系列試驗的差異)。模擬還可以為申辦者關于試驗后勤(比如研究中心選擇和藥物供應)的內部決策提供依據。
本節重點介紹模擬的計劃、實施和報告應遵循的原則,這些原則對于理解適應性設計試驗的操作特征至關重要。明確定義并聚焦模擬研究的關鍵目標非常重要。這些目標應具備明確性、相關性,并與模擬研究結果所做出的決策直接相關。為達成目標,需審慎選擇一系列臨床試驗設計和分析方案,其中應包括基準設計和分析方法,即具有易于理解的操作特征的設計,比如非適應性設計或成組序貫設計。該設計范圍可能還包括:期中分析次數與時點的選擇、分階段樣本量設置、適應性調整類型、終止與調整規則以及假設檢驗和參數估計的統計方法等。設計方案的選擇可能是一個隨著操作特征的探索而調整的迭代過程,并且應足夠廣泛,以便對選定的適應性設計進行全面評估。評估模擬研究中所有設計方案的優勢和局限性,對于理解設計選定時的權衡至關重要。
同時,還需定義和評估與模擬研究旨在解決的問題相匹配的關鍵操作特征。這些操作特征通常應包括:I 類錯誤概率、預期樣本量、預期試驗持續時間、把握度、置信區間覆蓋率以及療效估計的偏倚和均方誤差。根據試驗設計和應用場景,可能還需要關注其他操作特征,如期中分析時因無效性或有效性而提前終止試驗的概率。采用貝葉斯方法的適應性設計的操作特征考慮見第 5.3章節。在某些情況下,還需關注單次試驗以外的操作特征,比如選擇合適劑量并隨后確證其療效的概率。雖然匯總模擬試驗(重復)結果的平均值很重要,但評估結果分布的變異性、最小值、最大值或其他方面(比如具有提前終止或樣本量調整可能性的試驗中的樣本量分布)也可能很重要。
模擬研究中包含的場景應涵蓋合理的假設范圍,以確保對擬定適應性設計的性能進行穩健評估。其中包括對療效和干擾參數的假設(比如連續型結局的標準差),以及申辦者可能有更大控制權的操作假設(比如入組率或脫落率)。假設的充分性應基于臨床和統計學考慮進行論證,并需提供支持性文件證明。這些信息可來源于多種渠道,包括既往試驗數據、出版物、外推結果和專家意見等。申辦者應使用所有可獲取的相關信息,并嘗試量化不確定性、識別潛在偏倚。使用假設網格(比如特定范圍內的離散假設集)應基于現有臨床知識進行論證,即證明網格中評估的范圍涵蓋所有可能的合理情況。此外,還需證明(比如基于單調性論證)網格足夠精細(即范圍內包含足夠數量的不同假設),以對相關操作特征進行可靠估計。基于可靠證據且符合臨床認知的信息來源,將使模擬研究結果更具可解釋性和說服力。模擬場景必須全面涵蓋干擾參數配置的合理范圍。例如,在采用模擬來考察I類錯誤概率時,即使在最簡單的試驗設計中,也不可能在符合無治療獲益的每種干擾參數設定下進行模擬。因此,對于依賴模擬來確定 I 類錯誤概率的設計,會存在額外的不確定性。考慮到這種額外的不確定性,預計需要提供更多的論證依據來支持此類設計。應說明模擬研究的實施細節并論證其合理性,包括明確說明數據生成過程。在多數情況下,簡單的統計模型可能適用,例如基于既往試驗獲得均值和方差的正態分布模型。在其他情況下,可以考慮基于早期試驗結果(比如縱向患者特征)進行更復雜的模型擬合。同時,還需確定所需模擬重復次數,以達到關鍵操作特征的估計精度。對于某些操作特征或場景,可能需要達到更高的精度。例如,為達到I類錯誤概率的估計精度,每個情景可能需要進行 10 萬次或更多次重復模擬;而對于把握度等操作特征,較少重復次數即可滿足需求。所有算法均需進行記錄,并采用可復現的方式生成隨機數,如使用已記錄的隨機種子。
最后,必須詳細記錄模擬研究的設計、結果和結論。在進行試驗之前,應在向監管提交的文件中納入一份全面和結構化的模擬報告(第 6.1 章節)。臨床和統計假設與模擬結果之間應有明確的聯系。報告應符合本章節概述的考慮因素,并包含以下內容:
1. 模擬研究旨在解決的關鍵問題。
2. 模擬研究中評估的臨床試驗設計和分析方案。
3. 模擬研究中評估的操作特性的選擇。
4. 現有知識以及任何支持數據或參考資料,為模擬場景的設置提供信息。
5. 用于模擬場景的參數組合配置,以及基于現有知識的臨床論證,證明該組合能充分覆蓋各參數合理的取值范圍。
6. 實施細節,包括數據生成過程和每個場景的重復次數,及其選擇的依據。
7. 用于模擬的軟件包,如果使用定制軟件需提供模擬代碼。提供代碼時,應包含充分的注釋及詳細的代碼執行說明(比如調用示例和起始種子)。
8. 提供總體結果、解讀和結論的摘要。摘要中應詳細討論擬定適應性設計及其在各種情況下的估計操作特征。盡可能以交互式圖表的形式匯總結果以提升可閱讀性。
9. 存在不同調整方案及結論的單次模擬臨床試驗的相關示例說明。例如,在具有樣本量調整的設計中,可能包括在期中分析時采用不同的樣本量調整方案、并獲得陽性或陰性主要分析結果的情況,以便更好地理解潛在期中決策及其對試驗結果的影響。
10. 對限制模擬結果解讀的任何方面的說明(比如假設或外推的不確定性)。
11. 關于模擬結果是否以及在何種程度上解決關鍵問題的臨床討論。仔細記錄模擬研究非常重要,因為模擬和相關結論的有效性將是試驗結束時對結果進行監管審查的一部分。
5.3 采用貝葉斯方法的適應性設計
ICH E9 指出,當采用貝葉斯方法的理由明確且所得結論足夠穩健時,可以考慮在臨床試驗中使用貝葉斯方法。貝葉斯方法是指結合先驗概率分布和當前試驗數據來獲取感興趣的參數(比如療效或估計目標)的后驗概率分布的一系列統計方法。貝葉斯方法可能適用于多種類型的適應性設計。無論采用何種統計方法,都應遵循第 3 章節中概本章節關于適應性設計中貝葉斯方法的應用尚未完全達成共識。廣泛運用貝葉斯方法于監管決策并非在所有情況下都是合理的。如 ICH E9 和本指導原則草案所述,只有當采用貝葉斯方法的理由明確且所得結論足夠穩健時,方可在臨床試驗中考慮使用貝葉斯方法。現就以下方面公開征求意見:貝葉斯方法在哪些情況下符合適應性設計的核心原則,以及在哪些情況下可以考慮使用貝葉斯方法。
上述的原則。貝葉斯方法在臨床試驗適應性設計中的應用形式多樣,各自需考慮的要點也有所不同。貝葉斯方法可用于指導試驗中的適應性調整,同時應確保主要分析的決策標準能實現控制I類錯誤概率。例如,某項試驗可以在期中分析時包含一個有預設的非約束性無效中止試驗規則, 這一規則可基于治療無效的后驗概率或試驗結束時拒絕原假設的預測概率,而試驗的主要療效分析仍采用基于預設顯著性水平下的頻率學假設檢驗。對于此類設計,其操作特征應與不使用貝葉斯方法的適應性設計保持一致的預期表現。申辦者應論證其所設定的先驗分布、決策標準以及適應性設計要素(比如期中分析的次數和時間點以及適應性調整規則)可以實現預期的操作特征(比如效能、預期樣本量、適應性調整決策的可靠性),同時控制 I 類錯誤概率。
一個特殊應用場景是在采用貝葉斯方法的臨床試驗中引入適應性設計要素,通過信息性先驗分布借用外部信息,并基于相關估計目標的后驗分布(比如有效性后驗概率的閾值)設定主要分析的決策標準。借用外部數據輔助推斷時,必須提供充分的科學依據,既要考慮不借用外部數據的替代方法的可行性(比如在不使用外部數據的條件下設計和開展有完全把握度的試驗),又要確保外部數據的相關性和質量。先驗分布設定不當會導致無法控制假陽性結論的概率。確保先驗分布準確反映相關可用信息并解決先驗分布和當前試驗數據之間沖突的潛在問題,會引入使用不借用外部信息的頻率論推斷時所不存在的額外不確定性。
對于此類設計,申辦者應在方案中討論并記錄用于生成先驗分布的外部信息來源、外部信息與試驗設計的相關性(比如人群和伴隨治療是否足夠相似、終點是否相同)、所有潛在相關信息來源的列表,以及為何使用選定的信息來源而丟棄其他潛在相關來源。 臨床專業領域專家的意見對于評估外部信息的相關性至關重要。在考慮外部信息來源時,通常優先考慮隨機對照試驗數據和近期數據。通常要求提供患者層面的數據,因為這些數據有助于在計劃階段對外部信息的相關性進行全面評估,并有助于制定策略,在評估階段解決先驗和當前試驗數據之間的潛在沖突。申辦者應預先說明并論證擬定先驗分布的細節,包括外部數據的借用程度,以及試驗成功的判定標準。該先驗分布與決策標準須確保設計符合第 3.3章節中的原則,包括控制出現假陽性結論的幾率。對于先驗分布的合理性說明,應包括討論先驗分布與試驗數據之間的平衡,并提出應對方案,以降低當前觀察到的數據可能與先驗分布產生沖突的風險。應有足夠數量的當前試驗數據來支持獲益-風險評估。需進行模擬分析,以評估在先驗分布與觀察數據存在沖突的不同情景下,得出錯誤結論(包括假陽性結論)的可能性。在試驗設計階段,還應就以下內容展開討論:最大可借用的數據量,以及實際觀察到的沖突程度與借用強度之間的關系,包括在何種情況下應質疑外部數據的適用性,進而選擇不借用數據。此外,還應計劃進行敏感性分析,以評估試驗結論在使用不同的合理先驗分布設定下的穩健性。評估當前試驗數據在不借用外部信息情形下所得到的結論,也同樣重要。
5.4 以至事件發生時間為終點的適應性設計
對于主要終點為至某一事件發生時間的試驗,還需注意額外的考慮。在此類以至事件發生時間為終點的試驗中,試驗的統計把握度取決于事件數,而非試驗參與者人數。因此,此類試驗在計劃階段計算樣本量時,通常以固定的事件數為目標。此外,試驗參與者的隨訪時間通常不明確指定,這意味著試驗沒有固定的觀察期,所有試驗參與者均隨訪直至發生一定數量的事件。因此,對于以至事件發生時間為終點的適應性設計試驗,期中分析通常按目標事件數而非目標樣本量來計劃。此外,在以至事件發生時間為終點的試驗中,基于期中療效估計進行的樣本量調整可能需要修改最初計劃的事件數。例如,只需等待更長的時間讓事件發生(允許更長的隨訪時間),而保持最初計劃的試驗參與者人數,即可實現比最初計劃更多的事件數目標,或者增加試驗參與者人數,亦或者二種方法兼用。在考慮增加試驗參與者人數相較于增加事件數時,申辦者應確保有足夠的數據可用于獲益-風險評估(比如理解藥物的長期療效以及評估患者人群的相關亞組,包括具有較低的基礎事件風險的亞組人群)。當每個試驗參與者僅參與試驗的一個階段時,適應性設計最為直接。若期中分析前后收集的數據完全獨立,則合并所有信息的統計分析可相對簡單地進行。然而在以至事件發生時間為終點的試驗中,部分試驗參與者可能在某一階段入組且未發生事件,但在后續階段可能貢獻事件數據。在期中分析中,利用已入組但尚未發生事件的試驗參與者的信息(比如關于次要終點的信息)來指導潛在試驗調整將違背獨立性假設,并可能導致 I 類錯誤概率升高(即使采用適應性檢驗統計量亦如此)。因此,制定具有控制I類錯誤概率統計方法的計劃很重要。一種方案是完全預先設定一個僅基于主要終點的調整規則,并且不允許有任何偏離。另一種方案是采用特殊方法,即根據期中分析前后入組試驗參與者劃分試驗階段,并預先設定各階段的固定隨訪時間或固定事件數。或者申辦者可考慮采用設定更大目標事件數并包含期中分析時提前終止試驗的設計,而非調整事件數。類似的概念問題及相應的考慮同樣適用于縱向結局的適應性設計。這是因為,在期中分析時,若使用尚未完成所有隨訪的試驗參與者的替代終點或中間結局信息會增加 I 類錯誤概率,除非采用適當的分析方法。
5.5 探索性試驗的適應性設計
本指導原則重點介紹適應性設計在確證性臨床試驗中的應用。如果一項試驗旨在確認有效性并支持獲益-風險評估,那么遵循第 3 章節中的原則就至關重要。適應性設計也可用于藥物開發早期的探索性試驗,旨在獲得治療使用的廣泛信息(比如劑量、用藥方案、人群、終點的選擇)。這一階段的試驗可能包含大量調整,以生成支持后續開發階段重要決策的信息。本指導原則中所述原則也適用于早期探索性試驗階段,以確保試驗結果的可靠性和可解釋性,并支持基于此類試驗的后續決策。由于探索性試驗的結果通常需要通過一項或多項單獨試驗進行獨立驗證,因此可能需要進行額外考慮。例如,方案可能只需闡明試驗調整的一般原則即可,而無需詳細規定具體的調整規則。比如在劑量遞增試驗中,需結合其他新出現的信息(比如不符合劑量限制性毒性標準的毒性反應信息)來綜合考慮基于模型的劑量推薦。此外,采用適應性設計的探索性試驗能夠為其預期支持的決策提供可靠的信息,這一點非常關鍵。例如,為確證性試驗中待研究的目標劑量的決策提供有力依據至關重要,因為得出的不恰當結論可能會對后續的開發計劃產生嚴重的影響。在采用適應性設計的探索性試驗中,保持試驗完整性同樣重要,但申辦者在期中決策過程中的作用可能需要額外的考慮。例如,對適應性劑量探索試驗進行監查,旨在為后續確證性試驗確定合適劑量,可能需要做出多方面的調整決策,而這些決策需要來自申辦者內部各學科領域的深度參與。申辦者隨后應當考慮試驗擬解決的問題及其在開發計劃中的定位,以及申辦者參與監查過程與限制接觸非盲結果以保持試驗完整性之間的權衡。任何監查計劃都應確保能夠保護試驗參與者的安全。
5.6 操作性考慮
適應性設計的應用可能會給臨床試驗的操作執行帶來挑戰,這些挑戰應在試驗計劃階段予以解決。例如,應采取措施最大限度減少可從期中分析中推斷的信息,以保持試驗完整性(第 3.5 章節)。再例如,知情同意書應說明試驗中進行適應性變更的可能性。試驗參與者應了解此類變更的原因(比如在期中分析時從多種劑量中選擇具有最佳獲益-風險特征的劑量),明白這些變更反映了對研究治療的認知提升,并且其權益與安全仍受保障。此外,適應性設計試驗所需的基礎設施,如數據管理系統,可能不同于非適應性設計試驗。適應性設計臨床試驗通常使用交互式語音或網絡隨機化系統來管理隨機化,將試驗參與者分配至治療組。此類系統應與臨床試驗操作流程及藥品供應鏈機制充分整合。系統應內置預先設定的算法,以確保能夠在最少申辦者投入的情況下處理可預見的情況(比如治療組或隨機化比例的變更)。此外,對樣本量、治療組或試驗參與者分配的調整可能會帶來藥物供應方面的挑戰。其中一項挑戰是藥品生產周期,因為快速調整可能會給藥品供應鏈帶來壓力,如果無法及時獲得充足的藥品供應,則會導致試驗參與者的治療延誤。當一項適應性設計臨床試驗跨越多個國家甚至區域時,這些挑戰可能會更加嚴峻,因為需要將藥品及時分發到這些地區。模擬可能有助于支持試驗計劃和執行階段與供應有關的決策。最后,應在計劃階段建立流程,以確保相關期中數據能夠得到適當驗證和及時清理,為調整決策提供高質量的期中數據支持。這可能包括要求正式的期中數據庫鎖定,以確保完成數據驗證和清理活動。
6. 文檔管理
6.1 適應性設計確證性試驗開展前的文檔記錄
文檔記錄是確證性試驗充分計劃的關鍵環節,有助于對擬定的適應性設計進行嚴格評估。除臨床試驗方案或其他文件中通常包含的信息外,在適當的情況下,文檔記錄還應包括以下內容:
1. 擬定的適應性設計的理論依據:該理論依據應同時包含臨床與統計學考慮,論證在確證性試驗中采用適應設計的合理性,以及擬定的試驗設計在臨床開發計劃中的充分性。討論與替代設計(包括非適應性設計)相比的優勢和局限性,將有助于監管機構評估擬定的適應性要素帶來的額外不確定性的可接受程度。
2. 擬進行的適應性調整的描述:應包括試驗中可能調整的各個方面、期中分析的次數和時間點,以及預期的調整決策規則(比如在樣本量調整設計中,需說明根據期中療效估計確定目標樣本量的公式,包括潛在樣本量的最小值和最大值)。如果涉及在期中分析時選擇估計目標(比如通過治療或人群選擇),則應對所有候選估計目標進行精確定義。
3. 統計分析方法的描述:應包括生成期中分析結果和指導調整決策的方法、主要和次要分析的統計方法(比如用于假設檢驗、估計療效及相應不確定性)、以及重要的敏感性和補充分析。
4. 適應性設計實施的描述:應包括期中分析的執行人;審閱期中分析結果和提出調整建議和/或決策的負責人;相關委員會的成員、角色、職責和操作內容。
5. 保持期中分析結果的保密性和試驗完整性的措施描述,以及操作執行的其他細節:應包括信息傳輸和訪問流程;有權訪問非盲態期中分析結果的人員;非盲態期中分析結果的訪問控制;做出調整決策后發布信息的類型,信息發布人以及信息接受人;關于信息訪問和發布的記錄的保存位置。
6. 適應性設計重要操作特征的描述:如果模擬對于理解操作特征至關重要,則應包括一份描述模擬研究目的、設計、實施和結果的報告(第 5.2 章節)。根據不同國家和地區的監管要求及慣例,這些信息應在試驗開始前記錄并將其納入提交給監管的文件中。方案應涵蓋試驗設計所有的核心要素,包括:試驗目的和相應的估計目標,以及試驗設計、實施和統計分析的主要特征(包括所有適應性設計要素及其理論依據)。部分信息(比如 IDMC 操作和數據訪問過程的詳細信息)可記錄在單獨的文件中,如 IDMC 章程。在某些情況下,預設調整規則的詳細信息應記錄在具有訪問限制的特定文件(而非方案)中,以保持試驗完整性(第 3.5 章節)。
6.2 適應性設計確證性試驗完成后在上市申請中應包含的文檔
基于適應性設計確證性臨床試驗進行上市申請,應包括充足的文檔,以便對試驗結果進行全面審查。除了常規內容外,上市申請還應包括:
1. 第 6.1 章節中所述的所有前瞻性計劃。
2. 適應性設計的實施信息,包括:期中分析的實際次數和時間、試驗實施方面(比如基線特征、入組率、依從性、試驗參與者保持率)在期中分析前后的顯著變化評估、用于作出調整決策的期中分析結果、試驗不同階段間結果的任何顯著異質性、實際作出的調整決策、預設的調整規則的遵循情況以及申辦者揭盲日期。如果實際執行與預設計劃存在任何偏離(比如期中分析的次數或時間方面,或預設調整規則的遵循方面),則應對以下內容進行分析討論:偏離原因、采取的任何以最大限度減少對試驗完整性影響的措施、對試驗結果解讀的其他潛在影響。
3. 關于數據訪問計劃流程的遵守和保持試驗完整性的所有信息,比如:任何審計結果,任何已知流程偏離的報告及其對潛在影響的討論。
4. IDMC 的審議記錄(比如所有閉門和開放的 IDMC 會議記錄),包括任何與調整決策相關的討論記錄。
5. 對適應性設計進行恰當分析的結果報告(比如經適當調整后的估計量、置信區間和P值)。
來源:CDE
原文下載:【中文】E20指導原則(草案).pdf