条文本

下载PDF

原始研究
关键设计注意事项比较端点在肌萎缩性脊髓侧索硬化症临床试验
  1. 鲁本P范Eijk1,2,
  2. 达沃Nikolakopoulos2,
  3. 装备C B鹿2,
  4. Bas M Middelkoop1,
  5. 托比一个弗格森3,
  6. Pamela J肖4,
  7. P奈杰尔•李5,
  8. Ammar Al-Chalabi6,
  9. 卢斯·J C Eijkemans2,
  10. 伦纳德H van den Berg1
  1. 1神经学部门首页,大脑中心鲁道夫·马格纳斯乌得勒支大学医学中心,乌特勒支、荷兰
  2. 2生物统计学和研究支持,朱利叶斯健康科学中心和初级保健,乌特勒支、荷兰
  3. 3神经学研究和早期临床发展的部首页门,生原体公司,剑桥,麻萨诸塞州美国
  4. 4谢菲尔德转化神经科学研究所,谢菲尔德大学,谢菲尔德、英国
  5. 5临床神经科学部门,特拉福德中心生物医学研究,布莱顿和苏塞克斯医学院,布赖顿、英国
  6. 6基础和临床神经科学,莫里斯·沃尔临床神经科学研究所、伦敦国王学院,伦敦、英国
  1. 对应到范Eijk鲁本P博士,神经学,联电乌特勒支大脑中枢鲁道夫·马格纳斯乌特勒支首页3584 CG,荷兰;R.P.A.vanEijk-2在{}umcutrecht.nl

文摘

背景资金和资源低普遍的神经退行性疾病如肌萎缩性脊髓侧索硬化症(ALS)是有限的,和优化使用有效药物开发是至关重要的。在这项研究中,我们审查的设计假设关键肌萎缩性侧索硬化症临床试验比较端点和为将来的实验提供优化设置。

方法我们提取的设计设置来自13个安慰剂对照试验完成。使用参数生存模型最优假设估计个别参与者的数据(n = 4991)。设计比较的样本大小,试验持续时间、药物使用和成本。

结果先前的试验故障率高估了18.9% (95% CI 3.4%至34.5%,p = 0.021)。将人力资源中位数是0.56(范围0.33 - -0.66)。此外,我们发现随着时间的推移越来越平均故障率(威布尔形状参数为2.03,95%可信区间1.93到2.15,p < 0.001),而影响未来临床试验的设计和规划。将权责发生制时间和假设越来越故障率在设计阶段样本量减少了33.2% (95% CI 27.9 - 39.4),试验持续时间17.4% (95% CI 11.6 - 23.3),药物使用14.3% (95% CI 9.6 - 19.0)和后续成本降低21.2% (95% CI 15.6 - 26.8)。

结论实现分布知识,将权责发生制在设计阶段能够实现巨大收益在肌萎缩性侧索硬化症临床试验的效率比较端点。我们提供了一个开源平台,帮助调查人员更准确的样本大小的计算和优化利用可用资源。

  • 比较端点
  • 参数化生存
  • 试验设计
  • 肌萎缩性脊髓侧索硬化症

这是一个开放的分布式条依照创作共用署名非商业性(4.0 CC通过数控)许可证,允许别人分发,混音,适应,建立这个工作非商业化,和许可他们的衍生产品在不同的协议,提供了最初的工作是正确地引用,给出合适的信用,任何更改表示,非商业使用。看到的:http://creativecommons.org/licenses/by-nc/4.0/

来自Altmetric.com的统计

请求的权限

如果你想重用任何或所有本文的请使用下面的链接,这将带你到版权税计算中心的RightsLink服务。你将能够获得快速的价格和即时允许重用内容在许多不同的方式。

介绍

患者的广泛的临床异质性低普遍的神经退行性疾病,如肌萎缩性脊髓侧索硬化症(ALS),复杂的临床试验的设计。1 - 3疾病异质性膨胀端点和可变性,随后,患者的数量证明治疗效果。1 3此外,这些疾病的治疗效果不太可能大,迫使调查人员寻找微妙的证明效力。4相对较大的样本大小,因此,需要一种罕见的疾病,强调优化临床试验设计的重要性。

ALS的特点是运动神经元丧失严重,导致肌肉无力,最终因呼吸衰竭3 - 5年内死亡。5个6ALS患者的预期寿命显著降低,生存时间是首选的结果评估关键肌萎缩性侧索硬化症的治疗疗效的临床试验。7号到9号虽然生存时间可能会受到干预,如胃造口术或早期呼吸支持和可能不是最佳的检测信号的有效性,1显示治疗受益的预期寿命无疑增加了药物的治疗潜力。相比之下,治疗好处完全基于端点评估物理功能(如药物不良反应),10也可以被视为边际保证药物批准或停止试用期间临时分析。11 - 14号将生存时间与其他端点(例如,日常功能,肌肉力量或肺功能)可以大大提高临床试验的效率。15测量在肌萎缩性侧索硬化症临床试验是生存时间,因此,不可或缺的比较和优化试验设计端点(即生存时间)可以提高整体效率的关键肌萎缩性侧索硬化症的临床试验。

试验设计比较端点,特别是样本量的计算,是,然而,复杂,取决于一系列假设。例如,事件的数量(如死亡)在后续决定,除此之外,故障率,权责发生制率、辍学率和预期的治疗效果。16日至18日每一个变量都有自己的固有的假设,mis-specification单变量可能产生负面影响的统计力量或不必要地暴露病人劣质的治疗方法。17

事实证明很难定义以证据为基础的指导ALS试验设计,驱动电流关键ALS试验使用任意的和简化的假设。在这项研究中,我们评估ALS的基本组件试验设计比较端点和为将来的实验提供优化设置。然后我们介绍开放获取,基于网络平台,协助调查人员实施和规范优化肌萎缩性侧索硬化症临床试验方法;一个框架,可以很容易地扩展到其他字段比较端点。

方法

三步方法被用来开发一个框架,肌萎缩性侧索硬化症临床试验与比较端点。首先,我们搜查了肌萎缩性侧索硬化症临床试验的文学创作历史列表的假设。然后我们获得个人试验参与者数据(1)获得真实的估计和(2)评估历史设计设置。最后,我们通过仿真验证设计和样本大小的计算并将结果合并在一个网络平台。

文献检索和数据提取

系统性的文献搜索和选择的研究已经详细描述。19简而言之,所有的安慰剂对照试验评估单个制药剂的功效,发表在《2000 - 2018年期间,生存(有限公司)主要端点,参加本研究。从每个试验中,我们提取的样本大小,权责发生制时间(日期最后登记病人-日期第一个登记病人),最低随访期间,预测中安慰剂对照组的患者的生存概率,提出治疗效果(即人力资源),α(错误)、电力(1 - II型错误)和一个事件的定义。一块数字变换器被用来提取kaplan meier发表的观察生存概率曲线。

个人参与者的数据

集中资源开放获取肌萎缩性侧索硬化症临床试验(行动)数据库(2015年12月版)被用作主数据库获取真实的估计与ALS患者的生存模式。20.行动包含10 731人来自23个试验数据表现在过去的20年里,IRB-approved并使用完全匿名数据。病人提供他们在个人同意参加试验。对于每一个单独行动,我们重建他们的人口,后续和生存数据;如果没有生存资料,病人被审查后,他们已知的最后后续访问。我们排除了参与者没有任何后续的时间。最终数据集包含完整生存来自3497名患者的数据。为了验证生存模式,四个外部数据集没有行动的一部分,包括从以下试验:肌酸(n = 175),21丙戊酸(n = 163),22LiCALS (n = 214)23和授权(n = 942)。24

措施的效果

为了评估不同的设计设置如何影响审判效率,我们定义效率的四个措施:(1)样本大小,(2)试验持续时间,(3)药物使用和(4)后续成本。试验持续时间被定义为权责发生制周期和最低的和后续的持续时间(即去年随访日期-日期报名第一个病人)。药物的使用被定义为后续的总和时间(天)治疗手臂。每个病人的后续成本计算基于以下假设场景:筛查和启动费用1500美元;每月的访问(例如,问卷调查和安全实验室)250美元;两月一次的访问(例如,额外的肌肉和肺功能测试)750美元,一年两次的访问(例如,额外的访问神经学家)1000美元。作为一个例子:一个病人随访10.3个月将有一个筛选会话,两个一年两次的访问(M0和M6),四个两月一次的访问(M2、M4 M8和M10)和5月访问(M1、M3、M5 M7和M9),导致总成本为7750美元。

统计分析

对于所有生存分析中,我们使用一个双边生存率较比较kaplan meier积极治疗组和安慰剂组的曲线。事件驱动的数量统计生存率较的力量,因此,主要估计样本容量的计算。随访期间发生的事件数量取决于不同的变量;主要的决定因素是风险率,总随访时间和样本大小。故障率是决定性的设计设置严重影响样本量的计算。对于生存的端点,事件是死亡,故障率可以被解释为瞬时的死亡风险。

为了获得洞察潜在的风险在肌萎缩性侧索硬化症的临床试验,我们使用在威布尔分布参数生存模型。威布尔分布允许时变风险率(如死亡的风险是不同的从最后审判的),而随时间指数分布假设一个恒定的故障率。指数分布是一个特例的威布尔分布的形状参数设置为1(表示没有乘法效应的时间风险率)。重要的是,这两个发行版实现比例风险假设的生存率较。

我们的第一个目标是评估是否ALS生存模式是最好的模仿是一个常数(即指数)或增加(即威布尔)故障率。似然比检验是用来比较一个指数(威布尔型1)最好的拟合威布尔模型(威布尔型≠1)。模型安装在每个单独试验数据集。随后,我们汇集了对数转换威布尔型参数使用固定效应分析。19在所有的试验中有一个治疗的效果,因此我们没有区分积极或安慰剂治疗的患者。然而,我们执行一个灵敏度分析只使用每个队列的安慰剂武器来评估我们的结果的一致性。

我们的第二个目标是评估假设一个常数(威布尔型= 1)或增加(威布尔形状≠1)故障率在设计阶段影响样本量的计算。所需数量的事件检测给定的效果(即人力资源)估计Schoenfeld提供的公式和弗里德曼。25日26日一个事件的概率为一个常数故障率计算使用框架中描述亚伯;17我们使用一个修改的框架,允许加速风险率。27所有样本大小计算假设1:1随机比例,统一权责发生制时期(即恒定的招聘率)和任何loss-to-follow-up死亡或行政审查。验证样本大小的估计,我们模拟临床试验生存数据基于指数分布和威布尔分布,如前所述。14日15所有统计分析和模拟在R程序包闪亮的(V.1.1.0,常,2018);可以在源文档http://reactive.tricals.org

结果

总的来说,我们认为14试验与死亡率(合作)主要终点;一个试验排除是由于不完整的报告(维生素E, 2005)。28试验在预测风险率差异很大,生存的定义,后续的持续时间和提出治疗效果(表1)。平均预期治疗效果(人力资源)为0.56(范围0.33 - -0.66)。所有试验假设一个常数(即指数)故障率、平均为3.0(范围0.9 - -5.1)每100 person-months事件,提出生存概率58%的安慰剂(范围40% - -85%)后18个月。平均绝对差的生存概率被低估了5.8% (95% CI 1.0%到10.6%),导致平均高估的风险率为18.9%(95%可信区间3.4%至34.5%,p = 0.021)。五个试验(38.5%)高估风险率25%以上。只有两个试验(2014年头孢曲松和吡格列酮2012)被认为是权责发生制时期确定样本容量。29 30

表1

安慰剂对照试验的设计特点和假设ALS与死亡率的端点

风险利率在肌萎缩性侧索硬化症的临床试验

使用临床试验数据从五个独立组(n = 4991),我们评估的假设一个恒定的故障率在肌萎缩性侧索硬化症(图1)。在所有军团,我们发现的证据越来越意味着故障率随时间(混合威布尔形状参数为2.03,95%可信区间1.93到2.15,p < 0.001,科克伦问测试p = 0.12)。这个结果是相似的在分析只分配给病人安慰剂(2.22,95%可信区间2.05到2.40,p < 0.001)。例如,平均故障率在行动月0 - 3是0.3每100 person-months死亡,增加到2.7每100 person-months月15日死亡。这一发现具有重要影响的事件:100年假想试验患者中,有80%存活12个月后,恒定速率预测11日20日和28例死亡6后,12至18个月,而越来越故障率(威布尔型参数2)预计5日分别20到39人死亡。虽然事件的数量在12个月是一样的,之前和之后的这个时间点,持续风险事件概率假设严重高估和低估了。

图1

在肌萎缩性侧索硬化症临床试验常数与风险增加利率。两个模型都配备一个指数或威布尔分布。指数模型假定一个常数故障率随时间(或威布尔型参数p1)。在每一个群体,我们确定是否威布尔型参数p不同于1。结果在群集中在一个固定的影响分析(右下面板)。肌萎缩性侧索硬化症,肌萎缩性脊髓侧索硬化症;行动,集中资源开放获取肌萎缩性侧索硬化症临床试验;VPA,丙戊酸的研究;授权,dexpramipexole研究的缩写;LiCALS,英国锂研究的首字母缩写。

明智地花时间:权责发生制的重要性

大多数ALS试验后患者为一个固定的时间段。然而,当病人不是同时登记,实际试验持续时间(从开始到最后的随访)随访时间加上利息(即报名)。我们为15赋予患者说明这个过程图2一个。一个选择可能是延长对那些病人随访登记第一,直到最后一个病人已完成后续(即变量跟踪,图2 b)。因此,病人仍然再试验中,产生更多的事件,因此,可以减少所需的样本。重要的是,在设置总试验时间是相同的。在图2 c,我们表明,假设一个恒定的故障率,在授权使用12个月观察到生存,严重高估了生存延长随访期间和低估了事件的总数在整个试验(图2 d)。

图2

试验持续时间、权责发生制,在授权的事件数量。(一)古典与固定的后续试验设计(12个月)15赋予患者。病人不是所有招募的同时,总试验时间后续和权责发生制时期的总和。(B)延长随访直到最后登记病人完成了12个月的随访增加事件的数量和增加力量。(C)在授权使用12个月观察到生存,一个常数(指数)假设低估生存之前12个月,随后高估了生存。(D)的基础上,赋予数据(n = 942),我们决定为每个时间点下的预期的事件数量指数和威布尔模型。黑色的十字架是观察到的事件。

对历史的影响试验的设计

最后,我们评估增加危害和权责发生制如何影响ALS试验样本容量而言,试验持续时间、成本和药物曝光时间。我们重新设计每一个试验表1根据观察到的利息期和原来的假设下(1)常数和增加风险率和(2),没有权责发生制;权力,α和固定的治疗效果。结果给出了图3。当利息不是合并,常数和增长率提供相同的样本大小。然而,当假设真正的生存模式正在加速(图1),持续风险假设低估药物产品使用11.1%(意思是4.7%;95%可信区间3.1到6.3,p < 0.001)和后续成本高达10.5%(意思是4.8%;95%可信区间3.3到6.3,p < 0.001)。将权责发生制时间和假设越来越故障率在设计阶段减少样本量,平均33.2%(95%可信区间27.9到39.4,p < 0.001),试验持续时间17.4%(95%可信区间11.6到23.3,p < 0.001),药物使用14.3% (95% CI 9.6 - 19.0, p < 0.001)和后续成本21.2% (95% CI 15.6 - 26.8, p < 0.001)而经典的设计(常数危险率没有利息)。

图3

权责发生制和增加危害对历史的影响试验的设计。为每个审判中指定表1根据观察,我们重新评估了样本容量权责发生制时期和原始设计的假设(x设在)。我们提供在左列柱形图表估计样本容量,总试验时间、产品使用和后续成本和正确的列柱形图表各自相对增加而经典的试验设计(即恒定的故障率,没有将权责发生制)。我们使用的公式Schoenfeld确定事件的数量。加速试验设计(即增加)危害是基于威布尔型2。

未来试验的实现工具

为了提高增加利率风险和收益的实现未来试验设计试验,我们开发了一个开放的平台比较样本大小计算的基础上,提出方法(TRICALS -反应性;http://reactive.tricals.org)。平台提供估计的生存模式,加速率和样本大小。估计是基于行动的数据库。在线补充eTable 1提供了一个平台的性能比较与经典方法相比(修改为允许威布尔分布)。27如前所述,17弗里德曼有点保守,而Schoenfeld更自由。平台执行类似Schoenfeld和匹配目标的力量。

讨论

在这项研究中,我们评估关键假设基础比较设计肌萎缩性侧索硬化症的临床试验。我们发现一致的证据增加风险率随着时间的推移,这具有重要影响的设计和规划未来的临床试验。此外,我们的结果显示一个明确的效率获得利息期时纳入设计:延长随访期间学员入校早期试验中大大减少了样本大小和,因此,成本。作为罕见的神经系统疾病的资金和资源是有限的,优化其使用有效药物开发是至关重要的。为了协调的实现我们的结果,我们开发了一个开源的、数据驱动的在线平台,降低mis-specification的风险和促进样本量计算增加的危险。这个平台可以扩展和应用在其他疾病比较端点。

需要样本大小的计算是基于伦理必须减少暴露于有害的实验或劣质治疗的患者数量,31日然而登记病人需要的数量足以避免低于展示效果,或者更糟,产生错误的结论。样本大小的计算,因此,平衡,不准确的估计可以不必要把病人放在风险或导致大量浪费资源。样本大小的计算要求调查员做几个假设,这是众所周知的任意mis-specification的风险高。32 33我们的研究结果揭示了系统mis-specification肌萎缩性侧索硬化症临床试验中18.9%的故障率过高。此外,我们发现,尽管试验是基于相同的主要终点,试验的事件的定义千差万别,效果,后续持续时间和生存概率。这种可变性影响样本量的估计和凸显了目前缺乏指导ALS的试验设计。19提高试验设计的标准化可以提高试验结果的解释,便于cross-trial比较和潜在的协调试验结果的报告。34我们开发框架提供了与数据驱动的假设,一个平台的开发和实现未来的肌萎缩性侧索硬化症临床试验指南。

系统mis-specification在肌萎缩性侧索硬化症临床试验部分的结果错误地假设一个常数在后续故障率。试验参与者是一个选择的族群,19个35从哪个far-progressed最后阶段的ALS患者被排除在外。因此,事件的概率在审判是最初低,随着时间的增加。这种加速因子被确认在我们的荟萃分析(图1)。这对样本量的计算有着重要的影响和成本估算和里程碑的计划。吡格列酮试验,例如,一个临时计划分析后50%的所需数量的事件。假设一个恒定的危害,临时分析计划后12.3个月。12个月后,然而,作者报道事件的数量出乎意料地所需的低(~ 38%)和临时分析被遗弃。30.如果试验曾以为越来越危险(如威布尔型2),临时分析进行的4.5个月后16.7个月。14当时,作者可能会达到50%的目标,可能已经停止了徒劳的审判之前的原因,可能减少资源的损失。

ALS的效率试验与比较端点可以进一步提高了包括权责发生制在设计阶段。然而,early-enrolled试验中参与者仍将大量的时间,这可能会增加辍学率。长期随访期间ALS的可行性已被证明之前的头孢曲松钠试验,29日最近,通过与methylcobalamin审判,36在一些患者参与了4年。注册中心数据从大型纵向以人群为基础的群组可以另外提供洞察跟踪模式,因为患者通常监控从诊断到死亡。此外,延长后续可以改善审判的generalisability ALS患者可能需要长期治疗。然而,将权责发生制在设计阶段需要精确的先验假设,这进一步强调的必要性(在线)工具如这里介绍。我们的研究没有评估ALS的权责发生制和辍学模式试验,为权责发生制,辍学率,将独立的模型可能会进一步优化设计和规划。作为一种替代方法,试验可能继续运行直到到达所需数量的事件。这将使试验持续时间(从第一次报名最后的随访中)不确定,但防止效率的损失由于不准确的权责发生制的假设,辍学和/或风险率。

最后需要注意的一点是,在临床试验中生存模式可能会影响到合格标准,护理或基础设施或地理差异,可能影响样本大小。19为了说明这一点,如果我们在工具使用默认设置,估计样本容量是412例。在选择患者60到70岁,症状持续时间12 - 18个月和% 60% - -90%的预测肺功能,减少了样本容量为258。在这种情况下,样本大小的差异主要是由于不同的死亡率(即18月生存的71.2%和49.7%,分别)。此外,生存模式在今后的试验中可能改变由于改进诊断策略或联合疗法的使用。虽然我们目前的工具有能力学习合格标准对样本大小的影响,更详细的数据(例如,基因型或prediction-based信息)可能需要适应未来所有的设置。此外,类似的造型技术的发展等其他功效端点ALS功能评定量表或联合建模框架可能会进一步优化临床试验的设计。37

总之,稀有资源无法治愈的疾病如ALS是有限的,并优化其使用增加药物开发的效率是至关重要的。大减少样本大小、持续时间和成本的肌萎缩性侧索硬化症临床试验比较端点可以通过实现参量的模型,结合先验知识的生存模式和将权责发生制在设计阶段。我们提供了一个开源平台,帮助调查人员更准确的样本大小的计算和优化利用可用资源。

引用

脚注

  • 贡献者RPAvE, SN:研究概念、设计、分析、解释数据并起草的手稿。KCBR MJCE:研究概念、设计、分析和解释数据。BMM:设计和关键知识内容的修订手稿。睡衣,TAF PNL AA-C:采集的数据,重要的知识内容的修订手稿。LHvdB:学习监督重要的知识内容的修订手稿。

  • 资金这项研究是由荷兰ALS基金会(项目TRICALS-Reactive)。

  • 相互竞争的利益没有宣布。

  • 病人同意出版不是必需的。

  • 出处和同行评议不是委托;外部同行评议。

  • 数据可用性声明数据在公共、开放访问存储库。所有数据都包含在相关研究文章或作为补充信息上传。

相关的文章

  • 社论评论
    迈克尔泼