发展Rasch-Built肌萎缩性脊髓侧索硬化症损害多畴的规模来衡量在ALS疾病进展
做出评论
看到评论
文摘
背景和目标当前尺度用于肌萎缩性脊髓侧索硬化症(ALS)试图总结不同的功能域或“维度”1的总体成绩,可能不能准确地描述个体患者的疾病严重程度和预后。总分的使用风险声明治疗无效如果不是所有维度ALS疾病进展同样的影响。我们旨在开发ALS障碍多畴的规模(目标),全面描述疾病进展和增加的可能性识别有效的治疗方法。
方法修订的ALS功能评定量表(ALSFRS-R)和初步的问卷调查,基于文献综述和病人输入,完成在线从荷兰ALS患者注册中心每隔两月一次的在一段时间内的12个月。拉希两周两次试验法的因素分析,分析,和信噪比进行了优化策略来创建一个多畴的规模。可靠性、纵向下降和对生存进行评估。所需的样本量检测进展率减少35% / 6或12个月评估临床试验,定义了ALSFRS-R或目标分量表作为主要终点的家庭。
结果初步的调查问卷,包括110个问题,被367名患者完成了。三个一维的分量表,和多畴的规模是由7球,11个马达,和5呼吸问题。分量表实现拉希模型需求,与优秀的0.91 - -0.94两次试验法的可靠性和强大与生存的关系(p< 0.001)。与ALSFRS-R相比,信噪比高,患者拒绝每内部氧化物更均匀。因此,估计样本量减少实现的目标与实现ALSFRS-R分别为16.3%和25.9%,6个月和12个月的临床试验,分别。
讨论我们开发的目的,由一维的球、电机、和呼吸分量表,描述疾病严重程度比总分。目标分量表两次试验法的高可靠性、优化来衡量疾病进展,存活时间密切相关。目标可以很容易地管理和可能增加的可能性在肌萎缩性侧索硬化症临床试验确定有效的治疗方法。
术语表
- 的目标是=
- 肌萎缩性侧索硬化症损害多畴的规模;
- 肌萎缩性侧索硬化症=
- 肌萎缩性脊髓侧索硬化症;
- ALSFRS-R=
- 修改后的肌萎缩性侧索硬化症功能评定量表;
- 国际刑事法庭=
- 组内系数;
- RMSEA=
- 均方根误差的近似;
- 道路=
- Rasch-Built整体ALS残疾量表
介绍
肌萎缩性脊髓侧索硬化(ALS)是一种异构的、多方面的神经退行性疾病与多个潜在的病理生理机制和临床表型差异。1,2修改后的ALS功能评定量表(ALSFRS-R)是最常用来评估疾病严重程度,监测疾病进展,并在临床试验作为主要终点3因为它是易于管理和强烈的生存预测。4,5
然而,ALSFRS-R是多维,这意味着多个独立方面的ALS疾病进展(“维度”,即。球,电动机,和呼吸功能)总结成1总分。最根本的问题是,患者平等总分不得与疾病严重程度或预后,使评估更加复杂的疾病进展和治疗效果。6,- - - - - -,9替代能源开发,如ALS的规模和严重性Rasch-Built整体ALS残疾量表(道路),10,11同样总结不同ALS症状总分为1。总分不得,然而,准确地描述所有的疾病严重程度不同的肌萎缩性侧索硬化症表型。2,6,9Bulbar-onset spinal-onset病人,例如,疾病有不同的课程,8呼吸功能不全可能发生在任何时间点,和许多患者不会出现球或四肢无力的症状。2,12此外,治疗效果衡量一个总分会稀释时治疗不影响所有ALS域一视同仁。7分析ALSFRS-R分量表分别描述疾病进展更全面但不解决固有的测量问题,因为许多ALSFRS-R项的选择从来都不过程中最可能的答案。6,10此外,ALSFRS-R域线性加权顺序相反,即下降1点可以代表一个小或大损失的功能取决于问题的能力。Rasch-built尺度确保线性加权和糟糕的答案选项逐渐变得更加可能的疾病过程中。事实上,拉希分析,结合纵向评价候选人的问题,可能会进一步提高的发展更敏感肌萎缩性侧索硬化症的临床试验结果的措施。
的可能性最大化确定有效的治疗方法,提高问卷的效用监测疾病进展,需要选择尺度,占多重空间,满足拉希测量标准和最大化会随着时间而改变。在这项研究中,因此,我们旨在开发ALS障碍多畴的规模(目标)综合描述疾病进展。
方法
调查问卷的发展
初步ALS残疾问卷创建使用文献综述,国际准则对ALS,临床判断的一个专家小组,病人输入。文献综述包括现有量表和问卷测量ALS函数或残疾3,11,13,- - - - - -,16和指导方针和评论17,- - - - - -,20.描述ALS症状。专家小组由3神经学家(M.A.v.E。,J.H.V.,和l。H。v.d.B.) and 2 senior researchers (R.P.A.v.E. and A.B.), all with extensive expertise in ALS and neuromuscular diseases. The aim was to compile a complete set of questions that covers the full range of disease progression and disability levels in ALS. The preliminary questionnaire consisted of 110 questions, each with 5 answer options on a Likert-type scale, similar to the Center for Neurological Study Bulbar Function Scale.13随后,自言自语的采访进行了7患者评估可接受性,清晰度、可懂度,问卷的完整性。在完成这些采访,问题是调整语言如果病人没有完全理解他们。最终的问卷由专业译员翻译成英文,翻译成荷兰进行验证。这个荷兰翻译与原荷兰版本的目标和检查不一致。最后英语和荷兰语版本的目标是可以在eAppendices 1和2 (links.lww.com/WNL/C899和links.lww.com/WNL/C900),分别。
参与者
ALS患者总的来说,486年,在荷兰注册ALS注册中心,曾同意接洽为研究目的,被初步的目标是调查问卷的链接和验证patient-reported ALSFRS-R的版本,3,4通过电子邮件,2019年10月11日(图1)。荷兰以人群为基础的ALS注册表自2006年以来一直患有肌萎缩性侧索硬化症前瞻性登记;详细描述了其他地方。21,22总之,患者被诊断出患有肌萎缩性侧索硬化症,根据修订后的El堆渣场或黄金海岸的标准,23,24医院注册中心被确定通过每年一次的检查,通过专门的ALS康复诊所登记,分别通过联系神经学家。存活时间(定义为登记和死亡日期之间的时间或日期最后还活着)是获得所有的病人通过检查市注册以季度的间隔。截至2021年10月11日,截止日期为生存分析,167例(45.5%)死亡,2例(0.54%),不超过6个月的随访时间是审查管理。
研究过程
在完成初步的问卷调查,参与者收到第二个链接到初步问卷14天内完成评估每两次试验法的可靠性问题。问题两次试验法的高可靠性(进一步)被选为纵向阶段,要求病人完成问题和patient-reported ALSFRS-R版本进行验证3,412个月的随访期间每2个月。所有的研究数据被输入并存储在一个在线数据库使用CASTOR电子数据采集软件。25
可靠性和拉希分析
两次试验法的可靠性评估计算同类系数(ICC)的问题,是14天内完成两次;问题ICC小于0.80被移除。探索性因素分析与方差极大旋转用于识别ALS域,和模型评估的均方根误差近似(RMSEA);< 0.08的RMSEA被认为是可以接受的。6问题是组合载荷分量表根据模式的因素。主成分和因子分析评价unidimensionality /内部氧化物,它被定义为测量构造解释的方差> 50%。26拉希分析,1观察每个病人随机抽样从纵向测量,以避免在数据的依赖。拉希使用部分信用分析模型,27允许每个问题有自己的类别概率曲线。28理想情况下,类别概率曲线应该表明,随着疾病的进展和残疾增加,恶化问题顺序反应变得更加可能。如果不是,问题阈值是无序的。类别概率曲线检测,并与无序的阈值被移除任何问题。微分项功能发生在不同组的患者同样的总体残疾水平回答问题显著不同。28我们比较问卷反应根据性别、年龄、和出现症状(即网站。,bulbar or spinal onset) using a likelihood ratio test adjusted for multiple testing, and questions that showed significant differential item functioning were removed. Question misfit was evaluated by mean square fit statistics and by comparing the observed proportions with 95% CIs per question response with the predicted probabilities of the Rasch model; misfitting questions, demonstrating significant dependency or unmodeled noise, were removed. Correlations between questions were assessed to avoid interdependent questions.
优化测量疾病进展
/内部氧化物,纵向的下降率是使用线性mixed-effects模型的估计时间固定效应和随机截距和斜率时间每个病人。月平均下降率是评估时间的固定效果,而与病人之间变化定义为随机效应的SD时间(即。、个人发展利率)。信噪比的定义为,下降的速度和与病人之间变异之间的比率。允许直接与病人之间差异的比较,下降的速度与ALSFRS-R分数被减去均值和标准除以SD。重要性,线性变换不影响,下降的速度之间的比例和与病人之间的变化或所需的样本量。信噪比个人的球、电动机和呼吸道分量表进行优化通过最小化所需的样本量检测给定治疗效果的临床试验的所有可能的组合问题29日,30.并通过选择的组合问题,导致所需的最低样本量。所需的样本大小是通过(即结合的速度下降。“信号”)和within-patient和与病人之间方差分量(即。“噪音”)。样本大小的计算是基于80%功率检测减少了35%,下降的速度6或12个月的随访期间,使用每月随访和双向的α为5%。样本量的计算进行的一个子集患者更多的比较常见的临床试验人群(定义为“trial-eligible病人”),也就是说,在排除疾病持续时间> 36个月,患者年龄超过80岁,或使用无创通气在招生。
最后一球,综述了运动,呼吸分量表和问题困难的专家小组内容效度和临床效用来衡量残疾和疾病进展。经验的力量ALSFRS-R分量表和最终目标检测统一减少35%,下降的速度估计,使用一种分析策略,每个子量表评估治疗效果,说明治疗是否有效,而调整p值的多个测试使用鞍环的方法,如前所述。7经验的力量ALSFRS-R和目标估计重采样(n = 25000)纵向数据的75名患者手臂与替代。1采样臂的平均下降率就降低35%来模拟一个假想的治疗效果,和个人ALSFRS-R和目标子量表分数被重新计算。在每个数据集重新取样,我们计算p价值的群体间的差异,下降的速度来衡量ALSFRS-R分量表和目标。ALSFRS-R和目标分量表被定义为一个主要终点的家庭,也就是说,在任何的一个分量表统计上显著的治疗效果被认为是一种积极的试验。经验能力ALSFRS-R和目标被定义为25000重新取样数据集的比例显著群体间的差异率的下降。为了使结果更容易理解,我们翻译经验能力要求样本量达到80%的力量。31日
建构效度
建构效度评估的评估目标的关联与ALSFRS-R分量表和生存时间。线性mixed-effects模型包含球、电动机和呼吸道分量表作为因变量和相应的ALSFRS-R分量表固定效应被用来评估与ALSFRS-R协会。非线性关系模型使用二次固定效果每ALSFRS-R次生氧化皮,和一个随机的斜率和截距是每个病人使用。引导(n = 25000)被用来估计95%的CIs。协会的分量表得分与生存时间基线评估使用kaplan meier估计量和Cox回归。
标准协议的审批、登记和病人同意
医学伦理委员会和乌得勒支大学医学中心的机构审查委员会批准了这项研究(参考19/463),和所有参与者提供知情同意参与。
数据可用性
匿名数据没有公布在这篇文章将分享在请求从任何合格的调查员。
结果
研究人群
概述的问卷是在开发的图1。初步调查问卷,包括110年的问题,自我报告的版本的ALSFRS-R被送到486名ALS患者参加荷兰ALS注册;367名患者(75.5%)提供知情同意和完成至少1调查问卷。总共有2144问卷期间完成12个月的随访平均为5.8问卷和每个病人随访时间9.3个月。总结了研究人群的特征表1。一百三十九名(37.9%)患者完成试用资格的定义根据疾病的持续时间小于36个月,小于80岁,没有使用无创通气的招生。Trial-eligible病人稍微年轻和疾病持续时间较短,而且更好的ALSFRS-R得分与包容,但速度下降。平均下降率ALSFRS-R总分为0.63 (95% CI 0.56 - -0.71)分月所有患者为1.02 (95% CI 0.88 - -1.17)分月trial-eligible病人。
中位数时间完成ALSFRS-R和初步120项问题的调查问卷(四分位范围夫人)18分钟。eFigure 1 (links.lww.com/WNL/C898)表明,所有疾病阶段都代表在所有时间点因为ALSFRS-R总分数范围从0到48个。
拉希分析
患者的数量完成第二个初步问卷14天内两次试验法的分析是在146年。110年的问题,67年(61%)0.80或更高的国际刑事法庭,从而超越选择阈值,随后被收集在12个月的随访。主成分和因子分析发现三维域足以解释方差的大部分(55.2%)的数据,而这是为2和4域49.2%和59.2%,分别。因子载荷的模式表明,问题代表3个独立的领域:一个球,一个电动机,呼吸领域。
类别概率曲线描述每个问题响应的概率/球,电机,检查和呼吸障碍水平,和3中间答案选项被倒塌的解决无序阈值,导致共3回答选项/问题。五个问题(“饮食变化由于吞咽困难,”“流口水”,“使用步行的援助,”“需要帮助起床,”和“使用空气叠加”)被移除,因为崩溃响应类别没有解决无序阈值的问题。当比较问卷反应男人和女人之间,没有观察到显著的微分项功能。三个问题被移除,因为微分项功能;1问题(“重复自己被理解”)证明微分功能由于年龄,和两个问题(“人理解我告诉别人我说什么”,“我知道我的语言障碍”)证明微分功能的基础上,出现症状。最后,模型适合每个问题是评估和6个问题(“早上我看到的唾液在我的枕头上,”“散步是累人的,”“站起来”,“改变腿的位置,”“使用止痛剂”和“轮椅的使用”)被移除,因为不适应环境的问题。
优化测量疾病进展
球、电动机和呼吸道分量表是每个优化测量ALS疾病进展。总共有53个剩余问题,评估球(n = 14)、电机(n = 29),或呼吸系统(n = 10)功能。图2显示的总数之间的关系问题/内部氧化物和所需的样本量。最初,添加更多的问题增加信息(即。,increases the average rate of decline, reduces between-patient variability, reduces within-patient variability, or a combination of the 3), thus reducing the sample size required to detect a given treatment effect in a clinical trial. However, at some point, an optimum is reached, where adding more questions does not lead to an increase in information but increases “noise” and hence to an increase in the sample size required to detect treatment effects. The final combination of questions that resulted in the lowest required sample size (or within 5% of the minimum) consisted of 7 bulbar, 11 motor, and 5 respiratory questions. Compared with the ALSFRS-R subscales, the AIMS subscales reduced the 12-month sample size by 23.9%, 27.6%, and 53.6% (表2)。接下来,我们估计的样本量减少临床试验,定义了ALSFRS-R或目标分量表作为主要终点的家庭,也就是说,通过评估治疗效果一元/球,电机、规模和呼吸而调整p多个测试值,在决定是否治疗是有效的。在这种情况下,统计上显著的治疗效果在任何的一个分量表被认为是一个积极的审判。与ALSFRS-R分量表相比,估计样本容量减少了16.3%和25.9%,分别为6个月和12个月的临床试验。在敏感性分析结果相似,包括患者比较常见的试验数量(即。,including patients with disease duration >36 months, being older than 80 years, or the use of noninvasive ventilation at baseline) (eTable 1,links.lww.com/WNL/C898)。介绍了问题困难图3顺序,显示更糟的问题选项更可能每内部氧化物增加残疾。的重要性,目的是有针对性的更广泛的比ALSFRS-R ALS残疾水平,与位置残疾范围更大的问题。问题位置,表示为分对数规模拉希残疾,范围从0.69−1.97−1.76至1.53,和1.10−1.65球,电机,和呼吸分量表,分别在相应的低端问题ALSFRS-R位置范围是0.18到0.94,0.18−1.37和0.78−0.42。
可靠性和结构效度
两次试验法的可靠性对球、电动机和呼吸子量表得分高可以为0.94 (95% CI 0.91 - -0.95), 0.94 (95% CI 0.92 - -0.96),和0.91 (95% CI 0.88 - -0.94),分别。最后,评价建构效度,我们评估目标子量表评分对相应ALSFRS-R分量表和入学后存活时间(图4)。相关性与各自ALSFRS-R球、电动机和呼吸系统部分的得分是0.87 (95% CI 0.85 - -0.90), 0.93 (95% CI 0.92 - -0.94),和0.79 (95% CI 0.75 - -0.82)。与ALSFRS-R相比,天花板和地板效应的目标似乎更小。例如,患者一个ALSFRS-R球得分为0,平均而言,一个目标球的4分(图4一)。目标分量表与整体有关生存,较低的分数导致较低的生存概率入学后,所有分量表p< 0.001。或者使用Cox回归风险比来表示球、电机、和呼吸分量表分别为0.90 (95% CI 0.86 - -0.94), 0.94 (95% CI 0.92 - -0.97),和0.84 (95% CI 0.79 - -0.90),分别p< 0.001。或者换句话说,增加1分球,电机,或呼吸系统得分是10%,6%,和降低16%的死亡风险。
讨论
在这项研究中,我们开发了ALS障碍多畴的规模、组成的一维的分量表与7球,11个马达,和5呼吸问题,高两次试验法的可靠性,满足拉希需求,存活时间紧密相关。我们优化的分量表通过选择问题,优化纵向,下降的速度,同时减少与病人之间的变化。我们就开发了一个易于管理的结果测量用于肌萎缩性侧索硬化症的临床试验和在诊所,这可能与更广泛的测量窗口更敏感比ALSFRS-R监测疾病进展和检测治疗效果。
的重要性,通过开发一个多畴的规模,我们旨在解决多维ALS症状的性质。指导监管机构表明,对于一些疾病,可能需要多个端点的完整描述疾病。32多重空间的一个特征是许多神经系统疾病,如多发性硬化、33脊髓性肌萎缩,34帕金森病,35中风,36和阿尔茨海默病。37目前在ALS的尺度,如ALSFRS-R,3ALS的严重性,11或道路,10总结一系列ALS症状1综合得分,可能不能准确地描述多维肌萎缩性侧索硬化症等疾病。由于异构临床表现和subphenotypes不同,同一患者ALSFRS-R总分不一定是类似的关于疾病严重程度,发展速度,或预后。6,8,38此外,使用综合总分作为主要终点可以掩盖重要临床试验治疗的线索。治疗可能不会影响所有ALS域一视同仁;因此,治疗效果衡量复合端点会稀释。例如,在Nuedexta试验,39治疗改善只有球功能(p= 0.003);这种治疗效果可能已经错过了如果ALSFRS-R总分(p= 0.25)被定义为主要目标。显然,在这项研究中,Nuedexta的有益作用在球功能预先假设,但效果往往不知道先验。同样,在药物不良反应和钠phenylbutyrate-taurursodiol试验,ALSFRS-R总分上的治疗效果似乎主要是由电机驱动内部氧化物而不是球和呼吸分量表。40,41同样,研究关注造成的干预措施,如优化多学科治疗通过物理疗法,运动项目或言语治疗也可能受益于更全面的评估干预的影响。42多畴的目标,因此,更好的描述ALS疾病进展和治疗效果和随后在诊所和促进疾病监测试验。
有几种分析策略分析多畴的尺度,避免复合端点的陷阱,而控制假阳性率(即。第一类误差)。43一个相对简单的方法来评估治疗效果/内部氧化物,之前说治疗是否有效的整体,而调整p多个测试值。7根据调查者的偏好,目标分量表先天可以定义为一个主要终点的家庭,32即治疗效果在任何的一个分量表被认为是临床相关,可能表明治疗效果(eTable 2,links.lww.com/WNL/C898总结了一个活生生的例子)。另一个选择是排名的重要性每个目标次生氧化皮。这可以表现在一组级别(例如,球总是比运动更重要的功能)44或者使用单独的病人或医生的偏好。45治疗效果随后可以概括为获得更有利的结果的概率比接受安慰剂治疗。图5说明这种类型的分析可以提供目标。然而,总结eTable 3,更复杂的分析策略存在,如指定测试层次结构或使用多变量模型。46,47多变量模型同时模型多个纵向结果,允许1的计算p值的总体治疗效果,这可能是一个更强大的比执行多个独立的统计测试策略。多变量模型是灵活的,因为纵向结果可以添加(例如,肺活量、肌肉力量或生物标记),重要的是,可以调整死亡率。46,48
拉希分析被用来系统地减少问题的初步问卷,确保目标是线性加权和病人可以使用内部氧化物相比分数,因为只有1被测量(即概念。球,电机,或呼吸障碍)。进一步优化多畴的规模,我们分析了纵向随访12个月的下降和选择的组合问题,结果在高平均下降率(即。“信号”)以最小的变化(即。“噪音”)。29日,30.因此,与相应的ALSFRS-R分量表相比,提高了信噪比(表2),从而增加监测疾病进展的精度的目的。减少可变性审判端点精度很重要,因为它增加评估治疗效果和减少所需的样本量检测给定的治疗效果。
这项研究也有一些局限性,需要考虑。首先,认知障碍是没有在我们的研究评估。因此,不清楚是否以及在多大程度上ALSFRS-R认知障碍的影响结果和目标。第二,考试类别概率曲线表示中间崩溃问题的反应是必要的,以避免无序的阈值,进行前瞻性验证新措辞问题的必要。第三,在这项研究中,目标是病人报告,便于将作为远程调查在临床试验中。然而,我们有进一步细化目标通过提供指导每问题得分0时,1,或2。我们假设提供这样的指导结合适当的培训研究人员可能会减少变化响应内部和之间的病人。然而,是否为得分的确降低了变异性提供指导和培训应在将来的研究中调查。最后,我们发现强关联的目标分量表与生存时间。然而,对于问卷调查被认为是一个真正的代理端点的生存时间,是很重要的治疗对生存时间的影响反映在代理端点,反之亦然。 Future prospectively designed studies, that, for example, use the joint modelling framework,46,48重要,因此,在建立目标治疗效果之间的关系,ALSFRS-R和存活时间。
总之,我们已经开发出目标,组成的一维的球,电动机,和呼吸分量表描述疾病严重程度比总分。目标分量表两次试验法的高可靠性、优化来衡量疾病进展,存活时间密切相关。目标可以很容易地管理和可能增加的可能性在肌萎缩性侧索硬化症临床试验确定有效的治疗方法。
研究资金
本研究由荷兰ALS基金会资助(批准号TRICALS-Origin)。
信息披露
作者报告没有相关的信息披露。去首页Neurology.org/N为充分披露。
附录的作者
脚注
去首页Neurology.org/N为充分披露。资金信息和披露认为作者相关的,如果有的话,年底提供这篇文章。
这篇文章加工费由Wolters Kluwer / UKB VSNU协议。
提交和外部同行评议。处理编辑器是副主编安东尼·阿马托医学博士FAAN。
编辑、页面243年
- 收到了2022年12月8日。
- 接受的最终形式2023年4月18日。
- 版权©2023年作者(年代)。发表的Wolters Kluwer健康,公司代表美国神经病学学会。首页
这是一个开放的分布式根据文章知识共享归属许可4.0 (CC),它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。
引用
- 1。↵
- 2。↵
- 3所示。↵
- 4所示。↵
- 5。↵
- 6。↵
- 7所示。↵
- 8。↵
- 9。↵
- 10。↵
- 11。↵
- 12。↵
- 13。↵
- 14。↵
- 15。↵
- 16。↵
- 17所示。↵
- 18岁。↵
- 19所示。↵
- 20.↵
- 21。↵
- 22。↵
- 23。↵
- 24。↵
- 25。↵
- 26岁。↵
- 27。↵
- 28。↵
- 29。↵
- 30.↵
- 31日。↵
- 32。↵
- 33。↵
- 34。↵
- 35。↵
- 36。↵
- 37岁。↵
- 38。↵
- 39岁。↵
- 40。↵
- 41岁。↵
临床评估报告:药物不良反应(Radicava)。田边三菱制药公司;2019年。
- 42。↵
- 43。↵
- 44岁。↵
- 45岁。↵
- 46岁。↵
- 47岁。↵
- ibsen PinheiroJ,
- 贝茨D,
- DebRoy年代,
- SarkarD,
- 团队钢筋混凝土
- 48。↵