条文本
文摘
目标理解的结果测量的属性是至关重要的在选择合适的仪器和解释它生成的信息。MOS 36项简式健康调查问卷(SF-36)被广泛认为是黄金标准通用的衡量健康状况;然而一些研究已经评估其使用在多发性硬化的临床试验。临床是否合适,内部一致性可靠性、有效性和响应性研究在广泛的多发性硬化症患者。
方法与临床前瞻性研究中,150名成人明确多发性硬化症完成一系列问卷调查评估一般健康状况,残疾,障碍和情绪健康。其中,44个病人接受住院康复干预前后完成了问卷评估响应能力。
结果分数分布表明显著地板和天花板效应四个特别明显的八个维度当病人选择仅限于疾病严重度的窄带(在大多数临床试验一样)。内部一致性超过所有维度的标准组比较。收敛判别建构效度是支持的方向、大小和模式的相关性与其他卫生措施。与仪器测量相关的结构相比,SF-36是穷人在评估变化的响应在中度到重度残疾病人参与住院康复计划。
结论SF-36有一些限制作为一个结果测量在多发性硬化症。结果凸显了需要对所有仪器检查的具体样本下的人口问题和特定的研究问题被调查。在多发性硬化症的临床试验,SF-36应该与其他相关补充措施。
- 多发性硬化症
- SF-36
- 的生活质量
来自Altmetric.com的统计
大量的临床试验已经在过去十年来确定一系列干预措施的有效性在多发性硬化症。传统上这些试验结果的基础上评估临床终点(例如,复发率)和生理参数(例如,病变MRI负载1)。近年来有逐渐扩大的结果测量包括方面的健康状况。23与推进,越来越多的健康状况已经开发出来的新措施。4 - 6不幸的是只有初步的信息关于这些措施,特别是在临床试验中使用。结果研究人员发现,他们面临更多的选择,但有限的信息依据进行选择。7
人们普遍同意的选择结果测量(s)是临床试验的成功设计的关键。8一个明智的决定依赖于知识的科学(可靠性、有效性和响应能力)和临床属性(可行性、合理性研究样本,被申请人负担)可用的措施。9理解研究的目的也是一个重要的考虑因素是不同的问题可能需要不同的措施。仪器将用于描述特定特征的人口?它会比较与其他样品吗?它将评估干预的有效性?这些信息是至关重要的在选择最合适的工具和解释结果生成的以一种有意义的方式。
两种不同的方法来测量健康状况是通用和疾病的具体模型。通用模型旨在评估基本卫生值被认为是有关健康状况无论疾病,治疗,或年龄。10相比之下,这种疾病特定模型不关心建立通用标准但旨在反映因素相关的人与一个特定的疾病。
SF-36通常被认为是黄金标准通用的衡量健康状况。4它有好几种语言,采用全球和传播。一个标准的英国版本11和规范确定的健康人群都在美国12和联合王国。13虽然被证明是可靠和有效的病人组12相对较少的研究调查其使用在多发性硬化症。大多数检验其价值在描述多发性硬化的影响生活质量;通常比较他们的发现和其他病人组和普通人群。14日至17日很少有SF-36作为一个结果测量用于多发性硬化症的临床试验。1819
1996年我们出版的横断面研究结果驾驶使用SF-36多发性硬化症患者在康复单元。15呈现出我们的研究结果表明,SF-36地板效应在某些维度在这群中等至严重残疾的病人。我们认为这可能会限制其潜在的反应在评估可能发生的任何变化的干预措施。我们得出的结论是,一个系统评价SF-36的更广泛的多发性硬化症患者是必要的。这项研究调查了适当性、可靠性和有效性的SF-36广泛的多发性硬化症患者的新诊断在疾病的晚期。它决定响应小组的患者进行住院康复计划。
方法
抽样
一百五十例临床诊断为明确的多发性硬化症20.参与这个伦理批准的前瞻性研究。连续患者在医疗环境中从三个不同的来源:每周门诊评估诊所,一个住院neurorehabilitation单位,承认在一个顾问(AJT)急性病房。患者被排除在外,如果他们认知能力受损,无法可靠地完成调查问卷;有其他疾病,如风湿性关节炎可能影响他们的健康状况;或被非英语。
分层的过程
收集的数据仅仅从一个特定的设置通常是有偏见的。举例来说,一个更大比例的严重残疾的病人更有可能在急性医院设置比那些参加跟进门诊预约。确保更多的传播障碍在我们的示例中,我们进行了一个分层的过程,以确保它是由相同数量的患者在整个范围的疾病严重程度。这个过程涉及神经系统注册评估所有患者Kurtzke功能系统规模和扩大残疾状态量表(eds),21然后归类成三组之一22:轻微(eds 0 - 4.5),中等(eds 5.0 - -6.5),或严重(eds 7.0 - -9.5)。连续患者招募到每个类别有50个病人。
测试电池和管理的方法
人口信息被收集的采访和诊断来自医疗记录的细节。所有患者评价疾病严重程度如上所述的水平。残疾水平得分通过面试使用功能独立性测量(鱼类)23管理按照出版的指导方针。病人还完成了电池的自我报告问卷测量一系列的健康结构包括一般健康状况,障碍,心理健康,一个清廉的全球整体的生活质量评定量表。尽可能进行独立但必要时(例如,视觉障碍,困难)物理研究员提供的援助。没有给出任何援助在解释调查问卷。
一百零六名患者在一个单一的评估时间点。其他44个科目,都康复住院患者,评估了在两个时间点(入院和出院)评估响应能力。
健康状况的措施
SF-36英国化的版本13是使用。这个36-item通用的健康状况问卷包括八个多产品功能和健康:身体功能(PF-10物品),角色限制由于身体(RLP-four项目)或情感(RLM-three项目)的健康问题,社会功能(SF-two物品),心理健康(MH-five物品),身体上的疼痛(BP-two物品),能源和疲劳(EV-four物品),和一般卫生观念(HP-five物品)。所有物品编码,总结,并转换到0 - 100(0 =坏的健康,100 =最佳健康)。12此外,这八个维度得分可以减少两个总结成绩、身体(pc)和精神组件(MCS),通过主成分分析。24
全球清廉点尺度用于率总体生活质量(QoL)。25
仪器测量相关的健康结构
从以下工具来收集信息,使比较的SF-36维度。
(1)功能性能进行评估,通过病人的采访中,使用鱼翅电机领域。这13项,7级规模的措施方面的日常功能四个分量表:自我保健,括约肌控制、转移和运动。总分范围是13 - 91分数越高表明更高层次的独立。
(2)障碍评估使用伦敦规模障碍(lh)。26这六项,六级量表评估患者个体的劣势有经验维度的流动性,物理独立性、职业、社会融合,方向,和经济上的自给自足。总分范围是0 - 100得分越高表明最小程度的劣势。
(3)情绪状态评估使用28项一般健康问卷(GHQ)。27这个版本有四个分量表,测量干扰领域的躯体抱怨,焦虑、社会功能障碍和抑郁。总分范围0-28,得分越高表明更高层次的情感障碍。
这些工具被用于各种多发性硬化症人群和已被证明是有效的,可靠的,和响应中康复319和医院设置。28
康复计划
住院病人康复计划包括结构化、面向目标的、多学科的项目专门针对考虑病人的个人需求。3这通常包括努力提高功能独立,流动性,膀胱和肠功能和通信。建议和教育有关工作和休闲的追求,语气管理,疲劳管理和策略来弥补记忆功能障碍也是这个项目的常规组件。
数据分析
使用SPSS进行统计分析。29日描述性统计是用来描述样本的人口和疾病特征。
适当性
适当性被用来定义的范围是否构建测量研究样本类似于范围内覆盖的测量仪器。30.这反映出相关仪器在本质上是人口接受检查。这是通过检查评估量表分数分布(范围,意思是,SD,地板(最小),和天花板(最大)分数)的八个维度和两个摘要SF-36的尺度,以及为每个其他措施。
可靠性
内部一致性,可靠性的一个方面是克伦巴赫α的统计计算。31日α系数超过0.7被认为是适当的组比较。12
建构效度
建构效度是用来建立一个测量仪在没有标准的有效性或宇宙的内容被接受为完全足以定义属性被测量。31日它决定通过检查的经验数据支持假说有关构造所谓的测量仪器。我们检查数据的证据:
(1)聚合效度——确定之间的关系维度SF-36和仪器测量类似的结构。皮尔逊积差相关检查:SF-36心理健康维度GHQ;与鱼类和eds SF-36物理维度;和SF-36社会与lh和角色维度。提供聚合效度我们预期的证据,例如,看到大量SF-36物理维度之间的相关性,eds,和鱼类;同样SF-36情感维度和GHQ之间。
(2)判别建构效度——确定之间的关系维度SF-36和仪器测量不同的构造。皮尔逊积差相关检查的身体和心理健康维度之间SF-36;鱼翅和SF-36心理健康维度;和GHQ SF-36物理维度。提供区分效度我们预期的证据,例如,看到弱SF-36情感维度之间的相关性和鱼翅;和SF-36身心总结之间的尺度。
(3)组织结构效度的差异——检查SF-36分数不同群体之间的差异。我们研究了精神和身体的能力总结尺度区分不同级别的多发性硬化疾病严重程度用单向方差分析(方差分析)与历史数据比较,为多个比较使用Bonferroni调整测试,α= 0.05。提供组差异建构效度我们期望的证据,例如,患者分为严重组会报告的总结表上得分较低比轻度患者组。
(4)假设检验——检查结果是否与理论预期一致。使用独立的以下假设进行测试t与α= 0.05:测试,(一个)患者需要看护援助将报告分数SF-36物理功能维度低于那些在日常护理中独立;(b)复发缓和多发性硬化患者将报告更高的分数在物理总结SF-36的规模比继发型多发性硬化;(c)患者在GHQ⩾得分5.0分(表明Dalos定义的情绪困扰等27)将报告低的分数SF-36精神总结规模比< 5.0分。
响应性
响应性测量仪器的能力是临床重要的随时间变化的。9这是检查小组的44个短的住院病人康复的病人。这种干预之前评估和被证明是有效的在多发性硬化症患者健康状况的改善方面的短3和长期的。19这些结果病人改变分数录取和放电之间决定,和影响大小计算(效果=意味着改变/ SD初始分布的分数)。32科恩提出的标准33被用来解释效果,0.2是小,0.5是温和,和0.8或更高大。配对t测试是用来确定这些变化的统计学意义的分数。
结果
样本特征
150例患者进入研究的,一个没有完成问卷的电池,被排除在分析之外。剩余的149人没有任何物品丢失的数据。表1介绍了研究样本的人口和诊断特征,其中70%的人已婚,33%就业,49%需要援助与日常护理。表2显示了样本的意味着SF-36分数与另两名多发性硬化症的人群。
适当性
表3介绍了SF-36维度的得分分布和总结。在总样本,分数在所有维度跨越几乎整个范围;然而,地板效应在三维空间(身体功能、物理和情感角色限制)和天花板效应在二维空间(局限性和痛苦的情感角色)超过20%的推荐标准。34当病人分为团体根据疾病严重程度得分的分布在每个子群中,在某些情况下,显著改变。例如:(一个)的物理功能分数跨度只有底部严重集团范围的20%;(b外),意味着大幅下降的中点物理功能和物理作用的规模限制在中度和重度组(PF温和= 22.9,严重= 4.4;严重意味着RLP温和= 28.5,= 10.5);(c)地板效果显著增加物理函数(包括情感和身体)和角色限制,特别是在严重的集团。尽可能低的分数是84%的严重患者报告的物理作用的局限性和36%的患者情感作用的局限性。
表3表明分数分布的差异在总样本和子组之间在总结尺度不太明显。的重要性,没有天花板或地板效应。
表4介绍了仪器测量相关健康得分分布结构。在总样本分数鱼翅,lh,和全球的生命质量量表跨度几乎整个刻度范围;中点附近的平均分数;和地板和天花板的影响是最小的。这表明,尺度适合总研究样本。当患者分组根据eds分数这些工具的适当性,虽然不太理想,仍然令人满意。虽然分数限制在一个较小的范围内可用的规模,地板和天花板效应仍远低于20%的推荐标准。34相比之下,在总样本和每个子组,平均分数GHQ跌破中点的规模和上面的天花板效应是推荐的上限。
可靠性
内部一致性八维度和组件的可靠性对于每个总结尺度SF-36高的α系数介于0.77到0.94。
收敛判别建构效度
SF-36维度之间的组间关联
表5报告组间关联之间SF-36维度。重要的是,没有一个相关性强(r= 0.09 - -0.61)表明每个维度是测量一个相关但又截然不同的构造。正如预测的那样,相关维度较低相关维度更密切相关。例如,物理性能与物理作用的局限性(呈强相关r比与心理健康(= 0.57)r= 0.09)或情感角色限制(r= 0.14)。同样的心理健康呈强相关与情感角色限制(r比疼痛(= 0.54)r= 0.29)。有趣的是,心理健康表现出更强的相关性与能量和活力r比物理函数(= 0.61)r= 0.18)。
SF-36维度之间的相关性和仪器测量相关的健康结构
正如预测的那样,SF-36维度之间的关联和仪器测量相关卫生构造是最强的测量之间的相似的概念。例如,身体功能紧密相关的鳍(r= 0.68)和eds (r=−0.82);和情感上的幸福与GHQ相关显著(r=−0.59)。相比之下,仪器测量之间的关联很弱结构无关。例如,情感角色限制仅仅是弱相关的鳍(r = 0.04),和痛苦只有弱与eds相关(r =−0.07)。值得注意的是,社会功能维度相关与尺度测量情感更强烈构造(例如,GHQr=−0.56)比物理结构(例如,edsr=−0.29;鱼翅r= 0.34)。
组不同结构效度——预期,病人组显著差异发生在三维SF-36(社会功能、物理性能和物理作用的局限性;p < 0.05 - -0.0001)。这一发现表明这些维度的能力区分不同程度的疾病严重程度。显著差异也展示了所有子组之间的物理总结规模(p < 0.001),但只有轻度和中度组之间的心理总结规模(p < 0.03)。
假设检验——预测:(一个)患者要求护理员协助报告的得分限制在物理作用维度低于那些独立(p < 0.0001,平均分数= 13.5和43.7分别);(b)复发缓和多发性硬化患者报告更高的分数在物理总结规模比继发型多发性硬化(p < 0.0001,平均分数= 35.7和27.4分别);(c在GHQ)患者得分⩾5.0分得分低的心理总结规模比< 5.0分(p < 0.0001,平均分数= 40.4和52.2)。
响应性
四十4名患者参加了住院病人康复的平均20天(范围(SD 6) 13-39)。效应值SF-36尺寸范围从微不足道的小(效应大小0.01 - -0.30)。维度展示效果是最大的情感作用的局限性(效应值0.27)和疼痛(效应值0.30)。的八个维度,只有疼痛(p = 0.006)和物理性能(p = 0.01)体现出统计上显著的成绩入学和放电之间的变化。相反效应大小鱼类,lh, GHQ都温和级(效应值0.56,0.58,和0.51)和统计上显著的差异在入院和出院证明之间的分数为每个这些措施(p < 0.002)。
讨论
这项研究提供了一种广泛使用的通用信息衡量健康的地位SF-36。SF-36建于比较功能在患者和一般人群健康和福祉,并评估和比较另类治疗的好处。24本研究的重点是检查其性能作为一个结果测量在多发性硬化症。
generalisability的结果是支持的事实,样本人口的人口和诊断特征描述的是典型的文学。35此外,见表2SF-36分数的分布非常类似于以前的多发性硬化研究的结果161725表明样本代表的多发性硬化症。
SF-36不是调查的两次试验法的可靠性在这项研究中,但别人的结果,都在英国11和美国,12报告2周的优良业绩。在协议与其他的研究中,我们的研究结果表明,内部一致性的所有维度SF-36超过0.7标准的组比较。12同样,收敛和判别建构效度是支持的方向,大小,与其他卫生措施和模式的相关性。为构想效度提供了进一步的证据支持临床假设测试。这些数据支持SF-36的内部一致性信度和效度作为衡量健康状况的多发性硬化症。因此似乎合理选择SF-36作为一个结果测量在临床试验中评估干预措施的有效性在多发性硬化症。
当数据是更详细地检查,然而,一些限制的测量变得明显。例如四大地板和天花板效应的八个维度表明健康状况测量的范围不太可能代表这个群体所经历的范围,并演示局限性SF-36区分个体病人的能力在这些维度。值得注意的是,地板和天花板效应并不仅仅适用于病人疾病的极端严重性范围;中度组在三维空间中也表现出显著的地板效应。数据还显示反应作用的局限性维度的两极分化。也许并不奇怪,这两个被认为是调查问卷的格式项。例如,参考图1,其中包含的情感作用的局限性问题。
这些担忧SF-36的适当性多发性硬化症时加剧人口分为组根据疾病的严重程度。这很重要,因为大多数临床试验的选择标准将不可避免地缩小范围的疾病严重程度的研究样本,有时明显(例如eds 1.0 < 3.536;eds 3.0 - 6.52;eds < 6.537)。这些结果强调检查乐器的适当性的重要性为特定的人口进行调查。虽然乐器可能适合一群病人不一定是这样一个不同的组,即使在相同的医疗状况。
没有地板或天花板效应发生在SF-36身心总结尺度,表明这些尺度可能比个人更合适维度之间的歧视患者个体在一个时间点。另外他们的优势减少所需的统计比较分析的结果,从而减少机会测试实验假说的作用。24然而,缺点是无法准确的解释发生任何变化;一个共同特征的多维仪器。
乐器的响应能力是至关重要的研究结果。如果仪器无法检测变化的健康,干预改善健康状况可能显示处理和未经处理的患者没有明显区别。不幸的是,这个属性是经常被忽视的响应能力和信息SF-36多发性硬化试验是稀缺的。的微不足道的小尺度效应证明SF-36显示的响应SF-36贫穷在评估住院病人康复的有效性在患有中度到重度残疾。虽然有些人可能认为这是因为很少或没有发生变化,温和的效应大小鱼类的结果(测量身体功能)的GHQ(测量情绪健康),和lh(测量障碍)表明,变化确实发生,至少在这些选择区域。此外显著改变分数之间的变化证明这三个措施,但在只有两个维度的SF-36。穷人SF-36可能的响应能力,在某种程度上,是由于这一事实措施广泛的功能和健康的问题,,加在一起可能不会给一个明确的效果。相比之下,鱼翅、GHQ和lh措施更具体的健康结构。我们也建议分数两端的集群的规模,发现一半的SF-36维度,意味着规模的范围太局限于使小但可能临床显著变化记录;从而限制响应能力。 It is stressed, however, that the responsiveness data in this study is restricted to patients with moderate to severe disability undergoing rehabilitation and that the SF-36 has therefore not been assessed in a population representative of the patients included in most multiple sclerosis trials. This is a limitation of this study.
不同的方法考虑使用的一些通用的措施的局限性,近年来。例如,为多发性硬化疾病发展的具体措施已经采取通过适应当前措施(例如,功能评估措施38或多发性硬化症QoL-544);通过收集在一起各种症状具体措施(例如,生命质量量表39);或通过识别关键区域,然后根据权重重要性病人认为这些地区是他们的生活方式(例如,残疾,影响形象40)。所有这些措施都是在早期阶段的评估。
结论
理解的结果测量的属性是至关重要的在选择最合适的仪器研究和解释它生成的信息。金本位SF-36被广泛承认是通用的衡量健康状况。它被越来越多地作为一个结果测量的临床试验来确定干预措施的有效性。这项研究的结果强调为此SF-36的一些限制。标志着地板和天花板效应在一半的维度,和整个范围的疾病严重程度,表明有限能力区分罹患多发性硬化症的病人在一个单一的时间点。穷人响应能力维度的分数表明它是有限的检测随时间变化在患有中度到重度残疾。这些结果强调了“通用”的措施需要被测试的特定人群和特定目的。我们建议试验评估健康状况在多发性硬化症应该补充SF-36与其他相关的使用和科学合理的仪器来最大化健康测量的有效性。
引用
相关的文章
- 社论评论