条文本
文摘
目标评估的完整性和代表性的身体质量指数(BMI)临床实践研究中的数据数据链接(CPRD),并确定一个最优策略的使用。
设计描述性研究。
设置从初级保健电子医疗记录。
参与者来自英国的一百万名患者随机样本CPRD初级保健数据库,年龄≥16年。
主要和次要结果的措施BMI在CPRD完整性评估了年龄、性别和日历。BMI CPRD-based总结统计每个日历年(2003 - 2010)是年龄标准化的和sex-standardised并与等效来自英格兰的健康调查数据(HSE)。
结果BMI完整性增加日历时间从1990年的37%,1994年到2005 - 2011年的77%,高于女性,随着年龄的增加。当BMI在特定时间点被分配根据最近的记录,calendar-year-specific平均BMI等效HSE统计数据低估了0.75 - -1.1公斤/米2。限制那些最近(≤3年)BMI导致平均BMI估计接近HSE(≤0.28公斤/米2低估),但排除了多达47%的病人。基于模仿另外一个策略将最新的BMI指数的变化随着时间的推移,自从上次记录也导致可用的意思是BMI估计接近HSE(≤0.37公斤/米2低估)。
结论完整性CPRD BMI的增加随着时间的推移,不同的年龄和性别。在给定的时间点,大部分最近的BMI指数不可能反映目前的体重指数;顺向BMI误分类可能减少使用基于模型的当前BMI的归责。
- 流行病学
- 初级护理
- 统计数据和研究方法
这是一个开放的分布式条依照创作共用署名非商业性(3.0 CC通过数控)许可证,允许别人分发,混音,适应,建立这个工作非商业化,和其派生作品在不同的条款进行许可,提供了最初的工作是正确地引用和非商业使用。看到的:http://creativecommons.org/licenses/by-nc/3.0/
来自Altmetric.com的统计
文章总结
本研究的优点和局限性
这里给出的结果是基于一个大型随机样本从临床实践研究数据链接(CPRD);因此,我们可以自信地归纳研究结果对整个CPRD数据库和类似数据库基于英国初级护理记录。
评估CPRD身体质量指数(BMI)的代表性数据,我们与英国健康调查的数据相比,基于一个大型全国代表性样本,包括体重指数来衡量培训面试官的信息。
我们的研究没有观察BMI儿童录音这将需要不同的策略。
介绍
超重和肥胖是全球疾病负担的主要贡献者1并与大量的超额死亡率相关。2肥胖的发病率正在增加在发达国家和发展中国家3,4给政策制定者和越来越多的关注。在英国,肥胖的流行率稳步上升,从1993年到2010年:从13 - 26%的男性,从16 - 26%的女性。5由于其与各种疾病和健康状况,身体质量指数(BMI,度量最广泛使用的分类超重和肥胖)是一个重要的因素在许多流行病学研究,既是曝光和作为一个潜在的糊涂。
定期收集电子医疗记录的数据库变得越来越宝贵的资源在流行病学、允许群体大,研究具有代表性的样本。英国临床实践研究数据链接(CPRD)(以前惯例研究数据库或大)被广泛使用,包含综合医疗记录对大约8%的英国人,6允许进行流行病学研究的主题和统计力量比通常可用在传统的队列研究。然而,这些数据库的缺点是生活方式的数据,如BMI、伺机往往是记录(即记录当病人参加其他原因或物质的直接临床重要性),可以不完整。此外,那些non-missing生活方式的数据可能是普通人群的代表性。体重指数是一个重要的协变量基于CPRD发表了许多研究,7 - 14但BMI的完整性和代表性的数据没有被记录。
我们的目的是进行深入调查,BMI CPRD录音,包括量化指数数据的完整性,并评估他们的代表性比较基于CPRD数据汇总统计和代表普通人群调查统计。我们还旨在建议和讨论如何处理这些BMI定期收集数据的局限性。
方法
数据源
临床研究数据链接(CPRD
CPRD临床数据库包含匿名计算机化的医疗记录从全科医生(GPs)在英国。大约8%的英国人口目前包括和数据库是具有广泛代表性的英国人。15,16注册医生是几乎所有在英国,17把关和GPs作为卫生系统,以便CPRD数据形成一个全面的医疗记录,包括人口统计信息、临床相关的生活方式的数据,处方细节,临床事件,提供预防保健,专家推荐和住院及其主要结果。数据进行质量检查和实践是指定为“合格”CPRD从指定的日期,他们满足数据输入质量标准。在这项研究中,我们获得一个随机抽取的一百万名CPRD病人,因为完整的CPRD数据库进行分析是计算困难,我们估计的精度下降会产生一千一百万个随机样本通过限制我们的分析是非常小的。
在CPRD BMI指数数据
身高和体重测量记录在CPRD每当测量作为日常保健的一部分。我们获得所有身高和体重记录和计算体重指数(BMI =体重/身高2)。记录没有任何测量或难以置信的测量被排除在外(图1)。
统计方法
BMI CPRD数据的完整性
主要分析、BMI CPRD完整性数据估计了日历时期(1990 - 1994,1995 - 1999,2000 - 2004,2005 - 2011)。计算完整性为特定日历期间,所有个人注册的一百万名样本,年龄≥16年,在“标准”后续实践期间的中点是识别和包含在分母。这些个体之间,分子由那些以往BMI在他们的电子记录无论多久以前进入或那些体重指数可用此日期之前3年。完整性数据生成的年龄段、性别和那些为谁,临床原因,BMI应定期监测(2型糖尿病患者,精神分裂症和其他精神病和≥2近期(6个月)他汀类药物的处方)。我们也调查了完整性是否可以改善通过搜索临床规范(“读码”)表明体重指数类别。我们没有了独联体为这些描述性统计因为样本量抽样误差可以忽略不计(例如,SEs比例与年龄和完整的身体质量指数数据生效子组均< 0.5%)。
比较CPRD BMI与HSE数据数据
我们比较平均BMI /日历时间基于完整的HSE CPRD BMI数据和相关数据,对2003 - 2010年期间(从2003年起,HSE数据调整的情况说明)。CPRD意味着BMI是基于病人注册并在标准的后续生效的中点。我们生产两套CPRD平均BMI统计:首先,我们使用最后BMI观察结转(无论多久以前记录);第二,我们限制我们的研究最近的患者体重指数可用(最多3年之前历年的中点)。如上所述,独联体不了,因为是微不足道的抽样误差(最大SE = 0.02公斤/米2)。与HSE和比较,CPRD数据仅限于英语实践(仅供与HSE数据比较),和平均体重指数年龄标准化的和sex-standardised HSE人口结构。比例分为肥胖(体重指数≥30公斤/米2)随着时间的推移和基于CPRD和HSE数据也比较。
基于模型的归责CPRD最新的BMI的措施
我们探索是否过时CPRD BMI措施可以有效地更新归罪基于模型预测个体层面的体重指数随时间的变化。我们使用数据从个体与多个BMI记录模型预期的变化在体重指数BMI记录以来作为时间的函数(限制与BMI个人记录≤10年除外)。我们安装一个线性回归模型与体重指数变化的结果;主协变量预测体重指数运行时间的变化,这是作为一个三结三次样条允许非线性;我们还包括样条基变量和指标变量之间的相互作用对年龄和性别。可行的加权最小二乘估计是用来允许异方差性。20.
在BMI指定模型改变随着时间的推移,我们首先探讨其性能与至少两个BMI指数进入个体CPRD,通过预测最近体重指数基于前面的BMI记录和运行时间;我们比较错误的分布与错误的分布从这种方法通过使用过去观察发扬光大。然后我们反复比较与HSE意味着每个日历年度指数数据。这次,我们包括所有个人体重指数为记录在前10年,使用上述模型推导出当前BMI在历年的中点预测的变化可用体重指数BMI自上次记录。我们在多个归责框架(使用五个罪名)占建模的不确定性会随着时间而改变。21
结果
BMI CPRD数据的完整性
在1990 - 1994年,37%的人至少有一个先前记录的BMI,和2005 - 2011的比例增加到77% (表1)。The proportion of individuals with a recent BMI (recorded in the previous 3 years) was lower in each calendar-period (35% in 1990–1994 rising to 51% in 2005–2011). BMI completeness generally increased with age up to 75 years, with a lower proportion in the oldest age group having data available. Data for single calendar years are shown in online补充附录表A1和说明相似的模式。身体质量指数数据似乎一直广泛可用的女性比男性(图2)。正如所料,BMI完整性较高特别是临床亚组:总的来说,97%的创纪录的II型糖尿病患者有一个最近的BMI记录,以及超过78%的精神分裂症/精神疾病的诊断(见在线补充附录表A2)。这是符合质量和结果框架(QOF),这鼓励了BMI监测自2004年以来,这些条件。22高BMI完整性也在当前他汀类药物与最近的可用BMI (82%)。
几乎没有额外的信息在临床(“读”)与体重指数相关的代码。75年最新的日历期间,518人没有以前的BMI记录可用,只有1222人(1.6%)有过临床的代码将使分类为BMI类别(体重过轻,普通体重,超重/肥胖)。此外,对于那些以前的BMI,只有一小部分最近的BMI相关信息记录在一个临床代码在最近时期(7675/250 430 = 3.0%)。
摘要统计信息使用完整CPRD BMI与HSE数据和比较
我们发现年龄标准化的BMI和sex-standardised意味着基于CPRD数据一致,大大降低(1.1公斤/米2比HSE)数据(平均BMI CPRD = 25.7公斤/米22003年上升到2010年的26.3,26.8公斤/ m2(95% CI 26.7 - 26.9)和27.3(27.1 - 27.5),分别在HSE;图3)。
BMI条目超过3岁时被丢弃,33 - 47%的患者在生效。然而,估计平均BMI在CPRD相当接近预期的HSE数据的基础上,与CPRD数据低估了HSE统计只有0.04到0.28公斤/米2个人生效和CPRD估计下降在HSE CI的两个最近3年内(平均BMI CPRD = 26.9、27.0和27.0公斤/米2与27.0(26.9 - 27.1),27.0(26.8 - 27.2)和27.3(27.1 - 27.5)在HSE,分别于2008年、2009年和2010年)。Age-stratified和sex-stratified数据展示了类似的模式,除了老大年龄组(75年以上),限制那些最近BMI措施没有带估计体重指数大大接近了HSE数据(请参见图A1在线补充附录)。
我们也比较了比例列为肥胖CPRD与HSE(见在线补充附录图A2)。与前面的分析一致,使用任何先前的BMI阅读分类个人CPRD导致肥胖率低于预期根据HSE数据,同时限制患者最近阅读导致HSE估计肥胖率接近。
基于模型的归责CPRD最新的BMI的措施
BMI的对比总结统计基于最近的措施和基于以往任何措施建议老当前体重指数BMI记录都倾向于低估。因此,我们检查是否可以开发一个模型归咎于当前的BMI,考虑自上次测量的时间。在线性回归模型中体重指数的变化随着时间的推移,我们估计,平均BMI增加BMI后10年期间记录的69岁时的记录和减少随时间在那些70岁或更多(见在线补充附录图A3)。我们测试了我们的模型的预测性能预测基于上一个最近的BMI,患者CPRD BMI与多个记录。当时老BMI是不到3岁,几乎没有获得相比,应用修正带着年长的观察(图4)。然而,当有时间差距,携带前BMI向前倾向于低估了后来BMI,而采用基于模型的归责被低估,导致小错误平均(平均误差=−0.70公斤/米2(差−2.18 + 0.56)使用过去的观察结转,相比之下,+ 0.11公斤/米2(−1.29 + 1.40)使用基于模型的归责)。
然后重复意味着在CPRD BMI与HSE的比较,这一次使用我们的模型体重指数随时间变化为基础执行多个罪名当前BMI基于最新的测量和记录以来的时间。估计平均bmi指数是现在只与那些基于最近的数据在前面的分析中,只有0.04到0.37公斤/米2低于HSE统计个人日历年(图3、圆)。即使有多个归罪,独联体仍极窄(< 0.07公斤/米2)由于样本量大,因此在图中没有显示。值得注意的是,所有患者BMI记录10年前的中点现在感兴趣的是包含在年度评估的“纠正”的意思是;因此,在个人日历年,只有9 - 13%的患者下降,而下降时33 - 47%的患者体重指数记录> 3岁。
讨论
主要发现
BMI完整性增加日历时间(从1990 - 1994年的37%上升到77%在2005 - 2011年)。完整性是高于女性,年龄更大的年龄组和临床亚组记录BMI的鼓励。BMI在感兴趣的日期被分配到单个病人CPRD使用记录,最后无论多久以前进入,我们发现产生的平均BMI CPRD人口的统计数据都低于相当于HSE估计(1.1公斤/米2)。这似乎是由旧系统倾向于低估当前体重指数BMI记录:当只有最近CPRD BMI记录(≤3岁)被使用,平均BMI统计数据更接近HSE的估计。然而,大量的病人完全被排除在年)(33 - 47%。最后,我们提出了一个过程模型在体重指数BMI变化记录,可以让研究人员归咎于BMI在利益和避免大量的日期没有最近的测量分析。
与其他研究相比
很少有类似的研究(见在线补充附录表A2)。然而,患者的比例最近CPRD BMI记录符合QRESEARCH数据库的摘要(类似英国初级护理教育管理信息系统数据库数据来自530多个通用实践使用软件而不是视觉软件)23;注册到2007年3月,58%的16岁以上患者的BMI记录在过去的5年;相比之下,有51%的体重指数为记录在过去的3年我们的分析(2005 - 2011)。类似于我们的研究中,QRESEARCH报告显示完整性的增加随着时间的推移,从2000/2001的42%上升到2007年的58%。在第三个英国初级保健数据库,改善健康网络(薄),新登记的病人的比例在2004年和2006年之间与BMI数据符合我们的发现;62%的患者有高度记录和66%的体重记录在12个月内登记。24
解释研究结果
完整性
随着时间的推移增加BMI的完整性可能反映了一个普遍的趋势鼓励BMI在初级保健记录。更大的BMI完整性女性和老年群体中可能有多种解释包括在初级保健咨询利率上升25,26和不同数据大相径庭的疾病监测BMI是很重要的。
比较CPRD BMI与HSE数据数据
基于CPRD人口的平均BMI低于每个日历年相当于HSE估计BMI在CPRD被分配使用可用的最后记录;然而,当分析仅限于那些最近BMI记录,估计从CPRD接近HSE的估计。这表明,BMI录音的大部分CPRD过时的日期可能是因为研究的兴趣明显低估意味着BMI在CPRD无限制的分析。反过来,这可能意味着个人BMI指数增加随着时间的推移,确实,当我们专门模仿BMI变化随着时间的推移,我们发现一个模式增加BMI与年龄< 70岁,符合前瞻性群组研究BMI与重复测量-;这种模式随着时间的推移增加BMI可能是驱动的具体重量变化,自从成年身高不会大幅改变在这个年龄段。一个简单的调整过时的BMI指数基于我们模仿变化随着时间的推移把CPRD意味着BMI统计符合HSE估计,当我们验证调整患者的一个子集BMI重复测量,我们发现小错误平均而言,相比之下,只是带着过时的BMI记录转发。
值得注意的是,我们观察到CPRD都低估了BMI与HSE≥75岁的人中,即使只使用最近的记录;这可能反映了一个事实,制度化CPRD但不是在HSE患者表示:HSE可能不是一个理想的比较以来这个年龄段老年人机构(在CPRD代表)更有可能是虚弱和bmi指数低于那些生活在私人家庭。
影响
首先,我们的研究结果表明,不同研究BMI完整性可能取决于研究人口和研究期间。BMI数据不可能缺少完全随机(如missingness由病人特征或特殊疾病可能会有所不同)。可能存在数据库中的信息,然而,预测missingness并可以满足所需的“随机缺失”的假设多个归责。研究探索的潜力将丢失的数据在薄发现多个归责后,汇总统计的身高和体重都比得上来自全国代表性数据集的数据。24
第二,我们的分析表明,分配的共同实践BMI状态基于最近的/最近可用的记录感兴趣的索引日期可能导致误分类,考虑到大量的病人只有大大过时的BMI记录可用在任何特定时间。解决这个策略包括限制最近的体重指数,但这可能会排除大量的病人。我们提出另外一个策略基于更新过时的BMI指数BMI的造型变化随着时间的推移,尽管这并非没有缺点:该方法需要一个假设:个人与BMI≥2记录可用(需要估计模型随时间变化)是代表广大的患者,这可能并非如此;也是一个更复杂的策略,尤其是在执行多个归责框架允许调整的不确定性,这可能是实质性的研究样本量较小,比被认为是在这里。其他归责策略也可以认为是在某些情况下,如2倍算法,从纵向背景缺失的数据变量在特定时间点通过相邻数据点。30.最终,各种方法的利弊,以及要使用的最佳策略,可能会依赖于特定的学习和研究人群的特点。
优势和局限性
这里给出的结果是基于一个大从CPRD随机样本;因此,我们可以自信地归纳研究结果对整个CPRD数据库。虽然我们不能假设这些发现将与英国定期收集初级保健数据库基于其他IT系统(CPRD基于实践使用视觉),底层过程驾驶BMI记录可能是相似的。这项研究没有观察BMI儿童录音,因为这将需要不同的策略。完整性在16 - 24岁组可能被人为压低,因为重量记录年龄< 16被排除在外,所以这些低端的年龄不会有尽可能多的时间积累的体重记录。我们认为HSE的最好的比较研究;全国代表性,大样本利用身高和体重记录由一个训练有素的官和情况进行加权。19,31日然而,有一定程度的HSE缺失的数据,这是一个限制。在2010年,超过85%的成年人提供有效的身高和体重的录音采访。29日失踪BMI是最常见的一种原因拒绝(高达8%的失踪是由于拒绝),19如果与BMI状态偏差的估计可能意味着在HSE BMI。我们对比CPRD-based和HSE-based BMI统计数据集中在均值(在线补充附录,列为肥胖比例);这些是主要统计数据发表在HSE趋势表,所以我们不能看的BMI分布更广泛的措施可能会感兴趣的研究人员使用BMI数据上下文中的公共卫生。最后,我们没有试图量化或评论的有用性指数作为衡量肥胖,和研究人员使用BMI数据应该考虑是否最好的测量的目的。
结论
BMI CPRD随时间变化的数据的完整性和以年龄和性别。BMI记录可能会变得过时的随着时间的推移和天真的使用可能会导致误分类的BMI的地位。我们使用3年截止定义一个最近的体重指数;进一步的研究可能包括系统分析的BMI记录多长时间可以被认为是“最新的”,以及这是否不同的病人的特点。BMI状态分配给个人的最优策略研究基于CPRD和类似的电子医疗数据库可能会依赖于具体的研究人群和研究背景。
引用
补充材料
-
补充数据
仅这个web文件已经由英国医学杂志出版集团从一个电子文件提供的作者(年代)和没有对内容进行编辑。
在这个数据补充文件:
- 数据补充1——在线附录
脚注
贡献者KB发达的分析策略,处理和分析数据,写论文。高频参与讨论的数据处理和分析数据,以及论文的写作。LS参与讨论的分析方法来研究和评价分析和论文的写作。ID参与讨论的分析方法来研究和评价分析和论文的写作。DL参与讨论的分析方法来研究和评价分析和论文的写作。
资金这份报告是独立研究起源于博士后奖学金(KB)支持的国家健康研究所(pdf - 2011 - 04 - 007)。ID是由MRC方法论研究奖学金。LS支持威康信托基金会高级临床科学研究奖学金。
相互竞争的利益一个也没有。
伦理批准这项研究是通过伦敦卫生和热带医学学院的伦理委员会。MHRA独立的科学顾问委员会。
出处和同行评议不是委托;外部同行评议。
数据共享声明这个分析是基于一个大型的随机样本的临床实践研究数据链接,由英国提供药物和保健产品监管机构。作者的许可证不允许使用这些数据与第三方共享原始数据。