开发一个模型来预测10年期缺血性和出血性卒中和缺血性心脏病的风险使用中国嘉道理生物
做出评论
看到评论
文摘
背景和目标现代心血管疾病(CVD)的风险预测模型很少应用在常规临床实践在中国由于巨大的地区差异绝对在中国主要的心血管疾病的风险类型。此外,包括血脂在大多数风险预测模型也限制了他们的使用在中国人口。我们开发了10年心血管疾病风险预测模型不包括血脂可能适用于不同地区的中国。
方法我们派生性别模型分别对缺血性心脏病(IHD)、缺血性中风(是)、出血性中风(HS)除了总心血管疾病在中国嘉道理生物。参与者的年龄30 - 79年没有在基线心血管疾病。预测因子包括年龄、收缩压和舒张压、使用降血压治疗,目前每天吸烟,糖尿病,和腰围。总CVD风险组合的条件概率使用3子的预测风险。风险模型在每个地区调整2方法(实际和理想)和风险预测估计前后调整。
结果模型推导过程涉及489596人,其中包括45947 IHD, 43647,和11168 HS病例在11年的随访。在女性中,哈勒尔C为0.732 (95% CI 0.706 - -0.758), 0.759(0.738 - -0.779),和0.803 (0.778 - -0.827)IHD,和海关。总CVD哈勒尔C为0.734(0.732 - -0.736),0.754(0.752 - -0.756),和0.774(0.772 - -0.776)模型校准之前,实际校准后,在理想的校准。校准性能改进校准后,模型理想校准后显示表现最好的模型。男性的结果与那些为女性。
讨论我们的心血管疾病风险预测模型取得了良好的歧视IHD总心血管疾病和中风亚型除了不包括血脂。灵活的调整我们的模型对不同地区能够更广泛使用使用居民健康档案覆盖整个中国人口。
证据的分类这项研究提供了类我证据表明预测模型结合临床变量访问预计10年期IHD的风险,,商品在中国人口年龄30 - 79年。
术语表
- CKB=
- 中国嘉生物;
- 化学汽相淀积=
- 心血管疾病;
- 菲律宾=
- 舒张压;
- 人力资源=
- 风险比;
- 海关=
- 出血性中风;
- icd -=
- 国际疾病分类,十修订;
- 我=
- 脑内出血;
- 伊迪=
- 集成歧视改善;
- 胆道=
- 缺血性心脏病;
- 是=
- 缺血性中风;
- NBPHSP=
- 国家基本公共卫生服务项目;
- RHR=
- 居民健康档案;
- 长官=
- 蛛网膜下腔出血;
- SBP=
- 收缩压;
- WC=
- 腰围
心血管疾病(CVD),包括缺血性心脏病(IHD)、缺血性中风(是),和出血性中风(HS),是全球疾病负担的主要原因。1风险预测模型是重要的早期干预的工具来识别高危人群心血管疾病的一级预防。尽管许多模型的可用性促使研究人员专注于调整和改进现有模型在当地居民,2目前还没有模型,该模型同时具有以下特点,可以广泛应用于中国人。
首先是区分是与海关之间的风险。中国人口的HS发生率远高于西方人群。1然而,目前推荐的模型在世界范围内,包括中国,要么不包括海关的结果3,4或者从商品没有区别。5,- - - - - -,9
第二是实现高效和广泛使用的风险预测模型链接到动态的电子健康记录。3,6,10,- - - - - -,12在中国,建立居民健康档案(rhr)的一个国家基本公共卫生服务提供的基本服务项目(NBPHSP)自2009年以来,覆盖整个人口在中国大陆。免费rhr整个人口包括社会人口信息、个人和家庭病史、生活方式,和无创性体格检查(如身高、体重、腰围(WC)和血压)。免费提供血液胆固醇测量只是≥65岁的人。但是,先前的模型主要是依靠血脂。3,- - - - - -,7,9
第三是广泛适用于不同的地区。不同的心血管疾病的风险因素估计子类可能不同或有不同的影响。13,- - - - - -,15了一个模型,预测的风险组合的结果(单模估计,如总CVD),协会的大小(即。,regression coefficient in the model) might be affected by the composition proportion of each CVD subcategory in the derivation dataset, leading to potentially biased estimations. Therefore, considering that the absolute risks of 3 CVD subcategories vary substantially among different regions in China,16以前的风险预测模型基于单模方法不太适用于广泛领域。3,- - - - - -,7,9为了解决这个问题,世界卫生组织心血管疾病风险图工作小组提出了一种新的建模和校准方法来帮助适应不同地区的原始模型。8
基于中国嘉生物(CKB),全球最大的以人群为基础的群组之一,本报告主要旨在发展务实的特定疾病和总体心血管疾病风险预测模型基于广泛使用的变量在中国科技,覆盖IHD,,海关。接下来,我们评估2模型校准方法的基础上,提出的方法CVD风险图表工作组模型适应不同地区。我们进一步评估的潜在增量价值派生模型预测。
方法
研究人群
CKB是一个持续的前瞻性研究的512725名参与者年龄30到79年入学从5 5城市和农村地区位于东北、西北、西南东,南,中国在2004 - 2008。研究区域选择根据当地疾病模式,暴露于危险因素,人口稳定,死亡和疾病登记质量,和当地的承诺和能力。每个研究区域内,所有潜在的合格的参与者在100 - 150年农村或城市居民委员会被邀请参加调查。估计数量的反应率为30%(26%的-38% 5 5城市地区的农村地区和16% - -50%)。研究描述了其他地方的细节。17简而言之,所有参与者有效的基线数据,包括一个完整的项访谈式laptop-based问卷和物理测量由训练有素的卫生工作者使用校准仪器和标准协议。10毫升随机收集血液样本为每个参与者记录的最后一顿饭的时间。
研究设计
在这项研究中,涉及4个相互关联的组件(图1):(1)预测筛选我们选择几个从候选人的预定义列表变量预测模型推导;(2)模型的练习然后派生性别outcome-specific 10年心血管疾病风险预测模型中参与者没有CVD在基线;即CKB-CVD模型;(3)演示模型recalibration-to支持灵活的派生模型的更新,我们比较2的校准方法;(4)评价模型updating-based派生模型,我们进一步评估心血管疾病的危险因素的预测效用,并不包括在模型推导过程。
候选人的评估预测
我们预定义16候选预测(eTable 1,links.lww.com/WNL/B915)根据以下标准模型推导:(1)建立或可能的心血管疾病的危险因素;(2)在rhr广泛使用;和(3)中可用CKB基线调查。其他心血管疾病的危险因素,没有广泛使用在rhr (eTable 1)被用来探索能够提高模型派生的。
基线调查问卷收集信息社会人口特征、生活方式行为,饮食习惯,个人和家庭病史。所有的参与者被要求“你多久现在吸烟?”;4回答选项(1)现在不抽烟,只是偶尔(2),(3)大多数日子里,每天和(4)。目前每日吸烟者被定义为那些(4)回答,收缩压(SBP)、舒张压(菲律宾)基线测量使用ua - 779数字血压计。14至少5分钟后测量了坐,重复两次。如果2测量SBP超过10毫米汞柱,测量了三分之一。只有最后2读数记录和平均进行进一步分析。使用降血压治疗受到了参与者的自我报告和回答“是的”被定义为“你的诊断高血压还在治疗吗?”或“你采取任何药物来降低血压在过去2天?”History of diabetes was defined as self-reported diabetes diagnosed by a physician before the baseline survey. We did not use random blood glucose measurements as our previous study did because of its limited availability in China.18WC测量中途髂骨和低肋缘最后正常的过期使用灵活的塑料带最近的0.1厘米。其他候选人的评估和定义预测eTable 1所示(links.lww.com/WNL/B915)。
确定的结果
所有与会者都跟进事件疾病的结果,因为他们登记在基线。事件事件被确定通过连杆与当地疾病和死亡注册中心和国家健康保险系统,辅以积极随访。17追踪损失< 1%审查之前12月31日,2017年。训练有素的工作人员蒙蔽基线信息使用icd - 10编码的所有事件。在这项研究中,IHD事件包括致命或非致命的心绞痛(I20),心肌梗死(I21-I23),和其他死因(I24-I25);是事件包括致命或非致命的脑梗死(I63);HS事件包括致命或非致命的蛛网膜下腔出血(SAH)或脑出血(我)(I60-I62)。未指明的被编码为I64中风事件。总CVD被定义为致命或非致命的死因和中风(I20-I25 I60-I64)。自2014年以来,医疗记录事件胆道和中风的病例检索和审查合格的心血管专家盲基线风险的患者。2018年10月,33515年的医疗记录检索IHD案例中,34758年是情况下,和5023 HS情况下,诊断的确诊率分别为87.9%,91.5%,80.4%,IHD, HS,分别。
统计分析
Cox比例风险模型被用来开发预测模型,分层10研究区域和时间用在学习上的时间尺度。时间在研究时间从基线到第一个以下:第一诊断心血管疾病,死亡,追踪损失,或2017年12月31日。所有分析分别为男性和女性。歧视哈勒尔C数据访问的性能。19校准性能评估图形通过比较平均预测风险与观察到的10年风险十分位数的预测风险。的Nam-D帮测试被用来量化合适的协议。20.
预测选择组件的基本模型包括4的心血管疾病的危险因素预测:基线年龄(年),SBP(毫米汞柱),目前每日吸烟(是或否),和历史的糖尿病(是或否)。年龄和其他3预测因子之间的相互作用也被包括在内。8基于相对综合歧视改善(伊迪)总心血管疾病风险预测模型,213的附加predictors-use降血压治疗(是或否),菲律宾(毫米汞柱),和WC (cm) -也选择模型推导(eMethods eTables 2和3,links.lww.com/WNL/B915)。
在模型中派生组件,我们开发了模型分别对胆道,是和HS (CKB-CVD模型的子模型;图1)允许单独调整针对疾病的发病率在不同的地区。预测因子包括上述7个变量和年龄和其他6个变量之间的相互作用。在推导模型之前,所有连续变量的对数转换的必要性是检查,因为自然对数处理连续变量是最常见的方法在之前的风险预测模型。5,7最后,所有连续变量被建模为简单的线性形式,集中(年龄在55年,SBP在120毫米汞柱,80毫米汞柱,类似与WC 80厘米)提供一个更简单的解释模型的回归估计和便于调整。3,6,8比例风险假设被评估策划了Schoenfeld残差与时间。不存在或最小偏差被观察到。基线估计在10年的生存0池[10])估计的年代0(10)跨区域加权的情况下发生的10年。8为了避免过度拟合,我们使用了一个内部交叉验证的方法,每个地区的模型推导和计算验证哈勒尔C。22心血管疾病风险总量的条件概率使用计算的预测风险3子(组合模型):也就是说, 。8我们检查了独立假设的风险3 CVD子类通过考虑竞争风险。8
模拟过程中应用CKB-CVD模型在不同地区,分别执行模型校准10研究区域。我们理想的性能指标计算假设观察10年期风险在每个研究地区的可用性(理想校准)。然而,在实践中,观察到的10年期风险的目标人群是很难获得的。校准过程中还可以使用不同年龄组(5年年龄段)和性别的意思是心血管疾病的危险因素水平,年发病率估计每个研究区域(实际调整)(eMethods,links.lww.com/WNL/B915)。8模型校准前后的性能评估在整个推导过程数据集和每个研究区域。我们也评估模型校准前后的性能在参与者< 65和≥65岁,有或没有高血压,和没有糖尿病。
我们进一步探讨是否剩余的预测(eTable 1,links.lww.com/WNL/B915)可以用于更新CKB-CVD模型在未来。我们添加了每个单独预测和评估其相对伊迪为每个主要的心血管疾病亚型,正如我们在上述预测选择组件。
本研究坚持三脚架(透明报告个人的多变量预测模型预测或诊断)陈述报告。23分析了占据15.0。使用R 3.6.0数据产生。
标准协议的审批、登记和病人同意
CKB道德伦理审查委员会的批准了中国疾病预防控制中心(中国,北京)和牛津热带研究伦理委员会,牛津大学(英国)。所有参与者提供书面知情同意的形式。
结果
研究人口的概述
这项研究包括302522名女性和210203名男性人口30 - 79岁的基线调查。参与者被诊断出患有胆道(n = 15472)或中风(n = 7657)前的基线调查被排除在派生的数据集(图1)。没有参与缺失的数据模型推导过程中使用的主要预测因子。剩余的489596名参与者的平均年龄52年(25 th -第75百分位43-60)对女性和男性50年(42-58)(表1)。在11年的随访中,86464(17.7%)参与者CVD事件,包括45947年的死因,43647,和11168 HS事件。标准化的10年期3 CVD子类的风险不同地区之间是有差别的(eFigure 1,links.lww.com/WNL/B915)。
新派生CKB-CVD模型
七个预测因子分别推导出性别CKB-CVD模型用于3 CVD子类(表2)。调整风险比率(小时)的预测不同在不同性别和不同的CVD子类。例如,小时(每10毫米汞柱)类似的范围从1.05 (95% CI 1.04 - -1.07) IHD的女性为1.33 (1.29 - -1.38)HS男性;小时的WC(每10厘米)范围从0.92(0.89 - -0.95),海关在女性1.16 (1.14 - -1.17)IHD的女性。回归系数为每个预测提供了eAppendix 1 (links.lww.com/WNL/B916)。一个例子风险计算eMethods所示。独立的假设3 CVD子类的风险并不违反(eFigure 2)。HS子模型有最好的歧视表现在内部验证(图2)。校准的表演3子很穷在大多数研究区域(eFigure 3)。在敏感性分析中,我们推导出模型分别对我来说,β系数的类似HS模型(eTable 4)。
至于组合模型调整(原始模型在以下)之前,哈勒尔C女性为0.734 (95% CI 0.732 - -0.736)和0.743(0.741 - -0.746),男性派生的数据集(图3),从0.705(0.701 - -0.710),女性在哈尔滨至0.804(0.795 - -0.813)女性在苏州(eFigure 4,links.lww.com/WNL/B915)。校准是派生的数据集(可怜的图3)和大多数研究区域(eFigure 5)。
CKB-CVD的校准模型
实际校准后,哈勒尔C增加到0.754 (95% CI 0.752 - -0.756),女性男性和0.764(0.762 - -0.766),和校准改善两性的派生数据集。模型理想校准显示最好的模型表现(图3)。哈勒尔在每个研究区域实际校准后几乎保持不变,理想的调整(数据未显示)。校准性能改进后几乎所有研究地区理想的调整和研究区域实际校准后的一半。城市地区的数量和提高实际校准后校准性能高于农村地区(eFigure 5,links.lww.com/WNL/B915)。实际校准eMethods所示的一个例子。我们还提供一个交互式10年心血管疾病风险计算器,计算器的实际调整措施eAppendix 1 (links.lww.com/WNL/B916)。
歧视的原始模型降低患者老年(≥65岁),有高血压,或患有糖尿病,尤其是老年妇女(哈勒尔C 0.584, 95%可信区间0.579 - -0.589)(eFigure 6,links.lww.com/WNL/B915)。单独调整每个研究地区改善这些参与者之间的歧视和校准(eFigures每晚睡7 - 9)。
证据的分类
这项研究提供了类我证据表明预测模型结合临床变量访问预计10年期IHD的风险,中国人口,商品30 - 79岁。
讨论
在中国这个大人群为基础的队列,我们开发了务实的性别风险模型,预测10年心血管疾病分类和总体心血管疾病的风险。考虑到商品的高负担在中国人口,我们的模型区分中风亚型和中国应该更适用于比先前的模型。模型取得了良好的歧视的风险群体,即使没有使用血脂信息,表明基于科技的一个潜在的更广泛地使用。灵活的模型更新方法提高了模型在不同地区使用时性能。
两个心血管疾病一级预防指南中国个人推荐两个10年心血管疾病风险预测模型作为风险评估工具:一个来自中国Multi-provincial队列研究(cmc)和其他来自China-PAR项目。25,26两个组别的追踪损失21.3%27和9.9%,7分别根据PROBAST可能增加的风险的偏见。28同时,两种模型依赖于血脂、硬IHD作为结果,不考虑商品单独的风险。4,7很少有研究衍生商品的危险预测模型。执行一项研究在4400年一小群中国钢铁工人招募了1980年之前,只有33 HS派生事件的数据集。29日另一个使用3以人群为基础的群组研究来自美国和荷兰和颅内出血(ICH)包括325事件。30.至于IHD,先前的研究已经报道,心绞痛患者预后也很差。31日同时努力胆道和软中风的风险预测模型中可能导致误解的用户。因此,符合QRISK3和预测,3,6我们在高危人群筛查包括这种结果。
大多数先前的模型只包括SBP预测。在最近的研究中,基本类似的HS模型大大提高了预测能力。虽然相对IHD的伊迪和子很小,category-free净重新分类的改进是> 10%和> 5% IHD的两性(数据没有显示)。身体质量指数是包括作为一个预测non-laboratory-based模型。8然而,它并没有提高预测能力WC的我们的分析(预测选择组件),与China-PAR项目的发现一致。7因此我们预测因子包括菲律宾和WC,鉴于其增量值结果预测和广泛的可用性在中国的科技。我们的模型使用自我报告预测糖尿病史,与rhr的做法一致。尽管将近一半的未确诊的糖尿病病例被排除在我们的群,只增加筛查出糖尿病导致最小改善3子。
老年人和患有高血压或糖尿病在中国是医疗服务的主要用户。我们检查模型表现这些特点,发现模型分层最低歧视个体年龄≥65岁。这主要是由于年龄的降低贡献模型分析仅限于老年人。先前的模型对年长的人来说,使用传统的心血管危险因素预测,通常也有哈勒尔C低于0.65。32因为额外免费的血液测试NBPHSP可供老年人,有承诺提高风险预测老年人通过添加更多的预测因子。
有显著差异的校正性能的原始模型在不同的研究区域,包括三个子和结合CVD风险模型。这一发现表明,之前普遍心血管疾病风险预测模型可能会遇到同样的问题,当应用到中国的不同地区,突出模型校准的重要性。理想的调整是不容易实现,因为需要长期随访获得观察10年期风险。CVD风险图工作小组提供了一个灵活的调整方法(即基于代表性的人口数据。在我们的研究,实际调整)。8目前的研究表明,谁提出的调整方法是有效的。然而,仍有一个实用的校准和理想校准之间的差距。一个可能的解释是,参与者的数量每5年年龄段为每个研究区域相对较小,导致错误估计的平均风险因素水平和年度发病率的疾病。我们假设如果一个大型和代表的人口被用来估计调整措施,实际校准的影响将更接近理想的校准。然而,进一步的研究是必要的。
本研究人口特别大。追踪损失是<全球审查日期前1%。超过100000 CVD事件记录在11年的随访。未指明的中风仅占1.4%,1.2%的男人和女人第一次中风事件。这些优势使我们获得风险预测模型分别为3 CVD子类并获得强劲的系数估计。我们的模型有可能被广泛使用,因为容易获得预测从中国的科技。在这项研究中使用的校准方法允许灵活的更新我们的模型在不同地区在中国。我们提供了一个计算器的实际调整措施(eAppendix 1,links.lww.com/WNL/B916)和统计代码所需的计算模型33支持模型更新。
一些局限性值得考虑。首先,独立样本进行外部验证模型从当地居民是最好的我们的模型调整他们的心血管疾病发病率和危险因素水平和评估预测性能。然而,缺乏其他地区群中年和老年人与足够大的样本容量和包括> 10年的随访在中国限制了选择一个有效的外部验证。随着更多的区域的发展军团发起的中国精密医学倡议和地区电子科技系统自2010年代中期以来,进一步验证和更新我们的模型是必要的。第二,作为一个人口基数,旨在跟踪很长一段时间,CKB并非设计为在中国一般人群的代表。尽管如此,包含相当数量的参与者来自中国不同地区和不同社会人口特征使研究提供健壮的回归系数,适用于广泛的人群。当模型应用到其他地区,重新调整过程基于局部发病率和危险因素水平有助于提高模型的适用性。第三,SAH只占一小部分的中国人口,所有商品情况34CKB与相应的比例< 10%,从而排除我们推导健壮SAH模型分别。35我们选择礼物HS模型没有区分我和长官在我们主要分析由于ICH-specific系数模型几乎没有改变。
基于一个大人口基数的中国成年人,我们开发了10年期IHD的风险预测模型,是海关,他们的组合结果可能更广泛适用于rhr NBPHSP的中国。本研究考虑到了HS和大量的高负担地区差异在中国绝对主要的心血管疾病的风险类型和派生模型可以适应不同地区的中国人。
研究资金
这项工作得到了国家自然科学基金(82192904、82192904和82192904)。CKB基线调查和第一批re-survey支持香港嘉道理慈善基金会的资助。长期随访是支持由英国威康信托基金会(212946 / Z / 18 / Z 202922 / Z / 16 / Z 104085 / Z / 14 / Z 088158 / Z / 09 / Z)和中国国家重点研发项目的资助(2016 yfc0900500),中国国家自然科学基金(81390540)和中国科技部(2011 bai09b01)。吊杆贝内特是支持的国家健康研究所的生物医学研究中心牛津。陈均是由英国医学研究理事会的支持。
信息披露
作者报告没有披露相关的手稿。去首页Neurology.org/N为充分披露。
承认
作者感谢研究参与者,该调查小组成员的10个区域中心,和项目开发和管理团队在北京,牛津,10个区域中心。
附录1的作者
附录2 Coinvestigators
脚注
去首页Neurology.org/N为充分披露。资金信息和披露认为作者相关的,如果有的话,年底提供这篇文章。
这篇文章加工费由作者。
类的证据:NPub.org/coe
- 收到了2021年6月10日。
- 接受的最终形式2022年1月18日。
- 版权©2022年作者(年代)。发表的Wolters Kluwer健康,公司代表美国神经病学学会。首页
这是一个开放的分布式根据文章知识共享归属许可4.0 (CC),它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。
引用
- 1。↵
- 2。↵
- 3所示。↵
- 4所示。↵
- 王米,
- 刘J,
- 赵D
- 5。↵
- 安德鲁斯B,
- 拉卡耶不能确定D
- 6。↵
- 7所示。↵
- 8。↵
世界卫生组织心血管疾病风险图表工作组。世界卫生组织心血管疾病风险图表:修正模型来估计全球21个地区风险。柳叶刀水珠的健康。2019年;7:e1332- - - - - -e1345。
- 9。↵
SCORE2工作组和ESC心血管风险的合作。SCORE2风险预测算法:新模型来估计在欧洲10年心血管疾病的风险。心欧元J。2021年;42:2439年- - - - - -2454年。
- 10。↵
- 11。↵
- 海明威H,
- 菲德尔GS,
- 菲茨帕特里克NK,
- Denaxas年代,
- 沙阿广告,
- Timmis广告
- 12。↵
- 13。↵
- 14。↵
- 莱西B,
- Lewington年代,
- 克拉克R,et al。
- 15。↵
- 陈Z,
- 爱奥那岛一个,
- 教区年代,et al。
- 16。↵
- 17所示。↵
- 18岁。↵
- 19所示。↵
- 20.↵
- 达RB,
- 不结盟运动b - h
- 21。↵
- 22。↵
- 23。↵
- 24。↵
中国嘉生物合作组。中国嘉生物。2022年4月26日通过。https://www.ckbiobank.org/site/。
- 25。↵
该方针的联合特遣部队在中国心血管风险的评估和管理。指导心血管风险的评估和管理在中国。下巴J上一页。2019年;53:13- - - - - -35。
- 26岁。↵
中国医学协会中国心脏病学会,心血管疾病预防和康复委员会中国康复医学协会,心血管疾病委员会中国老年学和老年病学协会,血栓形成预防和治疗委员会中国医师协会。中国指南在心血管疾病的一级预防。下巴心功能杂志。2020年;48:1000年- - - - - -1038年。
- 27。↵
- 28。↵
- 29。↵
- 30.↵
- 31日。↵
- 32。↵
- 范Bussel英孚,
- Hoevenaar-Blom国会议员,
- Poortvliet驾驶台,et al。
- 33。↵
- 杨年代
- 34。↵
- 35。↵
- 陈Y,
- 莱特N,
- 郭Y,et al。