条文本
文摘
目标最优的方法从电子健康记录标识哮喘患者在初级保健尚不清楚。本研究的目的是确定的阳性预测值(PPV)不同算法使用临床规范和处方数据,以确定英国哮喘患者临床实践研究数据链接(CPRD)。
方法684名参与者注册全科医生(GP)实践导致CPRD 2013年12月1日至2015年11月30日8个预定义的潜力的选择根据一个哮喘识别算法。一份问卷被送到GPs确认哮喘状态并提供额外的信息来支持一个哮喘的诊断。两个研究医生独立审查和裁决问卷和附加信息形成哮喘诊断的金标准。PPV为每个算法计算。
结果684份问卷被派,其中494(72%)和475年(69%)返回完整的分析。所有五个算法包括特定的阅读代码表明哮喘或非特异性阅读代码伴随着附加条件表现良好。只使用一个特定的哮喘哮喘诊断的PPV代码是86.4% (95% CI 77.4%到95.4%)。额外的信息在哮喘药物处方PPV(83.3%)、可逆性的证据测试(PPV 86.0%)或结合这三个选择标准(PPV 86.4%)没有PPV导致更高。使用非特异性哮喘编码算法,信息可逆性测试和呼吸系统药物使用得分最高(PPV 90.7%, 95%可信区间(82.8%到98.7%),但有一个低得多的可识别的人口。算法基于哮喘症状规范ppv较低(43.1%到57.8%)%)。
结论哮喘患者可以从英国初级护理记录准确地确定使用特定阅读代码。的肺量测定法或哮喘药物算法精度没有明显改善。
道德和传播这项研究的协议是独立的科学咨询委员会批准的直接督导下MHRA数据库研究(协议number15_257)和经批准的协议是可用在同行评审期刊和评论家。一般伦理批准观察研究使用CPRD和批准直接督导下被授予由卫生研究机构研究伦理委员会(东Midlands-Derby REC参考号码05 / MRE04/87)。
结果将提交出版,并将通过研究会议和传播的同行评议期刊。
- 哮喘
- 验证
- 电子健康记录
- 阳性预测值
- 流行病学
这是一个开放的分布式条依照Creative Commons归因的条款(4.0)CC许可,允许别人分发,混音,适应和发展这项工作,为商业使用,最初的工作是提供适当的引用。看到的:http://creativecommons.org/licenses/by/4.0/
来自Altmetric.com的统计
本研究的优点和局限性
本研究描述了算法来确定从临床实践研究哮喘患者数据链,一个大型电子健康记录数据库,和措施的阳性预测值算法。
支持信息,包括门诊转诊信,其他急诊科放电信件,气流测量和射线照相法记录被用来识别患者哮喘和计算测试措施。
黄金标准计算阳性预测值(全科医生(GP)问卷调查和审查,研究医师)并不是绝对的,即使采用了二级护理的信息。
GPs复杂的医疗病史的患者可能不太可能返回的问卷,但是报酬让这变的不太可能。
背景
哮喘是最常见的慢性疾病之一,据估计全世界2.41亿人患病率与哮喘。1英国哮喘患病率和死亡率最高的国家之一在欧洲。2 3这种疾病是一个很大的负担国家健康服务,与540万人接受治疗,每年大约有65 000人住院。4咳嗽、喘息、呼吸困难、胸闷是其核心症状5但它有多种不同的表示。6
电子健康记录(EHR)采取了在世界范围内,促进建设大型人群为基础的病人数据库,可用在过去几十年的流行病学研究。7验证基于代码的诊断或结果记录在电子医疗纪录是必需的,因为它们的准确性是不确定的,这可能会影响后续的观察性研究的信度和效度。研究质量的电子医疗纪录可能产生争议,除非他们的数据是为特定的研究目的进行验证。8 - 11
哮喘的诊断依赖于临床判断基于病历、体格检查和确认的变化或可逆性气流阻塞使用气流测量。这可能很难评估哮喘诊断的准确性EHR-based流行病学研究的一些症状和气流测量可能不会被记录下来。此外,个人影响哮喘可以有很大区别在他们的表现和症状有时类似于其他呼吸道疾病如慢性阻塞性肺疾病(COPD)。12日13
本研究的目的是测试不同方法识别的准确性在英国哮喘临床实践研究数据链接(CPRD)使用阳性预测值(PPV),通过比较数据库记录的黄金标准由审查由两个研究医生基于全科医生提供的信息(GPs)患者的哮喘。
方法
数据集
CPRD是一个大型英国初级保健数据库包含匿名数据的人注册与初级保健实践来自英国。CPRD代表英国的人口年龄和性别。14日15CPRD内,诊断准确性已经证明高很多条件和疾病,包括慢性阻塞性肺病。16 - 19CPRD包含详细的临床诊断信息,处方,实验室测试,症状和医院推荐,除了基本的社会人口医生记录的信息。这些GPs作为初级保健提供者和其他国家卫生服务服务的把关,从其他卫生保健提供者和信息也传播回GP。临床事件和诊断编码为阅读代码,一个字典的临床术语广泛应用于英国国家卫生服务的初级和二级保健提供者。验证研究援助,确保信誉和质量CPRD的流行病学研究。10
入选标准
研究人群包括记录阅读代码的人表示可能的哮喘前2年索引日期(2015年12月1日),在全科医师注册会议CPRD质量标准。读代码包含在列表补充附录1和在网上http://datacompass.lshtm.ac.uk/236/.%20之前的数据收集计划指标进行测试和参考标准。选择这个时间间隔的几个原因:克服潜在的变化随着时间的哮喘诊断和质量记录;减少数据库记录是过时的机会;并确保医疗记录仍可用GPs。人确定随机专门基于八个预定义的算法之一,这意味着我们填充算法导致最小的人口第一,随后这些人从队列中删除,以防止他们还被选为另一个算法。我们随机选择800可能的哮喘病例进行验证。其中,116例哮喘病例被排除在外,因为他们的GPs与当时CPRD不再参与问卷发送到临床医生进行验证,如图所示图1。因为CPRD变化的数据治理研究开始后不可能选择置换的病人。
补充材料
全科医生问卷
CPRD寄一两页的问卷的GPs人选择包含如上所述,请求确认当前哮喘诊断和额外的信息来支持这个诊断。这个问卷可以在网上找到补充附录2。调查问卷是为了确定的诊断哮喘诊断和检验日期。可逆的气道阻塞的问题包括证据,目前症状、吸烟史、呼吸道并发症和质量结果框架(QOF)指标。QOF是一个国家金融激励方案,以全球定位系统(GPs)在英国鼓励普通疾病指标测量和记录。哮喘是一种包括疾病,其指标包括气流测量和干扰工作,晚上休息。20.
补充材料
具体信息可以从医疗记录包括肺量测定法打印出来和医院呼吸门诊字母也要求。数据加密两次以确保匿名性,实践和CPRD之间也从CPRD研究者。问卷调查被认为是无效的,如果是返回空白或每个问题回答“未知”。
代码列表和算法
医疗列表代码(代码)视为特异性和非特异性哮喘基于研究医生的意见是研究开始之前创建的。读代码层次临床编码系统,是用于惯例在英国和全科医生为一个计算机程序,称为输入的愿景。每个读代码与一个特定的字符串的文本,这是指单一的诊断或症状。然后将这些数据上传的CPRD后加工和质量检查。代码列表用于特定的或明确的哮喘代码和非特异性或可能的哮喘代码可以在网上找到补充附录1。
读代码的组合列表,可逆性测试和呼吸系统药物使用的证据被用来弥补八算法。前四个算法需要一个特定的哮喘诊断代码,与前三个要求额外的文档组成的呼吸系统药物的使用和/或可逆性测试的证据。第五个算法需要一个非特异性哮喘呼吸系统药物和可逆性的代码和额外的文档测试;最后三个算法所需的呼吸道症状代码表明哮喘症状和其他信息。肺量测定法的存在包含在一个算法是基于一个特定的存在肺量测定法记录,而不是考试的阅读代码表示肺量测定法,尽管肺量测定法的痕迹在哪里提供附加信息的一部分,他们检查。可逆性的证据只测试是指气流测量或试验的治疗是否完成,并没有反映出这些测试的结果。呼吸系统药物的使用被定义为至少两个处方吸入型哮喘治疗哮喘的药物治疗(短效beta-agonists、长效beta-agonists和吸入糖皮质激素)在365天内,在2年内在索引日期之前。从预期的最具体最敏感,八算法构造如下:
特定的哮喘读代码+可逆性的证据测试(肺量测定法,变量呼气流速峰值或试验治疗)+呼吸系统药物
特定的哮喘代码+可逆性测试的证据
具体代码+呼吸哮喘药物
特定的哮喘代码只
非特异性哮喘代码+可逆性测试+呼吸系统药物的证据
哮喘症状(喘息、呼吸困难、胸闷、咳嗽)+可逆性测试+呼吸系统药物的证据
哮喘症状+可逆性测试的证据
哮喘症状+呼吸系统药物
主要的结果
诊断为哮喘的主要结果是确认每个的八个预定义算法。哮喘的诊断的金标准是裁决哮喘状态达成的两个研究医生,呼吸内科医生和全科医生回顾了所有的问卷调查和证据独立从病人的医生。评审人员对代码列表/算法也不清楚。意见不同,病例讨论和协议达成的共识。算法的评估医生不知道一个人被选中。
统计分析
PPV的计算使用的比例情况下被每个算法被确认为实际案例研究医生通过问卷调查和证据的审查。进行了分析使用占据v 14.0。
病人只能贡献为主要分析一个算法。在事后分析,个人可以放置到多个算法尽可能减少CI。PPV的分析计算了所有人一个特定的哮喘代码与一个特定的哮喘组相比代码和附加信息。我们还进行了灵敏度分析,检查患者的年龄和性别问卷是否返回类似于患者的年龄和性别的问卷是不发送或没有反应。这项协议是包含在网上补充附录3。
补充材料
样本大小的计算
有116名患者,无法评估,精度预计将略低于原来的样本大小的计算。然而,PPV百分比差异0.13是显而易见的,样本容量60 /算法(假设PPV = 0.85,α= 0.05和权力= 0.8)。
结果
共有800个潜在的哮喘病例选择验证,其中116例有迁移的数据库发送的问卷。剩下的684例中,有494返回的问卷调查。19返回的问卷调查被认为是无效的。因此,获得有效问卷475份,获得响应率为69.4%(475/684)使用实践,可以回答作为分母,如图所示图1。之间的时间间隔邮寄问卷调查和审查的研究医生不同,但是这些时间间隔大于8个月。
返回的475名患者的基线特征有效问卷所示表1。研究人群大多是中年,从不吸烟者和女性。有97的人吸烟状态没有填写问卷。大多数的差异特点被认为在大多数算法。
显示在八的ppv算法表2。
算法包含特定或非特异性的ppv哮喘代码算法1 - 5(从83.3%到90.7%)明显高于ppv的算法基于哮喘症状(从43.1%到57.8%不等)。特定代码的组合和哮喘药物处方和/或证据的可逆性测试(PPV从83.3%变化到86.8%)没有显著增加了PPV单独与一个特定的哮喘代码(PPV 86.4%)。最高的PPV被发现在第五算法结合非特异性哮喘代码与可逆性测试和哮喘药物使用的证据。然而,患者可识别该算法的总数(n = 33 280)还不到五分之一的可识别的第四个算法组成的一个特定的哮喘代码仅133 (n = 188)的选择时间。我们没有检查非特异性哮喘代码的有效性。
事后分析,个人被放置在他们能胜任每一个算法。在这个分析中,我们发现使用附加信息的证据可逆性测试或在代码算法与特定的哮喘药物再次PPV没有显著增加。所有人一个特定的哮喘的PPV代码和信息可逆性测试或药物为86.7% (95% CI 83.3%到90.1%),个人只有一个特定的PPV哮喘代码为86.4% (95% CI 83.0%到89.7%)。
当验证记录可能的哮喘与黄金标准的基础上,研究医生的医生提供的额外的证据,PPV稍微改善了所有算法。图2不同算法的演示了PPV诊断病人的医生和研究医生(整体κ= 0.81)。
没有相当大的患者之间的年龄或性别差异调查问卷返回病人的问卷并没有发出(年龄:p = 0.74,性:p = 0.73)或者是没有响应(p = 0.50岁性p = 0.13)使用χ²测试。
讨论
我们测试了8算法识别的准确性哮喘在CPRD使用黄金标准建造使用两个研究医生的共识。PPV最高的算法,包括非特异性结合的哮喘代码,可逆性的证据测试和多个哮喘处方1年内(PPV 90.7, 95% CI 82.8 0.98.7)其次是结合特定的哮喘代码,可逆性的证据测试和1年内多个哮喘处方。PPV的CI与CIs的PPV的前四个算法基于特定哮喘代码,所以的差异可能是由于单独的机会。PPV最低的算法包括哮喘症状和可逆性的证据测试(PPV 0.43, 95%可信区间0.30到0.55)。这种验证研究的结果表明,临床基于代码的算法使用哮喘码来标识哮喘病例有很高的ppv(在0.84和0.91之间)。在这个数据集,一个特定的哮喘代码算法单独出现充分识别当前从CPRD哮喘患者。作为药物使用的额外的需求和证据的可逆性PPV测试没有出现显著增加,个体的总数可能被包括在研究从33 280年到188年增加133人选择时期(2013年12月1日至2015年11月30日)。哮喘病患者的可识别的总人口是因此更大当只使用特定的哮喘代码标识。
与先前的研究相比
哮喘的有效性标准可以评估电子医疗纪录相比,三个不同的黄金标准:外部数据库相比,问卷由临床医生和手动审查。这个验证研究中使用问卷调查和人工审核。我们的黄金标准由协议的研究呼吸内科医生和全科医生,两人与CPRD经验丰富。
先前的研究在其他EHR数据库使用手动审查验证哮喘临床验证哮喘的EHR PPV和所有报告至少一个算法85%以上。21-26与本研究相比,先前的研究最好的结果结合诊断和处方数据时出现。
CPRD提供了自1987年以来,公共卫生研究匿名初级护理记录;感兴趣的研究一直是一个焦点时建立。GPs导致CPRD一直在训练如何记录数据供研究使用。因此,数据质量可能高于许多其他数据库,研究仅仅是一个次要产品。
本研究的优势
这项研究有几个优势。首先,我们可以调查八个预定义的不同算法的准确性和他们如何执行在CPRD哮喘患者的识别,以及实际的全科医生诊断的准确性哮喘使用提供额外的信息。第二,我们包括支持信息,如门诊转诊信,其他急诊科放电信件,气流测量和射线照相法记录。最后,我们验证CPRD哮喘诊断发现,这是一个初级保健数据库广泛用于研究不同健康状况的流行病学研究。这个初级保健数据库提供了成千上万的病人的健康和药物的历史。验证定义在哮喘CPRD允许通知医疗服务计划通过增加来自观察性研究证据的可靠性。
本研究的局限性
本研究有一定的局限性。金本位医生组成的问卷调查和审查由研究的医生不是绝对的,即使我们减轻二级护理的附加信息。EHR的全科医生可以看一个特定的诊断被记录为一个特定的病人当被问及。这可能导致PPV的高估,但没有合适的实用选择。理想情况下,气流测量和可逆性测试在每个潜在的病人会形成最佳的黄金标准,但这不会在此设置是可行的成本。问卷发送总数(n = 684)小于请求(n = 800),有些病人和实践不再CPRD的一部分,无法联系。然而,PPV的精度估计没有大幅减少。
虽然实践导致CPRD样本的做法在英国,他们被认为是代表的英国人很少有患者选择的贡献数据,因此可能偏见的结果。14
GPs复杂的医疗病史的患者可能不太可能返回的问卷。然而,GPs酬谢他们的参与可能减少这种情况发生的机会。在返回的问卷,丢失的数据量很低,这表明合理的数据质量。此外,只有生活的病人进行了评估,为GPs不再有访问病人死后的记录。这不包括死者的记录病人和可能导致生存偏差。患者必须活着被包括,但不太可能编码将生活和死去的人之间的不同。如果死去的人死于哮喘,PPV在这项研究中会被低估。我们的发现可能是generalisable其他英国初级保健数据库使用读编码,但是这些理想还需要验证。数据库使用其他编码系统可能需要验证不同的算法来识别哮喘,这可能会限制我们的发现的generalisability。另一个限制是,我们无法评估的负面预测值CPRD因为我们只评估患者的哮喘诊断属于八算法之一。 We could not calculate the specificity or sensitivity as we had preselected our population of possible asthma cases. We also assumed the validity of asthma diagnoses would not be different between common and less frequent Read codes and the quality of recording would also be comparable for pragmatic reasons. However, the less commonly used codes will by definition identify a smaller proportion of all patients with asthma, so the validity we report will apply to the majority of patients.
结论
我们已经成功地估计不同的算法来识别的PPV CPRD哮喘患者。特定的ppv哮喘独自阅读代码和非特异性的结合其他证据都大于0.84。特定的哮喘代码算法本身似乎是最实用的方法来识别患者哮喘CPRD (PPV = 0.86;95%可信区间0.77到0.95)。高比例的诊断被证实特定的哮喘患者代码,表明哮喘流行病学研究使用CPRD数据可以进行合理有效性高。
引用
脚注
贡献者JKQ IJD, LS和HM负责开发研究问题和建议在数据收集和搜索策略。FN概括并分析了问卷调查和起草了手稿。JKQ DM回顾了问卷和构造哮喘的黄金标准验证。JKQ负责研究管理和协调。所有读过作者、评论和批准最后的手稿。
资金这项工作是由葛兰素史克(GSK),通过与格兰特博士奖学金FN EPNCZF5310数量。出版本研究支持的威康信托基金会:格兰特098504号/ Z / 12 / Z。
相互竞争的利益FN博士学位期间由葛兰素史克奖学金计划。IJD是由一种无限制的补助金,咨询在葛兰素史克公司和持有股票。嗯是葛兰素史克研发的员工和葛兰素史克公司的股票。JKQ报告赠款MRC BLF,威康信托基金会,并收到葛兰素史克研究资金,AZ,昆泰IMS,除了个人费用AZ,基耶西,BI。
病人的同意这是一个研究使用电子健康记录;个体层面的许可在数据收集的时间。它不需要重复研究。所有信息由CPRD匿名。
伦理批准伦理批准了从直接督导下的(独立的科学咨询委员会监督CPRD), 15 _257协议。
出处和同行评议不是委托;外部同行评议。
数据共享声明研究数据可以请求FN一旦研究小组完成预先计划的分析。