文摘
临床研究数据链接(CPRD)是一个正在进行的初级保健匿名的数据库从全科医生的医疗记录,覆盖超过1130万患者在英国从674年实践。440万活跃(活着,目前注册)患者会议质量标准,大约6.9%的英国人都包含和病人广泛代表性的英国普通人群的年龄、性别和种族。全科医生是守门的初级保健和专家推荐在英国。因此CPRD初级保健数据库是一种丰富的健康数据进行研究,包括人口统计数据,症状,测试,诊断,治疗,二级护理与健康有关的行为和推荐。超过一半的患者,连杆与数据集从二级护理,针对疾病的人群和死亡率记录增强数据用于研究的范围。CPRD非常广泛应用在国际上流行病学研究已经用于生产超过1000个研究,发表在同行评议期刊在广泛的健康结果。然而,研究人员必须意识到定期收集电子健康记录的复杂性,包括完整性管理变量的方法,误分类和发展为研究疾病的定义。
CPRD数据被广泛用于观察研究。例如,数据被用来显示没有MMR疫苗和自闭症之间的联系,并使用口服类固醇和之间的联系表现增加骨折的风险。
英国CPRD有大量数据集结合纵向初级保健医疗记录从参与实践。超过一半的CPRD病人有资格获得连接额外的数据集,包括医院的数据,和国家死亡率的国家癌症登记数据记录。
一些数据的质量是由质量和结果框架在英国,和数据也由CPRD内部流程监控。分析本文中描述显示活跃(活着,目前注册)CPRD患者代表英国人口的年龄和性别。
CPRD数据来源于日常临床实践,及其用于流行病学研究通常需要大量的数据处理和理解最初的数据记录和存储。
数据资源基础
英国初级保健的研究数据
超过98%的英国人口注册一个初级保健全科医生(GP)1国民医疗服务制度(NHS)下,访问医生是免费的。全科医生是保健的看门人在英国国家卫生服务。GPs作为任何非紧急的第一接触点与健康有关的问题,这可能会在初级保健管理和/或称二级护理是必要的。二级护理团队也反馈信息对病人GPs,包括关键的诊断。病人数据通常记录到计算机实践人员,针对一个独特的NHS病人数量。这些方面的英国初级保健提供良好的健康信息的捕捉纵向电子健康记录。
临床研究数据链接(CPRD)
CPRD利用通用实践数据和产生一个初级保健数据集,这是一个最大的数据库的纵向从世界上初级保健医疗记录(表1)。成立于1987年的伦敦,小增值医疗产品(鞋面)数据集已成为惯例研究数据库(大)1993年,2,3在2012年扩大成为CPRD之前。的CPRD整理定期收集匿名电子健康记录数据从通用实践人在实践层面上同意每月提供数据。所有患者注册参与实践中包括数据集,除非他们有单独要求退出的数据共享,通过询问医生修改他们的注册信息在系统中禁用的提取数据。
县参与 | 英国:英格兰、威尔士、苏格兰和爱尔兰Nortdern |
包括是谁? | 患者注册通用实践贡献数据CPRD,没有异议GP patient-identifiable数据的二次使用 |
记录是什么? | 统计学、诊断、症状、标志、处方、推荐,免疫行为因素,测试 |
的数据收集 | 1987年至今 |
平均随访时间5.1年 | |
资金来源 | 从MHRA CPRD已经收到资金,威康信托基金会医学研究理事会NIHR卫生技术评估项目,创新药物计划,英国卫生部技术战略委员会、欧盟第七框架计划,和各种大学、合同研究机构和制药公司 |
县参与 | 英国:英格兰、威尔士、苏格兰和爱尔兰Nortdern |
包括是谁? | 患者注册通用实践贡献数据CPRD,没有异议GP patient-identifiable数据的二次使用 |
记录是什么? | 统计学、诊断、症状、标志、处方、推荐,免疫行为因素,测试 |
的数据收集 | 1987年至今 |
平均随访时间5.1年 | |
资金来源 | 从MHRA CPRD已经收到资金,威康信托基金会医学研究理事会NIHR卫生技术评估项目,创新药物计划,英国卫生部技术战略委员会、欧盟第七框架计划,和各种大学、合同研究机构和制药公司 |
县参与 | 英国:英格兰、威尔士、苏格兰和爱尔兰Nortdern |
包括是谁? | 患者注册通用实践贡献数据CPRD,没有异议GP patient-identifiable数据的二次使用 |
记录是什么? | 统计学、诊断、症状、标志、处方、推荐,免疫行为因素,测试 |
的数据收集 | 1987年至今 |
平均随访时间5.1年 | |
资金来源 | 从MHRA CPRD已经收到资金,威康信托基金会医学研究理事会NIHR卫生技术评估项目,创新药物计划,英国卫生部技术战略委员会、欧盟第七框架计划,和各种大学、合同研究机构和制药公司 |
县参与 | 英国:英格兰、威尔士、苏格兰和爱尔兰Nortdern |
包括是谁? | 患者注册通用实践贡献数据CPRD,没有异议GP patient-identifiable数据的二次使用 |
记录是什么? | 统计学、诊断、症状、标志、处方、推荐,免疫行为因素,测试 |
的数据收集 | 1987年至今 |
平均随访时间5.1年 | |
资金来源 | 从MHRA CPRD已经收到资金,威康信托基金会医学研究理事会NIHR卫生技术评估项目,创新药物计划,英国卫生部技术战略委员会、欧盟第七框架计划,和各种大学、合同研究机构和制药公司 |
数据链接
英语实践的一个子集(目前为75%),代表58%的英国所有CPRD实践)已同意参与CPRD连锁计划和患者的立场提供了信息。患者的立场的实践数据链接通过一个受信任的第三方(健康与社会保健信息中心4)其他现有的数据源。包括医院统计数据集建立联系5(住院数据),国家统计局6(包括死因死亡率数据),多个剥夺和汤森分数指数(剥夺数据)和疾病登记包括美国国家癌症情报网络,7国家审计项目和心肌缺血8(细节补充表1,可用补充数据在IJE在线)。其他联系计划(见CPRD网站9),研究人员可以要求定制链接个人研究。
用于观察研究和干预研究
受到适当的数据治理和批准,CPRD可以提供初级保健和与国际研究人员在英国和病人数据。通过CPRD,研究人员可以方法实践和病人参与biosample收集研究或试验。这项工作的可行性测试:患者从CPRD已经招募了药理遗传学研究statin-induced肌病,10,11实践了集群随机试验12,13和病人已经招募了务实的即时随机试验。14可以使用电子健康记录数据与研究数据提供一个完整的临床征象招募病人。
道德
CPRD已经广泛的国家研究伦理服务委员会(nr)伦理批准纯粹观察研究使用初级护理数据,建立了联系。其他用途的CPRD数据可能需要单独的伦理审批。这可能是如果有任何特定的患者参与研究;例如,如果研究者希望问病人为病人报告结果完成一份调查问卷,或者进行介入审判CPRD患者。
数据治理、实践和病人的隐私
CPRD努力经营在英国和欧洲的法律来保护保密。治理要求保护病人的隐私,尊重没有得到病人同意通过确保病人标识符分开举行有分离的临床数据和研究人员提供身份信息从主学习和那些使用CPRD数据。
资金来源
CPRD是合资企业的药品和医疗管理机构(MHRA)和国家卫生研究所(NIHR)。CPRD属于英国卫生部在MHRA和运作。CPRD已经收到MHRA资助研究,威康信托基金会医学研究理事会NIHR卫生技术评估项目,创新药物计划,英国卫生部技术战略委员会、欧盟第七框架计划和各种大学、合同研究机构和制药公司。
数据资源面积和人口覆盖率
图1描述CPRD初级保健的人口覆盖率数据在英格兰、威尔士、苏格兰和北爱尔兰。在年中日期2013年7月2日,数据集信息1130万年举行的病人被认为可以接受的研究基于数据质量检查(附录1、可用补充数据在IJE在网上,和下面描述)。活跃的病人的人口(活着,目前注册)2013年7月2日是440万年,占英国总人口的6.9%(基于英国2013年中6410万人口)。剩下的690万条记录代表不活跃的患者死亡或不再注册参与实践。病人数量按年龄、性别、剥夺、种族和地区中描述表2。
。 | 所有的病人。 | 活跃的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年龄在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地区,n(%) | ||
北东 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
约克郡与亨伯 | 441933 (3.9) | 48480 (1.1) |
东米德兰兹 | 446799 (4) | 29954 (0.7) |
西米德兰兹郡 | 943011 (8.4) | 394115 (8.9) |
英格兰东部 | 188金宝慱官网下载1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
伦敦 | 1532066 (13.6) | 600824 (13.6) |
南东部海岸 | 1130468 (10) | 474593 (10.7) |
北爱尔兰 | 275640 (2.4) | 153576 (3.5) |
苏格兰 | 960121 (8.5) | 499969 (11.3) |
威尔士 | 829703 (7.3) | 403172 (9.1) |
随访持续时间(平均年,差)一个 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
。 | 所有的病人。 | 活跃的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年龄在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地区,n(%) | ||
北东 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
约克郡与亨伯 | 441933 (3.9) | 48480 (1.1) |
东米德兰兹 | 446799 (4) | 29954 (0.7) |
西米德兰兹郡 | 943011 (8.4) | 394115 (8.9) |
英格兰东部 | 188金宝慱官网下载1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
伦敦 | 1532066 (13.6) | 600824 (13.6) |
南东部海岸 | 1130468 (10) | 474593 (10.7) |
北爱尔兰 | 275640 (2.4) | 153576 (3.5) |
苏格兰 | 960121 (8.5) | 499969 (11.3) |
威尔士 | 829703 (7.3) | 403172 (9.1) |
随访持续时间(平均年,差)一个 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
活跃的病人还活着,目前注册2013年7月2日。
一个只包含标准的后续。
。 | 所有的病人。 | 活跃的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年龄在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地区,n(%) | ||
北东 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
约克郡与亨伯 | 441933 (3.9) | 48480 (1.1) |
东米德兰兹 | 446799 (4) | 29954 (0.7) |
西米德兰兹郡 | 943011 (8.4) | 394115 (8.9) |
英格兰东部 | 188金宝慱官网下载1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
伦敦 | 1532066 (13.6) | 600824 (13.6) |
南东部海岸 | 1130468 (10) | 474593 (10.7) |
北爱尔兰 | 275640 (2.4) | 153576 (3.5) |
苏格兰 | 960121 (8.5) | 499969 (11.3) |
威尔士 | 829703 (7.3) | 403172 (9.1) |
随访持续时间(平均年,差)一个 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
。 | 所有的病人。 | 活跃的。 |
---|---|---|
不。病人 | 11299221 | 4425016 |
男人,n(%) | 5478715 (48.5) | 2183161 (49.3) |
女人,n(%) | 5820506 (51.5) | 2241855 (50.7) |
年龄在2013年,n(%)(年) | ||
< 18 | - - - - - - | 742765 (20.2) |
18 - 64 | - - - - - - | 4402926 (61.8) |
65 + | - - - - - - | 1728514 (18.1) |
地区,n(%) | ||
北东 | 184753 (1.6) | 67639 (1.5) |
西北 | 1257846 (11.1) | 523356 (11.8) |
约克郡与亨伯 | 441933 (3.9) | 48480 (1.1) |
东米德兰兹 | 446799 (4) | 29954 (0.7) |
西米德兰兹郡 | 943011 (8.4) | 394115 (8.9) |
英格兰东部 | 188金宝慱官网下载1117235 (9.9) | 306538 (6.9) |
南西 | 943295 (8.4) | 377821 (8.5) |
中南部 | 1236351 (10.9) | 544979 (12.3) |
伦敦 | 1532066 (13.6) | 600824 (13.6) |
南东部海岸 | 1130468 (10) | 474593 (10.7) |
北爱尔兰 | 275640 (2.4) | 153576 (3.5) |
苏格兰 | 960121 (8.5) | 499969 (11.3) |
威尔士 | 829703 (7.3) | 403172 (9.1) |
随访持续时间(平均年,差)一个 | 5.1 (1.8 - -11.1) | 9.4 (3.4 - -13.9) |
活跃的病人还活着,目前注册2013年7月2日。
一个只包含标准的后续。
数据收集的频率
发生了数据收集的一部分正常的患者参与临床护理实践在日常生活。数据记录的频率是由病人的需要和不同的年龄、性别和潜在的发病率。病人都包含在初级保健数据集从第一次到最后接触参与实践。通常实践和收集的数据上传到CPRD每月安全服务器。最后数据收集对应日期的日期的最后从每个实践数据上传。每月构建的初级保健数据集生成,供研究人员使用。
措施
实践和病人数据
数据库结构广泛信息分为临床、转诊、免疫接种、测试和治疗数据(见补充表1,可用补充数据在IJE在线)。数据记录与pseudo-identifiers实践和耐心。在实践层面,地理区域是由CPRD记录10的地区之一在英格兰,威尔士,苏格兰和北爱尔兰作为单独的区域(图1);实践层面剥夺分数也是超级计算基于实践低输出区域。
所有惯例鼓励遇到电子记录和实践者提供这些记录进行研究。数据收集统计信息,处方细节,临床事件(症状,诊断),提供预防保健,测试,免疫专家推荐,住院和主要结果,有关死亡(的细节都显示在细节补充表2,可用补充数据在IJE在线)。
所有条目一个病人记录都视为“磋商”,并不是所有的将涉及面对面的接触。在咨询多个“事件”可能被记录,每个都有一个关联的日期(图2)。
数据在很大程度上是由全科人员记录使用版本2阅读代码,一个层次的临床分类系统包含超过96,000码。15例如,在咨询、医生、护士、其他医疗专业,实践经理或管理员可以进入许多阅读代码来描述病人的条件(例如生活方式等措施吸烟状况、症状、过去病史,诊断,测试执行如血压测量,和治疗提供)。数字数据在额外的临床措施(如身高、体重、血压、饮酒)也可以被记录在磋商。处方医生签发的自动记录产品名称和英国国家规定的代码,与剂量和数量的指令。实验室测试的结果由全科医生通常通过电子链接添加到病人记录实验室。其他来源的数据反馈给医生也可能进入病人记录实践人员;这可能包括信息等二级护理的关键诊断,从医院排放数据,或从专家门诊随访信息。
全科医生也能够对病人做出额外的未编码的笔记和观察自由文本。这通常包含身份信息和不属于标准数据库提供给研究人员。
数据资源的使用
CPRD数据(或以前大或鞋面)在英国和国际16生产近2000研究报告,超过1000发表在同行评议的杂志上发表论文,在所有主要治疗领域。参考书目是由CPRD维护网上。17这些出版物涵盖一系列健康相关研究主题包括药物,疗效比较研究,卫生服务研究,评估时间的发病率趋势,卫生经济学,预后研究,经典危险因素流行病学和最近随机对照试验。12,18日期的出版物包括研究表明缺乏之间的关联麻疹、腮腺炎和风疹疫苗(MMR)与自闭症,19急性感染后,心血管疾病的风险20.他汀类药物使用相关的痴呆的风险较低,21牛皮癣患者的心肌梗死的风险,22口服糖皮质激素与骨折风险的使用23和身体质量指数和癌症之间的联系。24
的优点和缺点
的优势
CPRD数据作为研究资源的优势在于覆盖的广度,大小、长期随访、代表性和数据质量。
宽度的数据
CPRD初级保健数据集是一些大型之一,正在进行的数据库,包括发病率和生活方式的变量和数据链接二级护理和死亡率数据。
大小和长期随访
这个数据库的关键力量是它的大小;CPRD持有数据从674年实践,包括超过7900万人年随访(2013年7月2日,2014年1月的数据集)。这允许详细的流行病学协会调查,估计更高层次的统计精度比与较小的数据是可能的来源,这是特别重要的研究罕见的曝光和疾病。25,26个别患者中,有一个中等的前瞻性随访9.4年活跃的患者(四分位范围(差)3.4 - -13.9)和5.1年(差1.8 - -11.1年)(表2)整体,使研究疾病与长期延迟和长期的研究结果。-
代表性
与英国2011年的人口普查相比,30.CPRD病人广泛代表性的英国人的年龄和性别(图3)。病人也相当于英国人口的种族,31日并与健康调查英国身体质量指数分布在大多数患者亚组。32然而,CPRD可能并不代表所有的实践在英国基于地理位置和大小。33
数据质量
英语方面的数据质量惯例是由质量和增强的成果框架,34GPs的奖金计划,鼓励记录的关键数据项(例如吸烟状况和服务交付的关键病人组)。质量和结果框架在2004年推出的时候,和完整性在许多变量的记录显示后续改进(图4,补充图1,可用补充数据在IJE在线)。
验证CPRD显示高阳性预测值的诊断和评估,发病率的比较与其他英国数据源也大体相似。35-38然而,报告的验证的研究往往是太穷,允许一个明确的解释,和大多数的研究集中在积极的预测价值,而非敏感性和特异性。39
初级保健的质量数据是变量,因为数据输入由GPs例行磋商期间,没有为目的的研究。因此,研究人员必须研究之前进行全面数据质量检查。CPRD提供两套数据质量标准:为病人和可接受性标准(ut)实践的时候了。这些标准并不保证数据质量,但CPRD建议这些措施作为第一步选择病人研究质量和质量数据记录的时期。病人可接受的度量是基于注册状态,记录病人的事件记录,和有效的年龄和性别。生产日期是基于实践的质量度量基于记录的连续性和死亡记录的数量。生产日期计算出每个参与实践,实践的最新日期对应满足这些最低质量标准(附录1、可用补充数据在IJE在线)。本文给出的数据反映数据贴上患者可以接受,至少有1天的后续“标准”。数据质量的研究表明,尽管这些标准,有大变化inter-practice记录的数据。40
弱点
缺失的数据
在病人和完整性的变化数据跨越时间需要仔细考虑;限制那些有完整的数据可能会导致偏见的分析,和归责可能并不是一个简单的方法,因为missingness的模式是复杂的。例如,身体质量指数可能更频繁地记录患者的健康问题,和血压更频繁地在生育年龄的妇女和那些与现有的心血管疾病。复杂的算法往往需要处理missingness,解决差异的措施之间的协商和决定是否历史测量数据,例如身体质量指数、血压或吸烟状态,仍适合病人的疾病风险在后续很久以后。32
初级保健数据的额外的复杂性疾病的缺乏阅读代码必须被视为一个没有疾病的本身,因此而阳性预测价值往往是高,39敏感性可能会更低。这一潜在错误分类的出现一定程度上是由于患者未能给疾病的医生,也从不同GPs在编码诊断病人电子记录;如果GPs作为自由文本输入信息,研究人员将小姐有价值的信息。疾病之间的误分类的程度可能不同。39
定义
没有一般标准化诊断和其他细节的定义,所以阅读代码列表和算法需要为每个开发研究识别风险和利益的结果。这可能会导致不一致的定义(因此结果)之间使用相同的数据研究。
信息从二级护理
一般实践获得的信息与二级护理病人接触但这信息必须手动输入到病人记录。因此,住院的详细信息(日期、诊断、测试执行,滞留时间)可能是不完整的。
数据不捕获
健康的某些方面可能很少或根本没有记录,例如社会支持水平,许多人在一个家庭,非处方药物使用,在二级护理处方,处方,和坚持治疗。也有某些病人团体从初级护理记录缺失,如囚犯,私人病人,一些住宅和无家可归的人。
数据资源访问
访问病人水平数据由CPRD提供卫生研究目的,依赖于批准协议的一项研究MHRA独立科学咨询委员会(直接督导下的)。
研究人员打算利用数据应该意识到CPRD数据文件包含数百万行数据,需要广泛的数据管理和深入理解数据输入和存储的方式。
CPRD提供数据字典和编码字典研究人员,并指导创建代码清单可以帮助识别感兴趣的代码。41阅读代码存储库电子健康记录的研究现在还可用。42,43
细节直接督导下的应用程序和数据成本可用CPRD网站,和任何其他查询可以指向CPRD知识中心(kc@cprd.com)。9
资金
LS支持威康信托基金会高级临床科学研究奖学金授予098504号/ Z / 12 / Z。
利益冲突:AG是受雇于CPRD和电视CPRD的雇员。没有其他的冲突。
引用