罕见的错义功能变体COL4A1和COL4A2在零星的脑内出血
做出评论
看到评论

文摘
客观的测试罕见的错义变异的遗传贡献COL4A1和COL4A2常见变异的基因与零星的脑出血(我),我们进行了罕见的变异分析在多个测序数据分散我的风险。
方法我们在559 13岁Kbp q34包括进行测序COL4A1和COL4A22133人(1055年我案件;1078年源于美国和1381个人(控制)192我病例;1189控制)Scotland-based军团,紧随其后的是序列注释,预测功能的影响,遗传协会测试,在硅片热力学建模。
结果我们确定了107年罕见的变异产生的零星的我,其中2个错义变异,rs138269346 (COL4A1I110T)和rs201716258 (COL4A2H203L),预测高功能和发生在多个我用例而不是从美国俄队列控制。rs201716258微小等位基因的患者也出现在苏格兰,我和观察rs138269346 2 ICH-free控制高血压和心肌梗塞的历史。Rs138269346是名义上与nonlobar我风险(p= 0.05),但与大叶性我(p= 0.08),而rs201716258和我亚型之间的关联是不重要的(p> 0.12)。两个变异被认为是致病性基于小等位基因频率(< 0.00035欧洲人口),预测功能的影响(有害或可能损害),和在计算机建模研究(大大改变物理长度和胶原蛋白的热稳定性)。
结论我们确定了罕见的错义变体COL4A1/A2与零星的我。我们的注释和仿真研究表明,这些变异是高度功能和可能代表转化跟踪的目标。
术语表
- CADD=
- 结合annotation-dependent删除;
- CSVD=
- 脑小血管疾病;
- 埃里希=
- 民族/种族差异在脑出血;
- GATK=
- 基因组分析工具箱;
- GOCHA=
- 基因的发现Warfarin-Related脑出血;
- GWAS=
- 全基因组关联研究;
- icd -=
- Diseases-10国际分类;
- 我=
- 脑内出血;
- LBC=
- 洛锡安同期出生的;
- LD=
- 连锁不平衡;
- 关键=
- 洛锡安研究颅内出血的病理,成像和神经系统的结果;
- 加=
- 轻微的等位基因频率;
- 医学博士=
- 分子动力学;
- ns=
- 纳秒;
- PDB=
- 蛋白质数据银行;
- 质量控制=
- 质量控制;
- 单核苷酸多态性=
- 单核苷酸多态性;
- sv=
- 小血管缺血性中风;
- UKB=
- 英国生物库;
- VEP=
- 变异的影响预测;
- 韦斯=
- 全外显子组测序;
- WGS=
- 全基因组测序
脑出血(我)占10% -15%的中风是最致命的,但至少可以治疗的中风类型。1,- - - - - -,3超过一半的患者在第一年内我死后,疾病,和大多数幸存者长期残疾。3,我背后的分子机制仍然知之甚少,限制治疗的发展。
全基因组关联研究(GWAS)已经确定了基因位点与我相关风险和结果。4,5我们最近决定一个全基因组重要脑小血管疾病协会(CSVD)包括nonlobar我和小血管缺血性中风(sv)COL4A1和COL4A2(胶原IVα链1和2)13 q34,6验证之前的研究。7
罕见的基因突变,最常影响g残留在Gly-Xaa-Yaa重复COL4A1 / A2因为孟德尔早发性脑血管疾病、眼部发育不全和肌病。8,- - - - - -,12然而,全谱的影响COL4A1 / A2突变特征仍不完全。7,13,14测序的几个家庭或小的患者数量(n < 100)建议罕见变异COL4A1 / A2可以促进零星的我。9,- - - - - -,15
识别罕见的编码变异COL4A1 / A2或许构成了上述GWAS协会我和sv,我们进行有针对性的测序的13个q34地区教育局研究(1055我病例和1078 ICH-free控制)以及192年其实测序的轨迹我病例和全基因组测序(WGS) 1189年从苏格兰ICH-free控制。我们提出注释结果,预测deleteriousness和案例/控制隔离的罕见变异13 q34从这些数据集。
方法
标准协议的审批、登记和参与者同意
研究协议批准注册的美国俄军团(基因发现Warfarin-Related脑出血(GOCHA)脑出血和民族/种族差异[ERICH])和Scotland-based军团(洛锡安研究颅内出血的病理,成像和神经的结果(关键)和洛锡安同期出生的[LBC])马萨诸塞州综合医院的机构审查委员会和爱丁堡大学。知情同意是来自参与者或一个适当的法律代理根据所有招聘网站。
研究参与者
测序针对13 q34和质量控制(GOCHA / ERICH和关键)
我们进行有针对性的测序559 Kbp 13 q34 (chr13:110,701,882 - 111265349)包括188金宝慱官网下载COL4A1/A22133人(1055年我病例和1078例对照)96年GOCHA / ERICH丛罗氏SeqCap平台,192年我在关键情况下NextSeq 550平台。读高质量是一致的人类基因组(GRCh37)使用BWA 0.7.10(版本)。20.我们应用预处理步骤包括重复的删除、局部调整,indel调整使用基因组分析工具包(GATK) IndelRealigner,和基地质量校准使用GATK基地调整之前调用。然后GATK最佳实践管道被用于调用变异与2不同的平台,分别。使用HaplotypeCaller变种被称为和过滤。
变异传递GATK变体质量分数调整指标被保留。我们只包含单核苷酸变异或indels 10或更高的深度。我们排除了变异的调用率< 0.98,病例对照叫率差异> 0.005,与微分missingness例和控制(p< 0.05)。样品被排除在外,如果他们有一个较低的平均呼叫率(< 0.98),低平均深度序列(< 30)、低平均基因型之间的质量(< 85),或微分missingness例和控制(p< 0.05)和哈迪温伯格平衡测试(p值< 10−6)病例和单独控制。
全基因组测序(LBC)
以前WGS LBC的样品已经完成,测序协议和质量控制(QC)指标报告。21的变异选择GOCHA / ERICH和关键研究进一步评价LBC测序数据作为控制人口。
变量选择和注释
我们使用了运用变异影响预测(VEP)软件与运用注释功能变体的后果在人类基因组组装GRCh37注释数据库。22VEP提供各种信息的功能变体的后果(拼接受体变异,拼接捐赠者变体,开始失去了,停止了,停止了,移码的变体,inframe插入,inframe删除和错义变体)和功能影响预测的筛选(有害或容忍),23PolyPhen(可能是破坏性的,可能是破坏性的,良性的,或未知),24结合annotation-dependent删除(CADD),25和LoFtool (0 - 1)。26我们还利用SnpEff,分类的影响基因组变异的位置(如内含子,监管网站,拼接,错义,废话)到高,温和,低或修饰符。27我们选择产生的变异/中度SnpEff高,有害的筛选,可能/可能损害PolyPhen, CADD分数> 20.0,和LoFtool分数< 0.1 GOCHA / ERICH和关键数据集。
单独的变种和Variant-Set协会测试GOCHA /埃里希
我们使用了猫在线计算器28估计为单身变异分析中发现联系我。我们单独的变种协会执行测试的变体选择的注释方法我风险亚型(都融合在一起了,大叶性和nonlobar我)在R(使用逻辑回归r-project.org/)。协会模型都是根据年龄和性别进行调整。意义单一变异测试阈值设置为α= 0.05的Bonferroni调整数量的单变量(数量的变异:39;p< 1.28×10−3)。
识别和选择的潜在因果罕见变异在我(GOCHA / ERICH)
因为我们的样本量仍极其动力不足识别罕见的功能变体传统协会测试,我们专注于罕见的产生变异COL4A1/A2,尤其是那些发生在超过我的情况而不是控制,或在控制但不超过1例。变异在GOCHA / ERICH首次探索发现数据集,然后检查关键和LBC外部验证的结果在一个独立的人。
我们应用叮铃声29日软件评估连锁不平衡(LD)和单体型推断在这个轨迹,测试是否普遍单核苷酸多态性(SNP)rs9515201,先前确定的GWAS CSVD风险,躺在一个单体型与我们确认罕见变异。
因为大叶性的遗传结构和nonlobar我已知不同,5我们测试了我subtype-specific效果确定变异使用BinomiRare精确测试,30.Poisson-binomial概率计算关联强度的变异概率的基础上的个人携带小的零假设下的变异等位基因变异与疾病相关。古典逻辑回归分析并不是申请单独的变种测试因为我们选择变异只出现在1组(例如,病例或控制),而不是两个。31日我亚型的BinomiRare回归模型是根据年龄和性别进行调整。
我们确认使用gnomAD变异进行评估32等位基因频率在人口和Geno2MP (geno2mp.gs.washington.edu/Geno2MP在运营商)phenomic效果与变异或其家庭成员。33
进一步评估我们选择变异,我们也探讨了最近的全外显子组测序(韦斯)200000人的英国生物库(UKB)。34,35我们137766年杠杆无关的英国白人个体基于亲属关系(删除至少1一对相关的个人),并预测该祖先从主成分UKB提供的人口结构。36对于ICH-related表型,我们使用2电子健康记录的特征包括icd - 10编码我(I61;UKB域编号41202)和“血管/心脏病诊断的医生”(UKB字段编号为6150)。这些条件的发病年龄不是UKB数据库中可用。我们选择的运营商的数量差异情况和控制之间的变异和非UKB被一个χ检查2测试。
先前确定的分析变异COL4A1 / A2在GOCHA /埃里希
我们研究了编码变异COL4A1 / A2在我之前被其他测序研究(rs200786329,13rs117412802、rs62621875 rs20110574717)或其相关疾病包括遗传血管病、肾病、动脉瘤、和抽筋(rs113994104、rs113994105 rs113994106),12小血管疾病(rs121912857和rs113994107),9脑血管疾病(rs672601346),37和脑穿通(rs1139941128rs11399411415)。他们的位置信息和氨基酸变化提供了表e 1(数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。之前报道的变异,也确定了在我们的测序数据分析与我使用BinomiRare风险。
外部验证Scotland-Based选择变异的数据集
选择产生的罕见变异只在或控件出现在美国俄的验证数据集探讨了关键和LBC来确定他们是否隔离情况下或控制这些独立的数据集。因为关键和LBC利用不同的招聘方法和排序使用不同的方法,发现这些数据集进行验证的候选人变异教育局GOCHA / ERICH病例是由于担心偏见并不可行。
在计算机建模的蛋白质的结构和热稳定性识别变异
我们进一步评估结构选择变异对蛋白质结构的影响COL4A1 / A2使用分子动力学(MD)模拟。的α链COL4A1和COL4A2(图1一个)相互作用形成1 triple-helical胶原IV型原体,α1α1α2 (IV),由3蛋白质域:氨基端7年代,中央triple-helical胶原蛋白,c端NC1 (图1 b)。迄今为止,triple-helical胶原结构α1α1α2 (IV)没有被实验确定蛋白质数据库(PDB);rcsb.org)。因此,我们预计第三heterotrimerα1α1α2结构(IV)分子利用蛋白质的二级和三级结构预测工具,包括PSIPRED、38包含了,39和BLASTp (blast.ncbi.nlm.nih.gov / Blast.cgi)。40简单地说,我们使用了α1α1α2 (IV)结构(PDB ID: 2错)41作为模板,并预测2结构模型为我们选定的变体COL4A1据的副本数量COL4A1s等突变WT /太/ COL4A2WT和COL4A1s吨/吨/ COL4A2WT1模型的变体COL4A2如COL4A1sWT / WT/ COL4A2太(图2一个)。比较结构的变异影响α1α1α2 (IV),我们也生成额外的结构模型2之前报道变体包括rs200786329 (COL4A1)13和rs117412802 (COL4A2)。17这两个变量是选择比较因为rs200786329COL4A1和rs117412802COL4A2最近发现在有针对性的测序零星的我的情况下,除了家族早发性IV型collagen-related疾病。此外,我们选择变异位于同一Gly-Xaa-Yaa模式或相同的功能域。此外,rs200786329COL4A1和rs117412802COL4A2显示强大的功能变化在细胞内的积累和细胞外的不足COL4A1或COL4A2蛋白质含量比其他变体。13,17
(A)高度功能产生的变异出现在我情况下预测的注释方法包括SnpEff(高或中等),筛选(有害),PolyPhen(可能/可能损害),结合annotation-dependent删除(CADD)(> 20.0),和LoFtool (> 0.1)。格林:氨基端7 s域;蓝色:三重螺旋胶原域;布朗:c端数控领域。*变体中存在的两个数据集。(B)选择COL4A1和COL4A2变体。ERICH =脑出血民族/种族差异;GOCHA =基因发现Warfarin-Related脑出血。
MD模拟进行的预测三级结构α1α1α2 (IV)分子包含我们确定变异和2之前报道的变异使用德斯蒙德(deshawresearch.com/resources_desmond.html)42所述43在500纳秒(ns)。我们包括建模假设原子的位置取代氨基酸从一开始稳定在100 ns。大师(schrodinger.com/maestro;薛定谔,有限责任公司,2016年)被用来提取和分析800年序贯模拟蛋白质结构的快照COL4A1和COL4A2在400 ns (100 - 500 ns)。
此外,三肽成分的影响(Gly-Xaa-Yaa)包含我们确定变异对胶原蛋白三螺旋的稳定使用胶原蛋白热稳定性计算器估计(compbio.cs.princeton.edu/csc),44预测熔化温度(T米)。
数据可用性
测序数据用于这项研究可用dbGAP (ncbi.nlm.nih.gov /差距/;加入ID: phs000416.v2.p1)。额外的数据具备支持这些发现作者在合理的请求。
结果
识别的罕见变异和遗传协会测试COL4A1 / A2
之后有针对性的测序和严格的QC的13个q34地区教育局GOCHA / ERICH研究,我们保留1055患者我与11815年和1078年ICH-free控制变异。在这些变量中,0.91%是产生(106错义,废话)和0.70%的编码变异。
在Scotland-based关键研究中,192名患者后与我保持质量控制在13 q34与1380个变异位点。从这些,1.01%是产生(15个错义和1废话),1.88%是同义变体编码。
选择产生的变异与高/ SnpEff中度影响,有害的预测的筛选,可能/可能破坏预测的PolyPhen, CADD分数> 20.0,和LoFtool分数> 0.1,留给我们的是39变体在关键GOCHA / ERICH和4变种,其中3错义变体,包括rs34004222 rs117412802, rs12877501,之间的共同研究。这些产生的变异,预测高度功能基于多个注释方法,所示图1一个。这些变量是重要的LD (r2与rs9515201 > 0.4),主要常见的变体,我们之前在最近的一次CSVD GWAS识别。6详细的信息在这些变异出现在表依照(数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。注释信息对所有检测到变异在测序数据详细描述表e - 3 (GOCHA / ERICH)和表(关键)(数据可以从森林女神的军医doi.org/10.5061/dryad.z34tmpgcq)。
根据我们的统计力量计算(图e 1,doi.org/10.5061/dryad.z34tmpgcq),我们有权力极其有限(少于20%)检测遗传协会这样一个罕见的变异(小等位基因频率(加)< 0.001)与零星的我的风险。因此我们有限的单一变异测试的39个变种,但没有观察变异显著(p< 1.2×10−3e-5)与我联系亚型(表,数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。
在我选择的潜在因果变异(GOCHA / ERICH)
由于这种预期低的统计力量单一罕见变异发现在美国俄GOCHA / ERICH数据集,我们选择了把重点放在产生突变,出现在至少2参与者只在1组(比如我),但没有其他组(例如,ICH-free控制)。我们没有观察到任何产生的变异发生在至少2控制但不在情况下,但我们确定2罕见的错义变体(rs138269346和rs201716258)出现在至少2我情况下没有出现在控件(表2)。rs138269346 (COL4A1Ile110Thr)的外显子5COL4A1相应的氨基端7 s域和rs201716258 (COL4A2His203Leu)的外显子10COL4A2三重螺旋胶原蛋白对应领域,它影响一个X Gly-Xaa-Yaa重复的残渣(图1 b)。rs138269346COL4A1出现在4我例(2大叶性和2 nonlobar我例)和rs201716258吗COL4A2在另一个2我情况下(1大叶性和1 nonlobar我)。这些我例微小等位基因的杂合的这些变异和个体携带的微小等位基因变异。这些变量并不与年龄相关的疾病发作,性,或者我卷(表e-6,数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。
根据我们的LD计算和单体型分析,这些2罕见变异不在LD (r2< 0.01)与我们之前的铅SNP, rs9515201,6和我们没有观察到单体型小的等位基因识别罕见变异和rs9515201 (e -表,数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。
rs138269346和rs201716258功能注释
基于gnomAD,这两个变量是罕见的在欧洲人口(加< 0.0005)甚至在其他人群少(表2)。Rs138269346COL4A1被认为是跨多个预测致病因其注释工具:温和SnpEff,有害的筛选,由PolyPhen可能损害,由LoFtool可能损害。它显示一个非常高的CADD得分为23.8分,表明这种变体前0.42% (10−2.38大多数预测的)有害的变异在人类基因组中。另一种变体,rs201716258COL4A2也被认为有负面影响,SnpEff(温和的)和LoFtool(可能损害),但不是通过筛选(容忍),PolyPhen(良性),和CADD (4.7)。
验证rs138269346和rs201716258 Scotland-Based参与者
我们出发去验证确定变异使用独立的关键数据集。我们发现2我患者携带rs201716258的微小等位基因COL4A2但没有rs138269346运营商COL4A1。rs201716258,个人发展nonlobar我在右心室(我是透镜的中心),分数低的小血管疾病。45患者的年龄(1男1女)在85年和73年的我,也没有缺血性中风的历史。
转向基于LBC队列,我们确认2 ICH-free控制携带rs138269346的微小等位基因COL4A1但没有rs201716258运营商COL4A2。这两个ICH-free控制携带rs138269346之一COL4A1在LBC自述高血压和心肌梗塞的历史。
进一步评估rs138269346和rs201716258 Geno2MP UKB
在个人贡献Geno2MP数据库中,这些变异携带者表达表型异常发现罕见的胶原IV突变患者症状。14在Geno2MP,我们发现5杂合的rs138269346COL4A1运营商和6杂合的rs201716258COL4A2运营商(表e-8,数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。rs138269346之一COL4A1航空公司有多个异常的眼睛和心血管和神经系统,以及其他的亲戚4运营商也异常的眼睛,肌肉系统、心血管和神经系统。两个rs201716258COL4A2运营商在耳朵和心血管系统异常,分别和其他的亲戚4运营商也有神经系统异常或肌肉组织。
在137766无关的个人在200 k韦斯(表e-9),我们发现1 rs138269346载体但rs201716258 276代理我(通过icd - 10编码I61)患者。与血管/ 41032人心脏问题,有33个运营商为rs201716258 rs138269346和63个运营商。根据我们的χ2与代理相关分析,rs138269346是名义上我(χ2= 3.4;p= 0.063)虽然只有1代理我携带rs138269346。我们没有观察到显著协会χ的其余部分2测试(表平台以及数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。
遗传协会测试我亚型
来确定哪个我亚型有关这些变异,我们使用BinomiRare (表3),这表明rs138269346COL4A1名义上是与风险nonlobar我(p= 0.054),减少与叶的我(p= 0.077)和我都融合在一起了p= 0.090)。然而,rs201716258COL4A2与任何我没有携带一个重要协会亚型(p值> 0.12)。
在之前报道的变异COL4A1 / A2,我们可以检测3产生的变异COL4A2,包括rs117412802 rs62621875 rs201105747,之前报道的患者只有我,而不是控制。17然而,GOCHA / ERICH数据集,我们发现这些变异的运营商我例(rs117412802携带者:20;和rs62621875: 1)和控制(rs117412802: 24;和rs62621875: 1)。我们只确认rs201105747 1控制。关键的数据集,我们发现患者中只有rs117412802 4我(3大叶性和1 nonlobar我)。我们发现没有显著关联的这些观察到的变异与我从BinomiRare风险(表e-11,数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq)。
在硅片rs138269346和rs201716258的功能分析
洞察任何结构这两个错义变异的潜在后果,我们进行MD模拟。基于α链组成α1α1α2 (IV),每个原体可以包含1或2变种α1 (IV)分子和1α2 (IV)。因此,我们构建2 rs138269346结构模型COL4A1:COL4A1sWT / I110T/ COL4A2WT和COL4A1sI110T / I110T/ COL4A2WT。接下来,为rs201716258COL4A21结构模型是预测:COL4A1sWT / WT/ COL4A2H203L(图2一个)。从这些模拟,我们发现2 rs138269346突变结构COL4A1,COL4A1sWT / I110T/ COL4A1WT和COL4A1sI110T / I110T/ COL4A2WT,导致平均长度为16.59埃(;等于10−1012.64米)5.58 (SD)和4.29 (SD),分别为(图2 b)。这些都是14.9%和35.1%的平均长度短于野生型(平均19.49;6.41 SD)。同样,我们还发现为rs201716258变异结构COL4A2,COL4A1WT / WT/ COL4A2H203L(平均19.13;6.03 SD),成为比野生型短15.7%(平均22.70;5.94 SD)。
相比之下,我们也生成之前报道的结构模型COL4A1 / A2变体rs200786329COL4A1和rs117412802COL4A2。有趣的是,我们发现同样的模式在结构的仿真模型与之前报道的突变变体。这些突变体的平均长度为rs200786329形式COL4A1和rs117412802COL4A2比他们少9.7% - -25.8%野生类型(图2 b)。
已是不争的氨基酸序列胶原域和胶原蛋白的突变影响热稳定性和熔化温度的三重螺旋。46根据胶原蛋白稳定计算器,44COL4A1I100T减少预测T米2.2°C COL4A1相比wt,而COL4A2H203L增加了T米通过2.1 - -3.1°C COL4A2相比wt(图飞行,数据可以从森林女神,doi.org/10.5061/dryad.z34tmpgcq),进一步贷款支持的功能。
讨论
我们进行了一次有针对性的测序研究,1055我病例和1078控制,和一个额外的数据集(192我病例)13 q34轨迹,我们和其他人之前确定的遗传关联研究我和相关CSVD的表现。6,713 q34已经在我之前测序研究的目标,但当前研究的样本量(n = 2325)大约是10倍比之前的努力(n < 200)。8,9,12,13,15,17,37然而,即使采取了增加样本量,罕见变异统计力量仍然很低,所以我们只专注于产生的变异出现在我的情况下而不是控制来限制我们的搜索最可能的致病变种。我们的研究发现罕见的错义变种2小说COL4A1/COL4A2,出现在这种情况下只有在我们发现数据集(1)预计有破坏性影响,(2)不与常见SNP LD确定在前面的GWAS CSVD,和(3)预计将大幅改变的物理长度和IV型胶原蛋白的热稳定性。此外,尽管统计的样本容量有限,我们观察rs138269346名义上重要的协会COL4A1对于nonlobar我风险。
在我们试图外部验证这些结果在独立的数据集,我们发现2我携带rs201716258患者COL4A2在关键。没有我的情况下为rs138269346运营商COL4A1被发现,虽然两个人用这个变量被确定LBC控制人口。给定情况下人口2之间的大小差异研究和招聘情况/控制数据集之间的差异和LBC, rs138269346这个复制失败的重要性COL4A1目前还不清楚。
大部分的孟德尔疾病有关的突变COL4A1 / A2确定日期影响Gly-Xaa-Yaa g残渣的重复模式,这对稳定三重螺旋的形成是必要的,和更多的突变中描述COL4A1比COL4A2。14然而,我们选择的氨基酸变异位于X模式中的残留。在零星的我发现突变,P352Lrs200786329(COL4A1)13和E11223Grs117412802(COL4A2)17也位于non-Gly残留的三肽模式,分别X Y和残留物。这些先前的变体(rs200786329和rs117412802)显著降低胞内胞外的比率COL4A1或COL4A2在培养细胞中蛋白质相比,野生类型,被认为是一个潜在的致病机制IV型胶原蛋白相关的疾病。13,17有趣的是,我们的MD模拟表明,这些以前的变体(rs20078632913和rs11741280217)以及我们的新变体(rs138269346和rs20176258)的物理长度大大缩短triple-helical结构,表明改变蛋白质结构,如缩短螺旋的领域可能会导致蛋白质功能的变化包括IV型胶原蛋白分泌到细胞外基质或突变蛋白的分泌。在这方面,我们的热稳定性研究预测COLl4A1I100T减少(−2.2°C)和COL4A2H203L增加(+ 2.1 - -3.1°C)T米胶原蛋白的结构。这些变化并不比2°C级小减少受到孟德尔疾病有关的Col2a1突变的影响。47因此,它也有可能,我们确定变异施加其影响IV型胶原蛋白功能通过影响胶原蛋白的热稳定性,类似于其他胶原蛋白突变。
我们的研究也有一些局限性。首先,由于统计能力有限,我们只专注于罕见变异出现在我情况下但不控制,这可能被认为是保守派和增加假阴性协会与低外显率变异。此外,我们缺少一个类似的案例/控制我和深度测序数据集的直接验证我们观察到的变量。目标序列13 q34关键允许我们验证rs201716258的存在在我的情况下,但相对较小的样本大小和实质性差异的比例我亚型相比,发现数据集使得缺乏观察rs138269346不确定。LBC的以人群为基础的主体是一个受欢迎的兼职,关键我情况下,但不同ICH-relevant疾病负担的历史和LBC的并发症和潜在性质研究,这不是不断更新,使解释的外观rs138269346 ICH-free个体具有挑战性。由于缺少全基因组的基因在绝大多数的主题,无法评估和调整人口结构在我们协会测试单变体。而有趣的和支持的已知表型关联的罕见COL4A1 / A2症状,必须注意在解释表型变异携带者的Geno2MAP这个数据库并不是代表人口样本,不提供数据,允许测试统计浓缩的变体。我们观察到的预测效果的差异确定变异在注释的方法。然而,注释的方法可能会产生截然不同的预测变量的影响由于变异保护和其他特性加权的变体。48,49由于其罕见,这些变异在现有归责我GWAS数据集使用人权委员会和TOPMed参考板返回非常贫穷的归责质量分数,防止额外的形式的复制。
此外,有挑战将UKB数据集成到我们的学习。首先,我情况下的异构表现型UKB是一个主要的担心可能会大大影响我们的遗传模型。50根据icd -例如,我状态代码电子健康记录不如手动表现型我精确的情况下,由于缺乏区分零星的主我和二次我造成的创伤,脑瘤,出血性缺血性中风的变换,血管畸形,和其他因素,即使在卫生保健从业者。此外,相对年轻的时代,我病例数低、缺乏我裁定UKB使它并不为这个应用程序验证数据集。
这项工作是持续发展的遗传基因定位的研究胶原IV孟德尔疾病通过识别风险变异零星的疾病。这些测序结果建立在现存GWAS我的证明COL4A1和COL4A2导致零星的我不仅通过尚未知之甚少机制相关协会在常见变异但罕见变异,也可能改变蛋白质结构。我们的观察从测序数据集作为共享本文通过大幅增加我们理解的负担和频谱COL4A1/COL4A2罕见的零星的我的变化。给定的意义13 q34罕见和常见的变体的研究我,研究建立在我们的观察可能联系单基因和多基因的致病过程,这是我在这个轨迹风险。
研究资金
224年美国支持US-NINDS R01NS103924 NHLBI RS&G英国MRC / R005567-1先生G0900428 G1002605, 203699 / Z / 16 / Z。提供的有针对性的测序服务西北华盛顿大学基因组学中心,基因组科学部门,根据美国联邦政府合同号HHSN268201100037C国家心脏,肺和血液研究所(RS&G 224)。t·阿格塔米尔支持资金来自英国医学研究理事会(MRC);先生/ R005567-1)、中风协会(PPA) 2016/02,英国和心脏研究(RG 2664/17/20)。MRC /支持的关键研究中风协会临床研究培训奖学金(G0900428)授予Samarasekera博士威康信托基金会临床研究培训奖学金授予罗德里格斯博士(203699 / Z / 16 / Z),和一个MRC高级临床奖学金(G1002605)授予Al-Shahi萨尔曼·教授;项目支持的DNA测序是格兰特MRC(先生/ R005567/1)。表现型收集1921洛锡安是由英国生物技术和生物科学研究委员会(BBSRC),英国皇家学会,苏格兰政府的首席科学家办公室。表现型收集在1936年是由洛锡安时代英国(断开连接心灵项目)。全基因组测序的洛锡安出生队列由BBSRC。
信息披露
j .钟g·汉密尔顿,m . Kim马里尼,蒙哥马利,j·亨利,A.E.曹,D.L.布朗worral博,参考Meschia, S.L.希里曼,m·斯莱姆D.L. Tirschwell, C.S. Kidwell, b . Kissela克里格林伯格,a . Viswanathan J.N. Goldstein C.D. Langefeld, k . Rannikmae C.L.M. Sudlow, n . Samarasekera和m . Rodrigues报告没有披露。r . Al-Shahi萨尔曼报道英国心脏基金会的资助下,中风协会和通用电气医疗集团有限公司支付给爱丁堡大学外提交的工作。S.E. J.G.D.普伦德加斯特哈里斯,宝贝儿,d .哇,j . Rosand和t·阿格塔米尔报告没有披露。C.D.安德森报告赞助研究来自美国国立卫生研究院的支持,美国心脏协会,马萨诸塞州综合医院,以及拜耳股份公司,并咨询ApoPharma,公司去首页Neurology.org/N为充分披露。
附录的作者

脚注
去首页Neurology.org/N为充分披露。资金信息和披露认为作者相关的,如果有的话,年底提供这篇文章。
↵*这些作者的贡献同样这项工作。
这篇文章加工费由UKRI,格拉斯哥大学。
- 收到了2020年11月17日。
- 接受的最终形式2021年4月19日。
- 版权©2021年作者(年代)。发表的Wolters Kluwer健康,公司代表美国神经病学学会。首页
这是一个开放的分布式根据文章知识共享归属许可4.0 (CC),它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。
引用
- 1。↵
- 2。↵
- 3所示。↵
- 4所示。↵
- 5。↵
- 6。↵
- 7所示。↵
- 8。↵
- 9。↵
- 10。↵
- 11。↵
- 12。↵
- 13。↵
- 14。↵
- 15。↵
- 16。↵
- 17所示。↵
- 18岁。↵
- 19所示。↵
- 20.↵
- 21。↵
- Halachev米,
- Meynert一个,
- 泰勒女士,等
- 22。↵
- 23。↵
- 24。↵
- 25。↵
- 26岁。↵
- 27。↵
- 28。↵
- 29。↵
- 30.↵
- 31日。↵
- 32。↵
- 33。↵
- 34。↵
- 35。↵
- 36。↵
- 37岁。↵
- 38。↵
- 39岁。↵
- 40。↵
- 41岁。↵
- 42。↵
- 鲍尔斯KJ,
- 周润发德,
- 徐H,et al。
- 43。↵
- 金米,
- KwonJ,
- 咕霁,
- 崔Y,
- 赵AE
- 44岁。↵
- 45岁。↵
- 46岁。↵
- 47岁。↵
- ChakkalakalSA,
- HeiligJ,
- 鲍曼U,
- Paulsson米,
- ZauckeF
- 48。↵
- 49。↵
- 米勒我,
- 蚀Y,
- 里奇医学博士
- 50。↵
信:快速的网络通信
你可能也会感兴趣
相关文章
-
没有找到相关文章。
主题讨论
提醒我
推荐的文章
- 摘要
25学报》国际中风遗传学财团车间:英国剑桥Jemma c .霍普韦尔马修·Traylor休·s·马库斯等。
首页神经学:遗传学,2020年5月21日 - 文章
具体地点的颅内出血的危险因素系统回顾和荟萃分析
丰益M.T. Jolink,加布里埃尔·金Wiegertjes J.E. Rinkel et al。
首页神经学,2020年7月20日 - 摘要
24日国际中风遗传学协会学报》研讨会:华盛顿特区,美国Paul a .尼奎斯特,约翰·w·科尔et al。
首页神经学:遗传学,08年4月,2019年 - 文章
皮质表面铁尘肺和首次脑出血脑淀粉样血管病格雷戈勒Boulouis Andreas Charidimou,李雄等。
首页神经学,2017年3月29日