(转载)林林病因诊断初步报告-②


转载自:“优乐复生  TAALSM校友”的微信公众号

11月3日,我们发布了关于林林病因的第一份阶段性报告,得到了广大校友和专业人士的关注。除了向大家汇报了林林病因诊断的初步结果,这份报告还让很多人第一次接触到遗传疾病的分析报告,有一定的科普意义。

今天我们发布第二份初步报告,来自北京优乐复生科技有限公司——

2015年8月23日,一封求助信《孩子罕见病,五年未确诊,清华校友求病因线索!》由清华校友平台公布后,受到了社会和业界的广泛关注。一对清华校友夫妇的孩子林林在出生后不幸患有罕见疾病,从满月至今近6年时间里饱受疾病折磨,目前已只能住在医院ICU病房里,靠呼吸机生存。

为尽快查明致病原因,包括清华大学医学院、阜外医院、复旦附属儿童医院、贝勒医学院、波斯顿儿童医院、香港大学、南加州大学、北京希望组、米宝有约、华大基因、药明康德明码生物在内的多家公司和机构联系林林父母,获得了林林的外周血样本,同时进行了线粒体和全外显子组测序;随后也获得了林林父母的许可,对数据进行了及时公开,以便让更大范围的专家学者参与数据分析解读,尽快获得确切结论。这与长期以来的测序-数据-分析流程全部由同一单位实施有所不同,可以说开创了一种公益性的疑难杂症遗传学分析的众包组织模式。

北京优乐复生公司作为其中的一个参与方,在获得北京阜外医院及华大基因分别提供的患儿林林的 WES 数据后,对数据进行了分析,后期又在阜外医院和米宝有约的大力帮助下,获得了患儿父母及患儿妹妹芊芊的WES及Sanger测序结果。在分析中,我们初步鉴定了一个疑似致病突变。目前,后续实验正在开展过程中。

在数据分析过程中,我们总结了一些经验教训,包括数据分析和生物学判断本身,也包括遗传罕见病的公益性组织模式。现将我们的参与过程详细记录,供更广泛的讨论和参考。

先症者背景

林林于2009年12月足月顺产,妈妈孕检一切正常,父母双方及其它家族成员皆无遗传病史。刚出生时的小林林哭声比较弱小,之后出现喂食困难,继而又因肺炎、窒息等多种状况住院治疗。三月龄及周岁脑部 MRI无异常发现,血液检查发现CK升高,肌电图显示神经传导正常,肌肉活检显示“纤维粗细差异”。六月龄始出现眼动障碍,体检示“心脏瓣片较厚但不影响功能”。由于呼吸系统障碍,林林先是佩带biCap机来协助气流压入呼吸系统,之后情况进一步恶化,林林不得不接受经插喉管呼吸机。林林的父母为了找出病因,辗转各处求医,但均无确切诊断结果。

在林林将近四岁时,他的妹妹芊芊出生。刚出生的芊芊健康正常,但不久也出现轻度喂食困难,后来芊芊感染RSV病毒(婴幼儿常见)并出现多痰而住院治疗。幼小的芊芊在18月龄体检发现心衰先兆症状,“院内感染副流感导致心肺衰竭”,服用地高辛后心衰症状康复,停服地高辛后心衰再次发作。

数据分析

优乐复生在获得了林林的原始测序数据后,即组织公司内最精干团队开展了数据分析工作,以期尽早确定致病原因。

按照林林及芊芊表型,神经网络分析可能为线粒体功能障碍,肌肉代谢障碍。另外,在分析林林的全外显子测序结果时,我们也发现林林携带较高比率的低丰度错义突变,体细胞突变率比数据库中的健康人群对照组相对高,提示DNA修复或基因组稳定性受到影响。由于林林的全外显子测序未显示DNA修复相关基因突变,我们怀疑呼吸链或能量代谢链受到一定压力,这也与前述的表型分析能相互印证。

由于母系家系无发病史,可初步除外母系线粒体杂合漂变,考虑常染色体突变。我们考虑了几种遗传模型,包括符合AR(常染色体隐性)的SNV/indel(SNV:单核苷酸突变;indel:短插入缺失),符合CH(复合杂合)的SNV/indel/SV(SV:染色体结构变异),de novo dominant(新生显性突变)的SNV/SV,以及外显率不完全的孟德尔遗传。我们首先分析了可能的AR/CH情况,但是没有发现任一基因上存在两个可能的致病变异。由于penetration非常强(两个孩子均患病),外显率不完全的概率也不高。这样我们只剩下denovo的一种可能。

因为没有父母对照,我们在林林测序数据中发现的单倍体变异是否属于新生变异实际上是不明确的,我们只能把测序数据中每个被发现的罕见突变都作为可能的致病突变来考虑,这么一来,仅仅需要分析的错义突变(改变蛋白质序列的突变)就达到了500多个。通过将表型输入神经网络进行迭代分析,我们得到了接近50个候选突变。

比较幸运的是,这里面还没有SV突变,都是SNV。否则的话,可能就没办法继续往下排查下去了。对于SNV,我们还能做结构。实在没办法,我们只能对每个携带突变的基因,找出其蛋白质晶体结构(有的只有同源蛋白质结构),一个个去做分子模拟。通过这种方法,我们排除了其它所有罕见突变,定位了一个和肌肉能量代谢相关表型符合,在人群中未发现的突变PFKM E629K。

PFK的中文名是磷酸果糖激酶,催化糖酵解的第三步。在人基因组中,存在PFK的两个homolog(同源基因)PFKL(肝磷酸果糖激酶)和PFKM(肌肉磷酸果糖激酶),另外血小板中还存在第三个同源基因PFKPL(血小板磷酸果糖激酶)。PFK以四聚体形式存在,在肌肉中,只存在PFKM形成的四聚体;在红细胞中,存在PFKM和PFKL组合而成的四聚体。PFK的底物是F6P(磷酸-6-果糖)和ATP,催化产物是F(1,6)P2和ADP。通过分析结构,我们发现PFKM E629侧链正好位于该结构的F(1,6)P2结合口袋(图1:A),该口袋也能结合PFKM的强别构调控分子F(2,6)P2,而后者是PFKM酶活的关键调节分子。E629K突变(图1:B,C,D,F)使整个结合口袋区的电荷分布发生了变化,从结构上来看(图1:E,G),酶功能会受到很大影响。这个结合口袋结构来源是酶二聚体,即使是一个正常的PFKM,结合一个突变的PFKM以后整个酶二聚体也会受到功能上的影响。因此,我们考虑PFKM E629K为一个显性突变。

643

图1:A. PFKM 结构(hmPFKM: PDB 3O8N),示PFKM单体结构及E629。B/C:PFKM E629K突变(resi 629 as sticks);D/F: PFK1(hmPFKpl: PDB 4XZ2) E639K(PFKM E629同源氨基酸侧链, as sticks)突变及电荷分布图,红色为负电,蓝色为正电;E/G: F(1,6)P2(sticks)结合于结合口袋。

PFKM突变造成糖原贮积病 7 型(Tauri disease)。该疾病表型与林林肌肉表型部分相似。部分糖原贮积病 7 型病人为新生儿期发病并迅速发展。严重糖原贮积病 7 型表现为溶血及贫血表型,且运动后可能表现黑尿症,在林林病历中未见。林林携带E629K 突变为杂合,可能为显性负性,根据其蛋白结构推测,假如PFKM E629K为显性负性,肌肉在最坏情况下仍具有 1/4 PFK 功能,红血球在最坏情况下仍具有 3/4 PFK 功能(红血球中同时表达 PFKM 及 PFKL),为可能的一个解释。

在我们从蛋白结构角度入手获得疑似致病的PFKM E629K突变信息之后,我们向林林妈妈申请了父母及芊芊的全外显子测序数据,以及全家的CNV芯片数据。经过验证,芊芊和林林均携带PFKM E629K突变,而父母均不携带(图2)。从我们获得的信息显示,该结果也已被Sanger测序验证。另一方面,我们在不预设先验条件下,使用遗传模型对所有quartet测序数据进行过滤以后,使用神经网络对表型和基因型进行分析,同样只获得了同一个疑似致病的PFKM E629K突变。与单proband WES SV分析一致,CNV芯片分析没有发现任何可能致病的结构变异。因此,我们认为PFKM E629K突变的致病可能性较高。该突变在quartet中遗传模式符合de novo dominant模型,因此,我们认为该突变很可能为一个de novo显性负性突变,突变来源可能为父母其中一方的配子嵌合。后续确认还需要进一步的生化功能实验和分子生物学验证,正在安排展开。

644

图2. 林林/父亲/母亲的PFKM E629K 突变位点二代测序覆盖结果。

总结

近3个月来,优乐复生科学家团队与林林的母亲及业内合作伙伴保持密切沟通,不断验证研究结果,利用数据分析技术鉴定了一个疑似致病突变,并将在此基础上继续协助林林父母对林林的病因展开进一步深入研究。在此我们首先要感谢所有无私提供测序及临床数据的相关机构,也要感谢林林父母同意我们将相关病历及分析过程作为案例向业内公开,与更多的专业人士和机构共同探讨和交流,为林林及可能的更多类似罕见病患者提供帮助。

在这个案例的分析过程中,优乐复生团队认为,尽管全外显子测序在罕见病诊断方面具有很强的解析能力,单测proband(先症者)的策略却很可能流于失败。实际上,在这个案例中,如果不是SNV突变而是一个haploinsufficient CNV甚至是SV,那单纯使用proband测序结果很难拿到结果;即使是SNV突变,如果不是恰好是个蛋白结构很清楚的突变,也没有做过生化,也很难说能不能拿到结果。另外,在测序中的许多平台/实验方法引入的错误,同样可以通过同平台的对照测序数据得以排除。我们认为,对疑难病人trio甚至quartet进行直接全外显子测序,可以缩短从测序到发现鉴定病因的时间,提高鉴定病因的成功率,在很多情况下,对病人是费效比较高的策略。对于某些特定种类疾病,在表型有嵌合特征时,可考虑高深度WES测序。对于SV鉴定,我们认为低覆盖度WGS的费效比应该更高。

其次,表型的鉴定十分关键。在这个案例中,UCL提供的肌肉活检报告提示“类CHKB肌病”,从病理层面直接鉴定了发病位置。临床表型相对复杂,许多表型可能是次生产生,不完全与遗传学有关,但对于严重疾病来说,一定存在一个核心表型直接与遗传背景关联。如何从纷繁复杂的表型中寻找出核心病理缺陷,既要依靠专业病理判断,也要依靠临床经验,还要依靠对生物学的深刻理解。目前优乐复生不仅依靠科研团队的判断,也使用机器学习算法对临床数据和观察结果进行特征分析。实际上,引入数据技术不仅能帮助临床表型判断,可能也可以通过相互迭代,逐步逼近核心基因型-表型关系。在准确判断表型的基础上,我们认为通过一些传统人类遗传学技术以外的方法,如将结构生物学,蛋白相互作用,深度学习发现的可变剪切等引入遗传分析,对鉴定的成功率也有很大的帮助。

最后,我们认为,这类类似“公益众筹”的疑难遗传病测序分析模式,在这次事件后会迅速流行起来,作为遗传病研究机构,优乐复生也很愿意参与。但我们认为其中的知情同意,法律授权,数据归属,结果交流,数据发布等环节需要进一步正规化,否则,对病人及其家庭并无实质帮助,甚至会有一定负面作用。

联系优乐复生:

北京市海淀区永丰工业园丰贤中路7号孵化楼B座4层

赵欣:zhaoxin@eulertechnology.com

0086-18610080763

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注