作者:Peng Chen

(转载)林林病因诊断初步报告-①


转载自:“北京希望组  TAALSM校友”的微信公众号

641

自8月23日我们发出《孩子罕见病,五年未确诊,清华校友求病因线索!》后,已过去两个多月。在这期间,林林和他的父母得到了众多清华校友、企业和媒体的关注。

我们在8月29日《来自TAALSM和林林父母的感谢信》中列示了提供帮助的机构名单,在这里我们再次感谢以下机构的大力支持:

  1. 华大基因
  2. 清华大学医学院
  3. 北京希望组生物科技有限公司
  4. 北京德易检验所
  5. 药明康德
  6. 美国贝勒医学院
  7. 广州嘉检医学
  8. 南加州大学
  9. 复旦大学医学院
  10. 美国哈佛大学波士顿儿童医院
  11. 盛诺一家
  12. Rare Genomics Institute China
  13. 美国约翰霍普金斯大学
  14. 北京航空医学研究所附属医院分子病理中心
  15. 上海市儿童医院
  16. 香港大学医院
  17. 北京国际医疗中心
  18. 北京协和医院
  19. 清华长庚医院
  20. 北京儿童医院
  21. 北京解放军总医院(301医院)
  22. 湘雅医学院儿科组
  23. 北京阜外医院
  24. 优乐复生
  25. 米宝有约
  26. 水晶基因

(以上排名不分先后)

经过国内外众多机构、专家的共同协作,对林林、芊芊和父母的线粒体DNA、全基因组的测序工作已经完成,各家提供免费测序的机构也将测序结果进行了符合伦理规范的有限共享,多家数据分析机构和个人提供了分析报告。

从今天起,我们会陆续发布一些机构提供的报告,以向各位校友、关心林林的各界热心人士报告有关工作进展,同时希望借此可以向大家传递基因测序、遗传病和罕见病的相关知识,让大家了解罕见病确诊的艰难。也希望对基因测序、分子诊断的校友和专业人士仍然能够关注林林,关注行业的努力,共同推动行业发展。

今天的报告,来自“Fellowship for Linlin小组”。

注:“Fellowship for Linlin小组”由清华大学医学院、阜外医院、南加州大学、香港大学、北京希望组、米宝有约等机构组成。

林林基因测序数据分析报告

主笔:北京希望组

清华校友夫妇的孩子林林和芊芊罕见病的问题,由清华校友平台公布后,受到了社会和业界的广泛关注。三家测序公司或机构联系林林父母,进行了基因检测,希望找到致病的原因。

我们这支由清华大学医学院、阜外医院、南加州大学、香港大学、北京希望组、米宝有约等机构组成的被称为“Fellowship for Linlin”的小组,在尹银亮博士的协助下,首先获得了林林的外周血样本,同时进行了线粒体和全外显子组测序;随后华大基因也获得了林林父母的许可,同时进行全外显子组和线粒体的测序工作;药明康德明码生物、复旦附属儿童医院、贝勒医学院及波斯顿儿童医院等组成的小组也随即开展了林林样本的全基因组测序工作当中。

三方人员获得的数据及时进行了公开,以便让更大范围的专家学者参与数据分析解读,尽快获得确切结论,这确实也开创了一种公益性的“疑难杂症”遗传学分析的组织模式。

这三方的相关人员也集中在一个名为“林林的国际诊断合作组”的微信群内,与贝勒医学院、波士顿儿童医院等地的专家一块解读数据,讨论基因测序的结果。微信公众号“水晶基因”对整个过程进行非常不错的总结及评述,在这里我们不在重复叙述。

北京希望组作为其中的一个参与方,我们将已经公布的相关数据和我们的分析数据汇总整理,详细记录一下我们参与整个项目的过程,希望与大家共同努力加速对疾病病因的分析。以下我们分为事件背景,林林线粒体测序,林林外显子测序,武汉会谈,家庭外显子测序,基因拷贝数分析,总结等7个章节来详细还原事情的经过。

事件背景

事情的起始是源自于2015年8月,林林芊芊父母及清华生命科学与医学校友会发出的《孩子罕见病,五年未确诊,清华校友求病因线索!》的求助信,信中希望更多的专业人士能够提供关于该家庭罕见病病因的线索。信中详细描述了林林及其妹妹芊芊的临床相关信息。这些临床信息,是寻找并发现疾病病因的重要资料。林林芊芊的临床表型在微信上被简单归纳如下,但是具体的详细信息请参见原始的清华校友群平台的帖子。

2009年12月,林林出生了。他是足月顺产,之前的妈妈孕检也一切正常,且父母双方皆无遗传病史。只是刚下生的小林林哭声比较弱小,之后便出现喂食困难。继而又因肺炎,窒息等多种状况住院治疗。由于呼吸系统障碍,林林先是佩带BiPAP机来协助气流压入呼吸系统。之后情况进一步恶化,林林不得不接受经插喉管呼吸机。林林的父母为了找出病因,辗转各处求医。但均无确切诊断结果。

在林林将近2岁半的时候,他的妹妹芊芊出生了。刚出生的芊芊健康正常,但不久也出现轻度喂食困难。后来芊芊感染RSV病毒(婴幼儿常见)并出现多痰而住院治疗。幼小的芊芊在18个月时开始发生反复心肺衰竭。

经过详细的分析,从最初公布的林林与芊芊的临床信息中,我们发现林林和芊芊的临床症状比较复杂,无法确切获得可能的临床诊断结果,而且两个孩子之间相同或相似的临床症状较少,主要集中于肌肉病相关症状(如血液肌酸激酶-CK偏高,眼肌麻痹,近端肌无力等);其它临床症状差异较大(如林林主要表现呼吸功能不全,如呛奶、反复性肺炎、多痰、窒息等;而芊芊则主要表现为心脏功能障碍及心肺衰竭等),初步无法判断哪些症状是由遗传因素引起,哪些是由环境因素引起。

有鉴于此,通过与几个微信上面的专家群的讨论,我们认为首先以线粒体测序加上外显子测序技术为基础,寻找导致林林所患疾病的可能的遗传学病因是一个比较切实可行的方案。其它分析小组的专家也陆续采取了类似的实施方案。

值得强调的是,作为一个公益项目,虽然我们在免费帮助患者,我们也希望通过以符合国际规范的正规的流程来运作,所以从项目最开始,我们就利用了已有的伦理项目流程,并且与患者家庭签署了知情同意书。虽然我们不知道其他机构是否也通过了类似的流程与手续,我们认为这一步骤在遗传病诊断的公益活动中是必不可少的。

641

图1. 照片里是来自清华大学校友和她的孩子林林,及两位医护人员。在从满月开始,迄今将近6年的时间里,林林饱受疾病的折磨。尤其是在过去的一年半时间里,他都只能住在医院ICU病房里,靠呼吸机帮助呼吸。更令人不安的是,离孩子发病已经五年多时间,虽然有一些医生的推测结果,但确切的病因仍未确定!

林林线粒体测序

由于林林与芊芊的具体表型差异很大,我们认为线粒体疾病有很大的可能性。其实一种病在不同个体表现各有差异, 最典型的例子就属线粒体疾病的异质性。一个携带有某种线粒体突变的母亲可以传递给各个子女不同数量的突变线粒体DNA,进而导致子女之间的临床表现迥异。

这里需要强调的是,我们没有办法取得林林的肌肉样品,所以采取了外周血,在香港大学医学院提取了DNA,然后在阜外医院分子诊断中心试验室进行Sanger测序。(在此感谢这些工作人员,他们牺牲周末的时间加班加点完成测序工作!)值得强调的是,在临床上有一种情况,是含有有害的线粒体的细胞在血液中的含量由于细胞生物学的原因会随着年龄增长不断减少,所以在血液中的含量可能比较低,在患者几岁之后有可能不容易甚至不能被测序的方法检测出来。

在测序结果出来以后,米宝有约发布了微信新闻,首先对社会公开了测序数据。数小时后,华大基因也发布微信新闻,公布由二代测序所产生的数据与他们对于数据的解释。经过我们自己Sanger测序数据的分析,我们没有能够找到可以解释林林疾病的突变。与此同时,为了防止这种低频的有害突变无法被Sanger测序找出来的情况出现,我们也重新分析了华大基因的二代测序数据(在此感谢华大基因对于二代测序数据的共享),虽然看到了一些比较罕见的突变,但是没有能够找到我们认为比较可信的致病突变。

林林外显子测序

在线粒体测序的同时,阜外医院的工作人员也在对林林马不停蹄的进行外显子组测序。与此同时,华大基因也在对林林进行外显子组测序。有鉴于外显子测序数据会有可能的隐私泄露的问题,所以数据的公布需要非常谨慎,一般为有限制的对于有专业能力的团队进行公开。在华大数据出来后在最短的时间进行了有限制的公开,所以我们将华大数据与阜外数据结合进行了分析,希望能够更准确的找出结论。我们的数据也在产生出来后,由米宝有约进行了有限制的公开。

值得强调的是,许多国内国外的团队对于数据进行了申请,也立刻在微信上发布对于数据进行五花八门解释的报告。这些团队加起来找出了十余个所谓的可能致病突变。在我们看来,这是一种不太负责任的做法,对于患者家庭和其亲属造成了不必要的困扰,对于公众也有一些误导作用,反而使得基因检测的公信力下降。当然,这些报告的出发点是好的,但是部分国内测序公司相对而言缺少严格的临床训练与医学遗传学背景,也缺少严谨的科学态度,把科研级别的报告当成临床级别的报告给出来了。所以,在没有明确结论的时候,公益性的组织最好只与患者家庭和专家团队沟通初步结论,而非因为各种各样的原因在媒体上匆忙发布信息。

我们小组的数据分析专家经过讨论得到以下结论:在林林的全外显子测序结果中,未发现可能的符合隐性遗传模式且对应疾病符合林林已知临床症状的变异(即基因中存在两个可能有害的变异或者一个可能有害的纯合变异)。这一结论否定了在微信上某些团队已公布的分析结果。造成这种分析结论偏倚的主要可能原因之一,是临床症状的高度复杂性,这种复杂性可能使分析人员无法确定:1)患者所患疾病是否一定为遗传病?2)临床症状中哪些可以由环境因素解释?等等问题。

武汉会谈

为了更准确地掌握相关临床信息进行进一步的数据分析,我们北京希望组的一个专家团队与林林母亲于9月11日在武汉光谷生物城进行了4个多小时的会谈,详细收集并分析了林林与芊芊的临床症状,主要是为了确定两个患儿的临床表型是否存在一致性;在繁杂的临床症状描述当中,分辨出哪些症状可能是由于遗传因素引起,哪些可能是由于环境因素(尤其是医疗干预手段)引起;如果不排除遗传病的可能,其可能的遗传模式有哪些等等问题。

我们认为,这种与患者家属的沟通对于罕见遗传病的检测及其重要,毕竟很多重要的信息可能没法从公众平台获得或被忽略。举例而言,许多罕见遗传病都有特异的面部畸形特征,所以面部畸形是临床上用来作疾病诊断的重要参考;林林有明显的面部畸形,如果光看照片可能会认为这是某种遗传病的标志。其实,林林妈妈告诉我们,林林出生后并没有任何面部畸形,所看到的表型只是因为长期携带BiPAP机压迫面部的后天原因造成的。

结合之前公布的临床信息,我们重新整理分析了林林和芊芊的临床症状,并提出了我们比较认可的假设,如下:

1. 出生后体征

(1)林林出生后哭声较小(芊芊出生后哭声正常,林林出生即表现有呼吸功能稍弱的情况,支持后期肌无力的推测);

(2)出生后3天出现喂食(吞咽)困难,满月出现呕奶、呛奶(之后出现肺炎), 肺炎住院期间,喂奶出现第一次窒息,转入ICU抢救。支气管软镜和硬镜检测显示正常。吞钡餐检查(VFSS)显示吞咽困难,其后喂奶时再次出现窒息(血氧心跳急速下降),严重时全身发紫。之后,林林身体状况变得更为糟糕,这个可能导致脑发育损失的事件可能是后期多数严重的运动能力障碍(如面部及肢近端肌无力,眼肌麻痹,爬行能力较弱,颈部无力,一岁半时不能单独走路,两岁多时有明显改善,睡眠时常伴有痰液过多的情况,长期需要物理排痰等)的分水岭;(芊芊则可以较好地进食,但仍表现出肌肉无力的症状。出生后兄妹两有不同程度的支持肌无力的临床表现。后期的严重的运动能力障碍可能是由于首次出现的严重窒息导致的继发性的医源性的功能障碍)。

(3)在出生后20多天,林林睡眠时出现鼾声;四个月时,发现林林在睡眠时,血氧异常,口水堵住呼吸(而芊芊无明显此方面异常,兄妹两人在呼吸系统功能方面表现不一致,但不排除芊芊肌无力的症状比较轻的,未发展到夜间睡眠呼吸功能异常的可能)。

(4)初始心脏功能正常,后出现心脏septum稍增厚,但无功能异常;而芊芊在首次出现心脏功能异常前,心脏功能及结构检测均显示正常。满月前后发生RSV病毒感染并入院治疗,16个月大时因肠胃炎入院治疗,18个月大时常规检测发现心脏发大,后在医院感染副流感病毒,出现心脏衰竭,抢救后定期服用Digoxin和Captopril在停止服用Digoxin后心脏再次发大,并引发心衰。(兄妹两人心脏的结构功能表现明显不一致,由于芊芊心脏在发病前无明显结构异常,心脏扩大及后期的心衰表现,发生在病毒感染后,暂时不排除为病毒所导致)。

2. 疾病家族史

父母双方表型正常,无家族遗传病史。

3. 遗传因素

由于两个患儿在出生后短时间内均表现出相近的(虽然程度有所差异)肌无力症状,所以目前仍无法排除两患儿所患疾病为遗传性疾病的可能。到底哪些性状是由遗传因素引起的呢?我们认为,面部及四肢无力(包括吞咽困难)可能是唯一的遗传性状,也在林林和芊芊身上共有。其他的任何性状都是后发性的或者是医源性的(如后期的严重的运动功能障碍,心脏的功能障碍等等)。

4. 环境风险因素

有很大可能是由环境因素导致的新发基因变化。这种新发突变每个人都会有,完全是随机的,只是偶尔会发生在导致疾病的基因上面,纯属坏运气而已。由于隐性遗传模式的分析方案未获得可能的候选位点,结合最新的在武汉会谈中得到的相关信息,我们认为需要立刻将思路往新发变异方面转移。

图2. 林林妈妈访问北京希望组位于武汉的办公室,与公司成员进行交谈,帮助更好的确定病因,以及更好的理解测序数据。

父母与芊芊外显子测序

与Sanger验证

基于武汉会谈的结果,我们决定对于林林父母也进行外显子测序,寻找新发突变来解释病因。感谢广州暨南大学医学院的研究人员进行了血样的采集和DNA提取工作,并且再次感谢阜外的工作人员进行测序!

对于家庭成员的全外显子组测序结果的分析后,我们发现至少三个新发变异,包括在PFKM,COL6A5和SIPA1中的错义变异,能够改变蛋白质的编码。根据我们的沟通,发现药明康德找到了其中两个变异(PFKM,COL6A5),但是并没有发现SIPA1的变异。

与此同时,我们与药明康德成为仅有的两家拿到芊芊DNA的机构,所以也进行了外显子组测序。测序结果表明,芊芊也有与林林相同的在PFKM和SIPA1 中的错义变异,所以这两个突变和基因的致病可能性增加了很多。

为了更一步确认不是由于测序的误差导致的假阳性,我们又针对这两个突变在全家四个人中进行了Sanger测序,结果表明完全符合我们在二代测序中的发现,也就是说,林林和芊芊都有在PFKM和SIPA1中的新发突变,但是父母没有。

SIPA1基因与疾病的关系尚无明确报道,位于该基因上的新发错义变异未被已有文献报道,不存在于已知变异数据库(包括1000G,ExAC,dbSNP,ESP,Clinvar,HGMD等)中。生物信息学预测软件(SIFT、Polyphen2等)均预测该位点为可能有害变异,物种间保守性高。该基因产物的相互作用蛋白GATA2上游调控蛋白编码基因FHL1,是多种临床症状截然不同的X连锁肌病的致病基因,主要共同临床症状为发病于儿童早期或成年期的严重的(或进行性)肌无力、血清肌酸激酶轻度升高及呼吸衰竭等。但是无直接证据证明该基因本身与肌肉病有关,所以尚无法确定该基因变异与已知临床表型之间的关系。

另外一个新发变异是位于PFKM基因编码区的错义变异,可能与肌肉疾病有关。 这是一个从未被报道的变异,生物信息学分析(SIFT,Polyphen2等)均预测是有害变异,物种间保守性高,已知该基因的致病性变异导致常染色体隐性疾病—糖原储积病,主要表现为肌肉疼痛痉挛,运动不耐,肌肉痉挛抽筋,劳累型肌病及代偿性溶血,根据最新的来自ACMG 2015年的基因变异临床意义判读指南,我们认为该变异为疑似的致病性变异。我们只找出该基因一个可能有害的突变,鉴于所有外显子的测序覆盖度都比较高,假阴性可能性不大(虽然也不能排除微小结构变异)。但是由于遗传模式不符合,所以没法给出确定的诊断。

图3. PFKM和SIPA1的基因变异位点在家系成员中的分布情况。该变异位点仅出现在林林和芊芊的测序数据中(父母未携带),从两个基因变异位点的测序深度及变异所占比例看其数据可靠性高,Sanger测序验证了这一结果真实。

基因拷贝数变异

鉴于我们只能找到一个在PFKM中的有害突变,我们认为存在由结构变异导致隐性遗传疾病的可能,所以下一步我们决定对于家庭进行基因拷贝数的基于Illumina 和博奥芯片平台的检测。这里要感谢博奥晶典生物技术有限公司和博奥检验,在知道我们短时间内没有Illumina 芯片后同意免费利用他们的DNA拷贝数检测平台对于家族进行检测。同时阜外医院及时找到Illumina中华八的900K芯片,也免费进行了基于该芯片的拷贝数变异检测及分析。

我们的初步分析结论:高密度的全基因组范围的染色体芯片检测未发现明显的与已知症状相关的致病性的结构变异。但由于染色体芯片在以上候选基因内部探针分布密度不足(与芯片探针设计分布及基因较小等情况有关),所以很遗憾,利用厂家的分析软件,我们无法从已有芯片数据中看出以上候选基因尤其是PFKM基因内的微小结构变异情况。

总结

经过将近3个月的连续科研,在其他研究团队都已经淡忘或者放弃林林这一个病例后,我们依然在关注,也在想尽办法进行更进一步的分析。尽管目前我们仍然没法给出100%肯定的结论,在这3个月奋战的过程当中,我们自己也接受了一次对于罕见遗传病的再教育,进行了一次对于基因测序行业浮躁现状的观礼,也认识了一些热心的志同道合的朋友。在此我们还要感谢各位在这场战役中提供专家意见与信息的学者和热心人,包括美国贝勒医学院临检实验室的多位教授,美国哥伦比亚大学的专家,美国费城儿童医院的疾病专家等等,就不详细列举了。

基于以上的研究工作,我们认为下一步的分析需要关注以下一些问题,以供学术团体探讨:

(1)关于线粒体的分析结果。目前线粒体的分析结果未发现临床意义比较明确的有害变异,结合线粒体疾病的遗传异质性,可知单独检测外周血细胞的线粒体情况可能会忽略对疾病相关区域组织(如肌肉组织,尤其是与呼吸系统相关的肌肉组织)的线粒体变异信息。

(2)高分辨率的全基因组范围的染色体芯片检测数据中,初步分析结果未发现可能的与临床症状有关的有害变异,下一步可能需要对芯片数据的原始数据利用更灵敏的软件进行详细的分析,以确定受检者基因组在更小的结构变异水平是否存在可能的有害的变异的可能。

(3)进一步的针对严重窒息导致的器官损伤的检测,有助于确定林林后期的严重的运动功能障碍是否是由于这种医源性的损伤导致;对芊芊所服用药物的作用机制、副作用情况、施用情况等临床治疗情况的分析,有助于确定芊芊后续严重的心肺功能障碍是否同样是由于医源性的损伤引起;这些辅助临床检测可以帮助理清临床表型中的遗传因素引起的结果和环境因素引起的结果,有助于排除数据分析中的干扰。

(4)在PFKM中只找到了一个可能的有害突变,不符合经典的PFKM的隐性遗传模式。不过,在遗传学上有很多例子,哪怕是隐性遗传疾病,也有些突变会有dominant negative的作用,使得有该突变的人产生临床性状(一般而言,与经典的隐性遗传性状可能有所不同,或是会轻微一些)。这种可能性非常大,但是需要更多的功能性验证。

(5)贝勒医学院的专家团队在仔细讨论临床表型后指出:现有的影像,病理和代谢的检测结果显示与他们见过其他肌肉病病例相比,也是非典型的。虽然遗传因素无法排除,临床也要考虑病毒类,或自身免疫性的原因。

(6)组织更广泛的专家团队,对已知的候选致病基因位点进行详细的可靠的体内或体外的功能学验证,进一步提供对遗传学分析结果的证据支持。虽然现阶段结果没有建立明确的基因诊断,但是不要着急和失去希望,对于临床上的罕见个例,许多病人都是花了较长的时间才解决问题。

(转载)林林病因诊断初步报告-②


转载自:“优乐复生  TAALSM校友”的微信公众号

11月3日,我们发布了关于林林病因的第一份阶段性报告,得到了广大校友和专业人士的关注。除了向大家汇报了林林病因诊断的初步结果,这份报告还让很多人第一次接触到遗传疾病的分析报告,有一定的科普意义。

今天我们发布第二份初步报告,来自北京优乐复生科技有限公司——

2015年8月23日,一封求助信《孩子罕见病,五年未确诊,清华校友求病因线索!》由清华校友平台公布后,受到了社会和业界的广泛关注。一对清华校友夫妇的孩子林林在出生后不幸患有罕见疾病,从满月至今近6年时间里饱受疾病折磨,目前已只能住在医院ICU病房里,靠呼吸机生存。

为尽快查明致病原因,包括清华大学医学院、阜外医院、复旦附属儿童医院、贝勒医学院、波斯顿儿童医院、香港大学、南加州大学、北京希望组、米宝有约、华大基因、药明康德明码生物在内的多家公司和机构联系林林父母,获得了林林的外周血样本,同时进行了线粒体和全外显子组测序;随后也获得了林林父母的许可,对数据进行了及时公开,以便让更大范围的专家学者参与数据分析解读,尽快获得确切结论。这与长期以来的测序-数据-分析流程全部由同一单位实施有所不同,可以说开创了一种公益性的疑难杂症遗传学分析的众包组织模式。

北京优乐复生公司作为其中的一个参与方,在获得北京阜外医院及华大基因分别提供的患儿林林的 WES 数据后,对数据进行了分析,后期又在阜外医院和米宝有约的大力帮助下,获得了患儿父母及患儿妹妹芊芊的WES及Sanger测序结果。在分析中,我们初步鉴定了一个疑似致病突变。目前,后续实验正在开展过程中。

在数据分析过程中,我们总结了一些经验教训,包括数据分析和生物学判断本身,也包括遗传罕见病的公益性组织模式。现将我们的参与过程详细记录,供更广泛的讨论和参考。

先症者背景

林林于2009年12月足月顺产,妈妈孕检一切正常,父母双方及其它家族成员皆无遗传病史。刚出生时的小林林哭声比较弱小,之后出现喂食困难,继而又因肺炎、窒息等多种状况住院治疗。三月龄及周岁脑部 MRI无异常发现,血液检查发现CK升高,肌电图显示神经传导正常,肌肉活检显示“纤维粗细差异”。六月龄始出现眼动障碍,体检示“心脏瓣片较厚但不影响功能”。由于呼吸系统障碍,林林先是佩带biCap机来协助气流压入呼吸系统,之后情况进一步恶化,林林不得不接受经插喉管呼吸机。林林的父母为了找出病因,辗转各处求医,但均无确切诊断结果。

在林林将近四岁时,他的妹妹芊芊出生。刚出生的芊芊健康正常,但不久也出现轻度喂食困难,后来芊芊感染RSV病毒(婴幼儿常见)并出现多痰而住院治疗。幼小的芊芊在18月龄体检发现心衰先兆症状,“院内感染副流感导致心肺衰竭”,服用地高辛后心衰症状康复,停服地高辛后心衰再次发作。

数据分析

优乐复生在获得了林林的原始测序数据后,即组织公司内最精干团队开展了数据分析工作,以期尽早确定致病原因。

按照林林及芊芊表型,神经网络分析可能为线粒体功能障碍,肌肉代谢障碍。另外,在分析林林的全外显子测序结果时,我们也发现林林携带较高比率的低丰度错义突变,体细胞突变率比数据库中的健康人群对照组相对高,提示DNA修复或基因组稳定性受到影响。由于林林的全外显子测序未显示DNA修复相关基因突变,我们怀疑呼吸链或能量代谢链受到一定压力,这也与前述的表型分析能相互印证。

由于母系家系无发病史,可初步除外母系线粒体杂合漂变,考虑常染色体突变。我们考虑了几种遗传模型,包括符合AR(常染色体隐性)的SNV/indel(SNV:单核苷酸突变;indel:短插入缺失),符合CH(复合杂合)的SNV/indel/SV(SV:染色体结构变异),de novo dominant(新生显性突变)的SNV/SV,以及外显率不完全的孟德尔遗传。我们首先分析了可能的AR/CH情况,但是没有发现任一基因上存在两个可能的致病变异。由于penetration非常强(两个孩子均患病),外显率不完全的概率也不高。这样我们只剩下denovo的一种可能。

因为没有父母对照,我们在林林测序数据中发现的单倍体变异是否属于新生变异实际上是不明确的,我们只能把测序数据中每个被发现的罕见突变都作为可能的致病突变来考虑,这么一来,仅仅需要分析的错义突变(改变蛋白质序列的突变)就达到了500多个。通过将表型输入神经网络进行迭代分析,我们得到了接近50个候选突变。

比较幸运的是,这里面还没有SV突变,都是SNV。否则的话,可能就没办法继续往下排查下去了。对于SNV,我们还能做结构。实在没办法,我们只能对每个携带突变的基因,找出其蛋白质晶体结构(有的只有同源蛋白质结构),一个个去做分子模拟。通过这种方法,我们排除了其它所有罕见突变,定位了一个和肌肉能量代谢相关表型符合,在人群中未发现的突变PFKM E629K。

PFK的中文名是磷酸果糖激酶,催化糖酵解的第三步。在人基因组中,存在PFK的两个homolog(同源基因)PFKL(肝磷酸果糖激酶)和PFKM(肌肉磷酸果糖激酶),另外血小板中还存在第三个同源基因PFKPL(血小板磷酸果糖激酶)。PFK以四聚体形式存在,在肌肉中,只存在PFKM形成的四聚体;在红细胞中,存在PFKM和PFKL组合而成的四聚体。PFK的底物是F6P(磷酸-6-果糖)和ATP,催化产物是F(1,6)P2和ADP。通过分析结构,我们发现PFKM E629侧链正好位于该结构的F(1,6)P2结合口袋(图1:A),该口袋也能结合PFKM的强别构调控分子F(2,6)P2,而后者是PFKM酶活的关键调节分子。E629K突变(图1:B,C,D,F)使整个结合口袋区的电荷分布发生了变化,从结构上来看(图1:E,G),酶功能会受到很大影响。这个结合口袋结构来源是酶二聚体,即使是一个正常的PFKM,结合一个突变的PFKM以后整个酶二聚体也会受到功能上的影响。因此,我们考虑PFKM E629K为一个显性突变。

643

图1:A. PFKM 结构(hmPFKM: PDB 3O8N),示PFKM单体结构及E629。B/C:PFKM E629K突变(resi 629 as sticks);D/F: PFK1(hmPFKpl: PDB 4XZ2) E639K(PFKM E629同源氨基酸侧链, as sticks)突变及电荷分布图,红色为负电,蓝色为正电;E/G: F(1,6)P2(sticks)结合于结合口袋。

PFKM突变造成糖原贮积病 7 型(Tauri disease)。该疾病表型与林林肌肉表型部分相似。部分糖原贮积病 7 型病人为新生儿期发病并迅速发展。严重糖原贮积病 7 型表现为溶血及贫血表型,且运动后可能表现黑尿症,在林林病历中未见。林林携带E629K 突变为杂合,可能为显性负性,根据其蛋白结构推测,假如PFKM E629K为显性负性,肌肉在最坏情况下仍具有 1/4 PFK 功能,红血球在最坏情况下仍具有 3/4 PFK 功能(红血球中同时表达 PFKM 及 PFKL),为可能的一个解释。

在我们从蛋白结构角度入手获得疑似致病的PFKM E629K突变信息之后,我们向林林妈妈申请了父母及芊芊的全外显子测序数据,以及全家的CNV芯片数据。经过验证,芊芊和林林均携带PFKM E629K突变,而父母均不携带(图2)。从我们获得的信息显示,该结果也已被Sanger测序验证。另一方面,我们在不预设先验条件下,使用遗传模型对所有quartet测序数据进行过滤以后,使用神经网络对表型和基因型进行分析,同样只获得了同一个疑似致病的PFKM E629K突变。与单proband WES SV分析一致,CNV芯片分析没有发现任何可能致病的结构变异。因此,我们认为PFKM E629K突变的致病可能性较高。该突变在quartet中遗传模式符合de novo dominant模型,因此,我们认为该突变很可能为一个de novo显性负性突变,突变来源可能为父母其中一方的配子嵌合。后续确认还需要进一步的生化功能实验和分子生物学验证,正在安排展开。

644

图2. 林林/父亲/母亲的PFKM E629K 突变位点二代测序覆盖结果。

总结

近3个月来,优乐复生科学家团队与林林的母亲及业内合作伙伴保持密切沟通,不断验证研究结果,利用数据分析技术鉴定了一个疑似致病突变,并将在此基础上继续协助林林父母对林林的病因展开进一步深入研究。在此我们首先要感谢所有无私提供测序及临床数据的相关机构,也要感谢林林父母同意我们将相关病历及分析过程作为案例向业内公开,与更多的专业人士和机构共同探讨和交流,为林林及可能的更多类似罕见病患者提供帮助。

在这个案例的分析过程中,优乐复生团队认为,尽管全外显子测序在罕见病诊断方面具有很强的解析能力,单测proband(先症者)的策略却很可能流于失败。实际上,在这个案例中,如果不是SNV突变而是一个haploinsufficient CNV甚至是SV,那单纯使用proband测序结果很难拿到结果;即使是SNV突变,如果不是恰好是个蛋白结构很清楚的突变,也没有做过生化,也很难说能不能拿到结果。另外,在测序中的许多平台/实验方法引入的错误,同样可以通过同平台的对照测序数据得以排除。我们认为,对疑难病人trio甚至quartet进行直接全外显子测序,可以缩短从测序到发现鉴定病因的时间,提高鉴定病因的成功率,在很多情况下,对病人是费效比较高的策略。对于某些特定种类疾病,在表型有嵌合特征时,可考虑高深度WES测序。对于SV鉴定,我们认为低覆盖度WGS的费效比应该更高。

其次,表型的鉴定十分关键。在这个案例中,UCL提供的肌肉活检报告提示“类CHKB肌病”,从病理层面直接鉴定了发病位置。临床表型相对复杂,许多表型可能是次生产生,不完全与遗传学有关,但对于严重疾病来说,一定存在一个核心表型直接与遗传背景关联。如何从纷繁复杂的表型中寻找出核心病理缺陷,既要依靠专业病理判断,也要依靠临床经验,还要依靠对生物学的深刻理解。目前优乐复生不仅依靠科研团队的判断,也使用机器学习算法对临床数据和观察结果进行特征分析。实际上,引入数据技术不仅能帮助临床表型判断,可能也可以通过相互迭代,逐步逼近核心基因型-表型关系。在准确判断表型的基础上,我们认为通过一些传统人类遗传学技术以外的方法,如将结构生物学,蛋白相互作用,深度学习发现的可变剪切等引入遗传分析,对鉴定的成功率也有很大的帮助。

最后,我们认为,这类类似“公益众筹”的疑难遗传病测序分析模式,在这次事件后会迅速流行起来,作为遗传病研究机构,优乐复生也很愿意参与。但我们认为其中的知情同意,法律授权,数据归属,结果交流,数据发布等环节需要进一步正规化,否则,对病人及其家庭并无实质帮助,甚至会有一定负面作用。

联系优乐复生:

北京市海淀区永丰工业园丰贤中路7号孵化楼B座4层

赵欣:zhaoxin@eulertechnology.com

0086-18610080763