分类:案例分析

林林疾病的确诊为什么这么难?


2015-11-29 水晶基因
659

文/水晶基因

原载于【TAALSM校友】微信公众号

清华校友孩子林林的病例牵动着无数人的心。而自信息发出已近半年,不但我们国内的精英基因检测团队悉数参与,国外尤其是美国的多个遗传病检测中心的专家们也参与了各种意见和建议。但遗憾的是至今对这个病例尚无明确的诊断。到底是哪个基因出了问题?为什么遗传病的确诊会这么难?为何林林的父母没有任何症状,而林林与其妹妹都会患病?这些疑问不但困扰着遗传学家,也困扰着广大关心这一病例的每个普通人。同时遗传病,DNA突变,基因诊断,大规模测序这些名词越来越频繁地进入我们的视野。什么是遗传病?遗传病离我们有多远?基因诊断又是怎么回事?遗传病能够预防吗?其实我们每个人都应当有一些遗传病的基本知识,未雨绸缪,就会使我们避免很多疾病的发生,即使疾病来临,我们也能知道怎么做。这一期的水晶视角将带领大家通过对林林病例的进一步分析来了解:

1. 林林的诊断目前走到哪一步了?

2. 怎样理解基因诊断报告?

3. 为什么林林的确诊这么难?

4. 遗传病离我们有多远?

5. 面对遗传病我们该怎么办?

6. 下一步的建议

1
林林的诊断走到哪一步了?

这个夏天以来由于一个特殊的家庭,林林小朋友的家庭,将五湖四海的遗传学家,临床人员以及众多关心这个家庭的普通人联系在了一起。

823日林林家庭通过清华校友会发出求救信息,已近30家国内外的医院,基因检测机构及遗传咨询机构先后介入。这些机构先后组成了三个主要的“攻关小组”(见下表一),先后对林林、芊芊及其父母的基因进行了各种检测(见下表一总结)。

水晶团队曾在1016日发表了《林林离确诊还有多远?》的博文,综述了林林和其妹妹的患病经过并分析了一些可能的线索(1)。林林家庭的情况,他本人以及妹妹芊芊的病情在前面的几篇文章中均已提到。水晶视角的综述《林林离确诊还有多远?》亦详细描述了林林的病情,在此不再赘述。那么,目前各个攻关小组的研究到哪一步了?

最新的进展来自于清华校友会组织的“Fellowship For Linlin (FFL)”攻关小组。清华生命科学与医学校友会(TAALSM)联合北京希望组在113日发表《林林病因诊断初步报告-1》,综述了诸多参与团体包括水晶基因围绕林林的诊断所付出的辛苦劳动并汇总了诊断结果。

119日,清华校友会与北京优乐复生科技有限公司进一步联合推出了《林林病因诊断初步报告-2》,对通过测序找到的几个基因进一步分析。随后清华校友会邀请水晶基因,从科普和广大非专业读者的角度来诠释这一病例,以期让更多的人了解林林的病情以及了解遗传病、基因诊断和遗传咨询的一些基本知识。以上所有文献经林林家庭及清华校友会同意,我们已经永久保存在水晶基因的网站上与大家共享(www.crystalgene.com/blog)。

660
表一. 参与林林病例解读的攻关小组及迄今取得的进展。注:1.Fellowship For Linlin 组包括清华大学医学院,阜外医院,南加州大学,香港大学,北京希望组,米宝有约等;2.“第三小组”包括药明康德明码生物,复旦儿童医院,贝勒医学院,波士顿儿童医院等。↡德易东方为独立解读报告,并非华大攻关小组成员。#其它未见明确诊断报告的检测没有包含在表内(见下文)。

下面我们先来简述一下目前几个攻关小组的发现。从表一可以看出,几个攻关组都对林林核心家庭成员的细胞核DNA以及线粒体DNA做了全面的分析。

先后有两个小组的研究都排除了线粒体DNA突变导致疾病的可能。同时,北京希望组的分析重点发现了林林与芊芊的细胞核DNA均含有PFKMSIPA1 基因的错义突变,林林自己还有COL6A5基因的错义突变,而其父母均无上述突变。其中PFKM和COL6A5基因的错义突变的情况此前在以明码生物为代表的第三攻关小组的研究中也有发现。水晶也与博士360的周在威博士取得了联系,他也确认了在明码生物组的测序中也已发现SIPA1基因突变,只是认为与疾病关系不大而未报道。华大基因小组在最初报道(9月5日)中也观察到了PFKM突变,该前期报道水晶基因已经在《林林离确诊还有多远?》一文中综述过,不再赘述。

那么,这些DNA突变是造成林林和芊芊患病的罪魁祸首吗?如何理解这里的各个名词和概念呢?别着急,水晶带您来一点点抽丝剥茧,先了解一些基本的知识

2
怎样理解基因诊断报告?

一个专业的诊断报告往往含有大量技术性和专业性术语,非专业人士看起来就会一头雾水。水晶试图发挥我们遗传咨询和解读的专长,给大家介绍一些基本知识。

首先,我们来看看什么是遗传病,遗传病是怎么引起的?遗传病的诊断为什么要研究DNA和基因呢?

一个家庭中先后出现孩子出生后不久就患病的情况,并且症状有所重叠。这些都是遗传病的重要特征。说到遗传病,一般人会以为就是指由上一代传给下一代的疾病,这种想法不是完全正确。

在医学上,遗传病(Genetic Disease)是指由于某一基因或染色体异常而导致的一种病理缺陷。并非字面意义上 的遗传或上下代传递而来。有的遗传疾病并非继承而来,这点我们会在后文阐述。而反之并非所有上下代间传递的疾病就是遗传病。

例如很多病毒(如HIV)可以在孩子生产的过程中形成母婴传递。而很多其他由感染或环境因素(如地区性微量元素缺乏)导致的疾病由于在同一个家庭中有多个患者,有时也会被误解为遗传病。

大家都知道DNA是遗传物质,DNA负责上下代之间信息的传递。人体的DNA包括核基因组DNA和线粒体组DNA(见图一)。核基因组DNA2346条染色体的形式存在于细胞核中。这23对染色体包括了一套来自于父方的染色体(精子携带),一套来自于母方的染色体(卵子携带),合在一起称为双倍体(Diploidy)。

每一条染色体就是一个连贯的DNA纤维加蛋白质的线团结构,有点类似中国结上的穗状装饰。一个基因就是这条纤维上的一小段,用于编码特定的蛋白质来执行生物功能。DNA在化学上是一个碱基配对的双螺旋结构。DNA含有A, T, GC四种碱基。就是这四种碱基的排列组合编码了我们这个多姿多彩的生命世界。整个人类的双倍体基因组共有超过60亿碱基对。试想其中有一个碱基坏掉(我们称为突变)就可能致病,是不是十分可怕?

661
图一. 图解核基因组DNA和线粒体DNA(www.scienceschool.org)。

人体的上百万亿个细胞,其细胞核内的DNA序列在理论上是相同的,都是从受精卵的那一套DNA拷贝得来。在受精卵中因为父母双方都贡献一套染色体,那么发育成个体后每一个基因我们就会拥有两个拷贝。篇幅所限,我们大体讲述一下常见的突变传递模式。

首先是孩子可以从父母遗传获得突变。这个容易理解。还有其他的方式孩子会得到DNA突变:一种情况是在父母的精子或卵子产生的过程中由于某种内外界因素产生了突变,发育成孩子后就有可能会得病。这种情况因为只是在精卵产生的过程发生突变,父母的其他细胞正常,因此父母不会显示任何异常,而孩子会得病。第二种情况是父母精子、卵子均正常,而在受精卵发育的过程中部分细胞发生突变。这两种方式我们称为新发突变

虽然都是新发突变,它们的遗传表现可以不同,前者孩子的所有细胞都会携带这一突变,得病的几率就大些,后者只有部分组织和细胞携带这一突变,只有突变的这些基因恰好影响到其所在细胞的功能时可能才会发病。由于同一个个体携带不同基因型的细胞(正常或突变),这种个体就称为嵌合体

我们再进一步推理,在这样的嵌合体个体中,如果新发突变恰好只发生于部分、全部生殖细胞或包含生殖细胞在内的多种组织。虽然这个个体自己可能是正常的,他(她)在婚后生子时就会出现全部或一定比例的孩子出现突变(图二)。

无论是哪种情况孩子获得突变,DNA突变是否引起疾病可以有两种常见的模式:对某些基因来讲,一个拷贝坏掉没关系,另一个拷贝还能够发挥作用。但另外一些基因只要一个拷贝坏掉,它的功能就不能正常发挥,从而导致疾病发生。前一种情况我们称为隐性突变,即孩子只有在他的两个基因拷贝上都有突变而坏掉后才会得病。后一种情况我们称为显性突变,即孩子只要有一个基因拷贝突变坏掉就会导致孩子得病。

662图二. 新发突变产生各种可能嵌和体的过程及其进一步遗传造成的可能后果。

上面谈了细胞核DNA的遗传特征。我们再来介绍一下线粒体组DNA(3)。顾名思义这些DNA存在于线粒体中。线粒体是人体细胞的“锅炉房”,通过“燃烧”糖类和脂类等分子来产生能量。线粒体DNA编码多个与能量产生及新陈代谢密切相关的蛋白质。因此如果线粒体DNA出现突变,也可能会导致各种疾病。

线粒体DNA是多个拷贝的环状DNA,称为多倍体(Polyploidy),这一点区别于核DNA的双倍体概念。每个环状线粒体DNA大约有一万七千对左右的碱基。线粒体DNA的一个特点就是人体不同部位的不同组织细胞,可以含有不同拷贝数量的线粒体环状DNA,拷贝数可以从几百个到数千不等(图一)。例如红细胞不含有任何线粒体DNA,而肝细胞则含有高达几千的线粒体DNA。

线粒体DNA突变导致疾病其遗传有特殊的方式:一是母系遗传,即只有母亲把病症传给下一代,而在下一代中,只有女儿继续传给外孙/女。而儿子即使患病,由于其精子中的线粒体不会遗传给下一代,其后代就均为正常。

这是为什么呢?机制源自于最初的受精过程。在精卵受精时,父方精子内的线粒体进入卵子后在与卵子融合为受精卵时都被降解掉了,这样精子里的DNA就只有含有23条核染色体DNA的部分与卵子融合。所以受精卵的线粒体DNA均来自于母方卵子提供的线粒体DNA。

另一特点就是异质性(Heteroplasmy) 。线粒体异质性是指在一个个体的细胞中有不同类别(如正常与突变)的线粒体DNA。而在不同组织细胞中,异质性的程度,即不同类别的线粒体DNA的比例可能不同。比如一个母亲可以在她的生殖细胞里面异常线粒体DNA占多数, 但是在她的肌细胞,血细胞中却是正常的线粒体DNA占多数。

这种情况下母亲可能不表现出明显症状,而却有高风险传递线粒体突变至下一代。而由于异质性以及线粒体向子代传递时的随机性和瓶颈效应,携带有某种线粒体突变的母亲可以传递给各个子女不同数量的突变线粒体DNA,进而导致子女之间的临床表现迥异。

有了这些基本知识,再来理解那些专业报告就容易多了。

首先,几个攻关小组先后检测了林林的细胞核与线粒体DNA,说明在线索不是很清楚的情况下,大家都不想放过任何可能的蛛丝马迹。就林林和芊芊来说,由于他们的症状涉及高能量消耗的肌肉系统,而线粒体是机体的能量工厂,许多肌肉病是线粒体相关基因突变所致,攻关小组选择既检测细胞核又检测线粒体DNA是有道理的。

其次,那么林林和芊芊的病和他们父母之间是怎样的一种遗传关系呢?我们看到林林和芊芊都是出生之后不久就患病,出现不尽相同但部分类似的情况,而父母完全正常,经过希望组进一步访问确认,其父母双方均无疾病遗传史。这就意味着几种可能:

一是隐性遗传突变:父母在某个基因上各携带一个坏的拷贝,而且不幸都遗传给了两个孩子。这种情况当然很常见。那么这种概率有多大呢,根据遗传学的基本定律,这种情况在所有出生的孩子中出现发病孩子的几率会占到25%。也就是说每个孩子同时得到两个坏拷贝的几率是四分之一。林林父母只生了两个孩子,因为这个数量较少,恰好出现两个孩子都遗传两个坏拷贝的几率就有25%X 25% = 6.25%。虽然较低,但这种情况不能完全排除。

二是线粒体遗传:线粒体疾病的发病机制和临床表现复杂多样,母亲没有症状而孩子发病的情况并不少见。

三是嵌合体遗传:即父母双方至少一方的生殖细胞的部分、全部或生殖细胞以及其他部分组织细胞的DNA发生突变,然后遗传给了孩子。即图二下半部分中显示的那样。

以上三种情况均基于一种假设:就是异常的遗传物质是从父母继承而来。还有一种情况是突变并不来源于父母,那就是:

四、新发突变:在精子或卵子发育或胚胎发育的过程中,由于种种原因出现突变,从而导致孩子全部或部分细胞出现突变(图二的上半部分)。这种情况虽罕见,但也可以解释父母正常而孩子得病的情况。

那么,根据这些特征我们来分析一下目前得到的结果符合那种情况呢?

首先,如果符合隐性遗传突变这种情况,那么检测出的基因就应当有至少两个突变存在,且分别来自父母双方。根据目前结果,找到的三个基因都是只有一个可能的坏拷贝,而另一的拷贝不含突变(即报告中所谓杂合突变)。同时,“Fellowship For Linlin”小组在检测到林林DNA含有这些突变后同时在芊芊DNA中检出相同的突变,而孩子父母的DNA中均不含该突变,因此并不符合隐性遗传的特征;

再来看新发突变。两个孩子均发生新发突变,排除这一位点为热点突变位点的情况下,而且突变发生于基因的同一个位置,这种几率就很小了。因此可能性极低。

再就是父母至少一方嵌合的情况。这种情况父母至少一方其全部或部分生殖细胞中携带这两个新发 突变,所以在父母的血细胞中检测不到,但是两个孩子可能都携带突变。因此,目前看来这种嵌合体遗传的可能性最大。当然还有线粒体遗传,三个小组检测线粒体DNA不存在可疑突变。

这里水晶要特别提示注意一点,因为目前各小组只检测了林林的外周血细胞,其他组织尤其是肌肉组织中出现线粒体突变的可能性不能完全排除。

还剩下一个最重要的问题,检出的三个基因PFKM,SIPA1及COL6A5是导致孩子发病的突变基因吗?让我们来一个个分析一下:

首先,各个攻关小组均观察到了PFKM基因的突变(表一)。PFKM(phosphofructokinase, muscle type),即编码肌磷酸果糖激酶的基因。该基因在林林和芊芊的DNA上都含有一个错义变异,p.Glu629Lys,即在编码第629个氨基酸的位置上发生了一个突变,从而使得原先编码的谷氨酸变为一个赖氨酸。而这一置换在父母中均未检测到。前文分析了这种遗传现象极可能是由于父亲或者母亲中出现了嵌合现象。

如果有必要的话可以用父母唾液(如果口腔部位细胞存在嵌合),精液(作为父亲的生殖细胞,而卵子一般很难取到)等血液之外来源的样品DNA来进一步验证。但这一现象只是提示生殖细胞嵌合体这一现象的存在,并非证实PFKM为致病基因。

663

图三. 磷酸果糖激酶(PFKM)突变造成糖原贮积病的原理。该酶突变后功能丧失,其上游产物积累,下游产物缺乏。

PFKM是糖原贮积病7型(Glycogen Storage Disease VII, GSDVII)的致病基因 (4)。 这一疾病是常染色体隐性遗传病,即需要PFKM基因的两个拷贝都有致病突变才会致病。这一基因突变导致的糖原贮积病会导致肌肉中的糖类分子(我们身体里的用于产能的原料)以糖原(聚合体)的形式贮积而不能被利用,这样就造成能量不足而产生肌肉无力 (见图三)。

听起来跟林林兄妹的病情有一定的类似性。但由于林林和芊芊均只携带一个拷贝的突变,并不符合隐性遗传的模式特征。一种可能是PFKM基因仍遵从常染色体隐形遗传模式,但在林林,芊芊的样品中还有一个PFKM的致病突变尚未找到。

漏检的原因可能是测序没有覆盖,比如已报道的一个PFKM剪切突变,IVS16-64G>A。这一突变存在该基因的十六号内含子中,离内含子/外显子边界较远,有可能外显子测序没有覆盖而漏检(下文会介绍何为外显子和内含子)。

另一突变漏检可能是PFKM基因中有小片段缺失或扩增。对于DNA片段的缺失或重复希望组和优乐复生都分析了检测DNA拷贝数的芯片数据,但是由于探针在PFKM区域的密度不够,没有检测到PFKM的缺失或重复。这种小片段的缺失或扩增用二代测序也很难发现,可能需要用高灵敏度的MLPA, real time PCR, digital PCR等技术。

当然还有其它更加罕见的原因可以解释一个拷贝坏掉也可能导致疾病的可能性,但作为遗传诊断和解读,也要防止“射出箭再画靶”的过度解释。一切皆有可能的情况下掌握的原则应是可能性大的情况为主。而且,遗传的解释离不开与临床症状和临床其他检测的密切配合,我们会在后文进一步阐述。

再看一下”Fellowship for Linlin”报道的另外两个携带错义变异的疑似基因:SIPAI和COL6A5。

由于SIPAI至今报道较少,水晶基因也做了大量搜索,尚未发现有公开的报道表明这一基因与肌肉系统遗传疾病有联系的报道。虽然作为一个新出现的例子可能性不能排除,但缺乏其他生物学证据的情况下,一个病例作为“孤证”就很难下明确的结论。

COL6A5是一个胶原蛋白基因庞大家族 (序列上和进化上存在来源相似性的基因)的成员之一。其家庭成员基因COL6A1,COL6A2,COL6A3的突变的确可以诱发一系列的先天肌病,如Emery-Dreifuss肌病,Limb-Girdle肌病,杆状体肌病等。COL6A5可能会通过和COL6A1/2两个蛋白的相互作用而可能会诱发肌病。

但与SIPAI的例子相似,在缺乏其他证据的前提下无法做出明确结论。而且在芊芊DNA中也不含此突变,因此其作为林林特有的新发突变的可能性很大。从这一点也不太支持该突变导致两个孩子患病的可能性。

小结一下:经过最近的攻关,找到了三个疑似突变。但通过遗传模式和证据分析,虽然发现存在嵌合体遗传的情况,仍无过硬的证据表明其与林林和芊芊的病症有关。

水晶也要特别指出,嵌合体遗传并不是导致遗传病的先决条件,实际上人群中嵌合体的况并不罕见,只是绝大部分的嵌合体遗传并不导致遗传病,也就不被注意。

因此,这几个错义变异有可能只是比较罕见的中性变异,与林林芊芊的患病并无关系,而真正的致病突变反而被漏检了。听起来很泄气?那让我们来看看为啥遗传病的确诊会这么难?

3
为什么林林的确诊这么难?

林林的病例经过了反复几轮的检测,结论仍不明确。说他这个病例是目前世界上被最多专业人士关注,而且DNA测序最彻底的一个病例都是完全有可能的。然而,花费了这么大的精力仍然结论不明,未免让人困惑

那么遗传病尤其是罕见遗传病的确诊难在哪里?这里有几个方面,水晶大体归结一下:逻辑方面,技术方面和检测流程方面。让我们分别来看一看。

如果组成人体遗传物质的60亿个碱基中一个碱基的变化就会导致疾病的发生,设想在60亿个碱基中快速确定变异的碱基,寻找遗传病因,堪比大海捞针。在快速、低成本的DNA测序技术成熟之前,人们对罕见疾病(很大程度上是遗传性疾病)的分子机制的了解极为有限。

随着测序技术的进步,使得对病患的整个线粒体组,外显子组,甚至基因组快速解析成为现实。因此我们在近几年对各种罕见遗传病的了解达到了一个前所未有的程度。如果说极罕见遗传病的数量不好确定的话,相对“常见”一些的罕见遗传病在人群中估计就超过7000种,得益于近几年高通量测序技术的大规模使用,科学家们已经确知其中60-70%这类疾病的突变基因。然而,仍有大量的罕见病由于极为罕见,缺乏先例,很难在科学上准确确定病因。

另外,最新的遗传学研究发现,几乎每个新生个体的DNA上都会含有30-50个新发突变,这些新发突变是随机的,只是在大多数时候都发生在无关紧要的位置,也就不会导致疾病。而它一旦落在某个重要的基因上就会导致疾病。这个过程跟买彩票中大奖差不多,我们不想中这个奖,但谁都无法控制这个随机发生的事件。

那么高通量测序技术既然如此给力,是不是见到一个遗传病人把整个基因组测过去就解决问题了呢?当然不是。

大家可以把罕见遗传病的诊断过程想象为侦探抓罪犯的过程。在缺乏有效线索的前提下,在60亿个碱基中找出与疾病相关的那个突变等同于把地球上的每个人分析一遍来找罪犯。一旦某个“地区”的扫描不够精细,或者因为技术原因漏检,就有可能导致“罪犯”漏网。

因此,在高通量测序中,一般要对基因组中编码蛋白质的那些基因部分(大约占整个基因组的2%左右,我们称为外显子)进行反复检测,通常要达到每个碱基都被扫描100次以上。但即使这样,也仍有区域会因为技术的局限性而漏检。要对这些漏检的部分补测(比如用第一代测序技术),检测的最终价格可能就不那么亲民了。

需要注意的是DNA的突变有多种形式,目前不是所有的突变都可以通过测序有效检出,如有些疾病是由于三核苷酸重复序列突变导致,如一型和二型强直性肌营养不良(Myotonic Dystrophy type 1/2); 而有一些疾病是由多个外显子缺失导致,如DMD(Duchenne Muscular Dystrophy)。这些突变类型都容易被常规的二代测序漏检

而且很多致病突变发生在非外显子区,如果只扫描外显子区,对这些突变就可能漏检。这就是我们在分析三个疑似基因时提到的。

664

因此,在医学实践上,一种遗传病的诊断跟侦探案一样,一般是首选线索分析,缩小范围。在临床上一般应由遗传科的医生首先做出会诊,在详细询问病史和检查家庭各成员的基础上对病人作出必要的病理检查。通过进一步辨症,可以将疾病确定或至少确定在某个疾病类别的范围中。

这样做有什么好处呢?通过症状推理缩小范围相当于把罪犯锁定在一个有限的地区里,这样负责基因诊断的专家们就可以针对这些最有可能的范围作出更加细致的分析从而有效作出正确的诊断。这一点需要在实践上临床医生和基因检测技术人员的密切配合。

除了高通量测序本身可能的技术因素,遗传病尤其是罕见遗传病的确诊还有另外的难题。通过高通量测序的大规模扫描诚然可以获得海量的数据,对这些大量数据的有效分析却仍是一大难题。对大数据的处理不可能做到精细到每个碱基的分析,只能设定一些参数后通过电脑进行快速分析,这样“一刀切”的方案就容易导致真正的致病突变漏网。

不但如此,即使我们一个不落地找到了所有的突变,如前所述,除了父母遗传给孩子的各种突变,孩子自己还会产生各种新发突变,如何在这些筛出的突变中确定真正导致疾病发生的那个突变也非易事。由于许多罕见病过于罕见,甚至在所有的报道中只出现一例,在科学上就成为“孤证”,缺乏“旁证”很多时候就无法真正确定病因。

比方说,某地一个人神秘地死掉了,查了半天也没发现原因,只是知道他死前被一种蚂蚁咬过。在无法确定其他线索的情况下,也没有见过这种先例,我们很难把这个蚂蚁咬就作为这个人死亡的原因。因为这只是一个孤证。而如果通过网络搜索,我们知道世界上还有好几个人都因为这个蚂蚁咬而死掉了,我们就有更加充分的理由相信这种蚂蚁就是致死因素。如果后来进一步研究发现蚂蚁分泌的某种物质十分致命,那就几乎可以肯定这二者之间的联系了。

综上,对于病因明确的遗传病的确诊在目前测序技术等的发展下虽已经相对容易,然而有的突变类型不易被测序技术检出,就存在漏检可能。而且罕见遗传病由于很多是孤例,缺乏旁证的情况下要做到真正的确诊就比较困难。水晶团队在过去的临床实践中也发现,很多罕见病例会悬而未决很长的时间,而在更多的证据确定后,问题就会迎刃而解。

4
遗传病离我们有多远?

从林林这一病例我们引申开去可以学到更多的知识。也许你会说,我们家从没有过遗传病的情况,是不是就不会得遗传病?当然不是。遗传病尤其是罕见病的发生理论上可以发生在任何一个家庭。林林的家庭其实就是父母双方及他们的家庭成员都没有任何问题,而孩子反而患病。

从广义上来说,几乎每种常见及罕见的疾病都或多或少与DNA上的变异有关。遗传病在医学意义上大体有三类异常,包括染色体水平上异常的遗传病(Cytogenetic Disorders),多基因参与的常见疾病(Multigenic disorders)及单基因遗传病(Monogenic disorders)。

我们生活中最为熟悉的可能是医学上称为细胞遗传学异常的遗传病如常规产检所排除的三体综合征(某条染色体不再成对,而是多出一条),性染色体畸形等。细胞遗传学水平上的遗传病在遗传学物质上表现为一组基因,一段染色体,甚或一条染色体,一套染色体的改变。

统计数据显示,有将近1%新生儿具有染色体异常。在高龄产妇的孕检中,有2%显示细胞遗传疾病。以普通人群统计下来,大约每1000人有3.8人有染色体水平上的异常。当然不是所有的染色体异常都会导致疾病。有些染色体的变化如果没有影响到重要基因的功能,就没有非常严重的表现。

很多常见疾病的病因都包含遗传因素。如糖尿病、癌症、心血管病乃至精神疾病等都与多个基因上的变异有关,只是每个变异只对疾病的状态贡献很少的一部分风险,对大多数人来讲,多一个少一个基因变异不会造成很大的区别。只有很多变异综合在一起,再与很多环境因素(如饮食,吸烟,饮酒,运动等)结合时,我们得病的风险就会增加。我们称它们为多基因参与的常见疾病(Multigenic disorders)。

单基因遗传病就只有一个基因的一个或两个突变,而这一个或两个突变就足以导致严重疾病状态的发生。单基因遗传病在1000个新生儿里面大约有10个不同种类的异常。林林的病例可能就是这种情况。

单基因遗传病这么罕见,那是不是就跟我们大多数人无关呢?这是个概率事件。我们只能讲在一般情况下这个概率很低。上文已述,几乎每个新生个体的DNA上都会含有30-50个新发突变,这些新发突变是随机的。不幸的是,我们谁都无法控制这个随机发生的事件。但是我们中的很多人的确会有比其他人更高的风险得上某种遗传病或生出某种疾病的孩子。这里我们梳理一下一些明显的风险因素:

A. 父母双方的家庭中曾有孩子有出生缺陷,如染色体三体,痴呆,唇颚裂等。

B. 大家庭中有其他成员患有遗传疾病,常见的罕见疾病如囊性纤维化,常见疾病如糖尿病等;

C. 父母近亲结婚

D. 有多次流产史或不孕史

E. 高龄产妇

F. 怀孕前或怀孕期间接触过可能胚胎致畸的物质

在这里尤其要强调育龄父母要注意健康的生活。抽烟喝酒都会导致DNA突变几率显著上升。处于其他的劳动环境如高辐射,高化学致畸环境等都会提高精子和卵子内DNA的突变率。孕期服用某些药物也会导致突变的发生。而孕期服用叶酸等制剂则会显著降低神经管发育畸形的比率等等。具有这些风险因素的家庭在规划生育计划时应检查父母父母双方,乃至胎儿的染色体或基因,看是否有重要突变,及早预防。

5
面对遗传病我们该怎么办?

很多隐性遗传和随机新发突变及嵌合体遗传引发的遗传病防不胜防。做好预案,未雨绸缪,在面对遗传病的时候掌握正确的思路就会少绕些弯路。很多情况下越早治疗,就越能更好地控制疾病。

首先是要早期预防。对于上述高风险的人群,对育龄期的父母要做各种预防性筛查。高龄产妇要做必要的产前检查。例如染色体三体变异在高龄产妇中的比例会显著高于低龄产妇。以唐氏综合症(21号染色体三体)为例,20-30岁的产妇生出唐氏综合症患儿的比例大约在1000-2000分之一以下,而35岁以上的产妇就会上升到350分之一以上,而到50岁,这一比例会达到10分之一。

对新生儿也应进行必要的早期筛查。例如耳聋和新生儿代谢性疾病,这些疾病往往在新生儿中的发育初期不被注意到,而一旦发病,对身体机能尤其是神经和肌肉系统的功能就已造成不可逆损伤,再治疗就很难矫正,因此早期的筛查一旦查出,可以通过治疗降低很大的发病风险。

其次是注意正确的问诊。任何遗传病的诊疗应当都是一个临床医生与高素质检测技术人员和遗传咨询专家的的充分配合下实现的。高风险人群在做家庭生产计划前应当寻求高质量的遗传科医生和遗传咨询专家的建议。在充分讨论家庭遗传史,环境,饮食及其它因素的前提下,做出必要的检查和合理的治疗。

最后是选择正确的检查方式。在临床医生充分了解病情的基础上应当作出合适的导诊与转诊,在有经验的遗传诊断师的配合下寻求正确的检查方式。前文已经提到,大规模测序的方案虽然听上去非常给力,但作为一种遗传病检测手段目前仍不成熟。事实上,根据病情不同可能有不同的突变的情况下,选择正确、成熟的检查方式不但快速准确,而且花费也很低。

小结一下,遗传病的检控和诊疗是个系统的工程,需要多方面专业人士的参与。作为每个个体,应当加强一些基本知识的了解,做好充分的预案。它归根结底是个医学问题,应当在临床专业人员的充分配合下做出合理的安排

6
下一步的建议

通过我们上述的详细分析,水晶方面认为,对遗传病的检控应当通过临床症状分析、循证医学基础上的技术参与以及专业遗传咨询几方面的紧密配合。在林林疾病的诊断方面,迄今各方技术人员的积极参与的确起到了有目共睹的推动作用,然而从另两方面来讲,林林的病例分析从始至终亟待临床医学遗传学专家的主导以及专业遗传咨询的协调辅助。

对遗传病的诊疗归根到底是一个面向患者的医学问题,缺乏临床支持的“众包”方式会导致效率低下,信息混乱,从经济上亦不可持续。这一方面也反映出当前我们临床医学遗传人员的严重不足,另一方面也折射出我国遗传病的检控体系长期不完善,造成目前测序就是“一步到位”的检查手段的误解。

对此,水晶基因就林林的病例专门采访了国内外的几位临床遗传学专家。

卫生部中日医院神经内科运动障碍与神经遗传病研究中心负责人的顾卫红主任是我国知名的神经系统遗传病领域的专家,通过仔细分析之前关于林林一家的临床和基因检测报道,顾大夫认为“林林和芊芊均在婴儿期出现心肌和呼吸肌无力表现,肌肉受累为主,遗传性疾病毋庸置疑。尽管临床表现有一定差距,但是应该是同一病因致病,表型差异与家人对于患儿喂养细节及观察,环境因素和病史描述等因素有关。” 从诊断上来讲,她认为“如果有合适的肌肉病的相关基因组合检查,应该首选”。

水晶也进一步咨询了美国临床医学遗传学界的几位位资深专家。在综合分析林林与芊芊的所有现存病历资料后,专家们一致认为林林的病情更符合先天性肌营养不良症(Muscular Dystrophy),而非糖原贮积病,因此PFKM基因的突变可基本排除

基于这一点,水晶向各医疗小组及林林的家庭提供以下建议:

从症状上来讲,如果林林的病情确属肌营养不良,目前虽无有效治愈方案,按照美国国立儿童健康与人类发育研究所(NICHD)的建议,应当对患儿进行适当体能训练及扩展运动以增加肌肉力量与关节的灵活性。同时要视情况对患儿进行呼吸辅助、语言辅助和自主运动辅助性治疗延长生活质量。必要时通过手术维持生活质量。

亦有研究表明,每天使用糖皮质激素如强的松可有效增加肌肉力量、运动能力和呼吸功能。但因这些激素类药物副作用较大,应在与临床医生充分讨论权衡利弊后使用(5)。

水晶注意到一些关注林林病情的微信群内及其他网友基于最近两篇诊断报告对PFKM疑似突变导致糖原贮积病(GSDVII)的可能性讨论较多。林林芊芊的部分症状如血清肌酸激酶升高,呼吸困难,心脏方面的症状等的确同GSDVII的表现有重叠。亦有网友建议林林进行饮食治疗如服用含有果糖的果汁等。

水晶的建议是在进一步确诊之前应当谨慎和缓行

基于前述对PFKM功能的分析(图三),该酶的功能主要是代谢6-磷酸果糖为1,6-2磷酸果糖,如果该突变确致该酶活性降低,则林林会出现糖原、果糖及6-磷酸果糖积累和1,6-2磷酸果糖缺乏,而并非果糖缺乏。因此,即使PFKM真的是导致林林疾病的原因,该饮食疗法也不会起到任何作用,反而在理论上会导致果糖和糖原进一步积累。

水晶也查阅了大量文献,遗憾的是GSDVII至今尚无有效治疗方案。有报道称酮体(高脂)食物或高蛋白食物在某些病人中可延缓部分病情。而如果是糖原贮积病,医学界普遍的建议则与肌营养不良的建议相反,为尽量减少各种运动。因此,进一步确诊对于林林生活质量的维持仍有很大价值。水晶对此也提出以下技术方面的建议:

如果林林的疾病从症状上缩小到遗传性肌肉肌营养不良疾病这个范围里,目前发现与之相关的基因大约有20-30个。因此对这20几个基因的详细分析应是首选。目前各检测团队对林林DNA的测序已经做了很多工作,但上述与遗传性肌肉疾病相关的基因在这些数据中的覆盖率如何,有无漏检,水晶基因建议各个团队对这些数据应当做充分的分析。

另外米宝有约团队于9月1日发表的文章提示“Fellowship For Linlin” 小组可能已经对上述基因做过外显子捕获后的测序,然而未见详细的检测报告。华大基因在9月5日的报道中也专门分析了36个先天性肌病的基因。综合这些看来与先天性肌病相关的基因内部发生突变的可能性不大。但这些基因是否有片段缺失或拷贝数变异尚无集中评估。有消息表明林林的DNA也还经过了片段缺失等拷贝数芯片的检查,但这一平台对上述基因的检查结果及覆盖率如何亦未见明确报道。

水晶基因为此联系了博士360的周在威博士,他进一步分析了这些基因全基因测序的结果,初步分析表明这些基因存在突变及拷贝数变异的可能性较低,但由于覆盖率不高(20-30X),水晶仍建议对这些基因可能漏检的部分以及内含子区域及其他的突变形式尤其是片段缺失等在合适的平台上做进一步的详细检测。

目前几个团队对线粒体DNA的测序没有发现有价值的突变。然而线粒体DNA和与线粒体功能相关的核基因突变的因素却不能完全排除,尽管线粒体肌病多数发生于年龄较大的个体。迄今未见各组是否对线粒体功能相关的核基因突变尤其是片段缺失做出统一评估

另外,上文提到线粒体的分布在各个组织中并不均衡。组织细胞异质性程度不同的情况不能排除。各组迄今只对林林血液中的线粒体DNA做了排查,并没有深入到林林的肌肉组织。但提取肌肉组织属有创检验,有可能会对病人造成进一步的痛苦,需充分衡量利弊,取得家属和患者本人同意后方可进行。在权衡利弊时还要考虑很多遗传病都无法得到有效治疗。因此,临床上一般尽量倾向无创检验。然而,在本例中,因为PFKM突变是否真正致病仍无结论,医学检验上检测GSDVII的金标准即肌肉活检组织中测定PFKM酶活性,因此综合上述两点,一份肌肉活检样本就有可能获取多方面的检测结果。当然,即使如此,水晶并无参与林林病例考察,无一手资料,因此仍需当事人家庭及主治医生等相关方面结合其他各因素充分权衡。

针对这些反映出的问题,水晶亦希望在组织和协作方面提出以下建议:

一是相关各方应考虑组建有经验的临床相关各科医生主导的信息汇总、会诊、治疗小组,在充分综合目前临床与检测各方面信息的基础上统一指导下一步的检测与治疗措施;

二是技术攻关各方也应进一步协调,在充分共享所有原始数据的基础上对前述可能问题作出充分的检测质量评估,以指导下一步的检测方向。目前综合看来,先天性肌肉营养不良相关基因及线粒体功能相关的核基因的缺失突变应作为筛查排除重点

水晶方面认为在临床专业人员的主导,在其他技术和咨询各方的综合和协调下,才能有效整合资源,防止数据和信息的碎片化,从而避免重复劳动和信息传达的混乱。

总之,在医学知识越来越爆炸的现在和将来,包含遗传病诊疗在内的精准医疗只能通过严格的分工和密切的合作来进行。在做出医疗决定时应当充分基于循证医学证据和权衡各种利弊后进行。同时,从这一病例中我们看到,我们的整个医疗体系需要建立合理科学的问诊、导诊、转诊及会诊制度及可持续性的各方面合理的收费和医疗保险体系,从而让众多类似的患者求医有道,在合理的医疗负担下及时得到正确的医学指导。

最后,水晶再次表达对林林与其家庭的深切慰问。作为罕见病患者,林林是不幸的。但在推动我们对罕见病的了解以及探索正确的遗传病检控方案上,正是林林这样的千百个罕见病的患者成为了我们的老师。林林家庭自始至终的乐观、配合和耐心给了各个攻关团队充分的信心和支持。我们将继续为揭示最后的真相不遗余力。

林林病例的出现,恰逢精准医学的概念引领医学变革和基因测序技术风起云涌的当下,他所引起的关注和各方的努力既为我们普及遗传病知识,唤起大家对遗传病的重视提供了难得的契机,也为我们检视当前我国的遗传病检控体系的现状提供了绝佳的窗口。作为长期关注遗传疾病诊断、解读与咨询的水晶基因,我们希望谨以此文在普及大众的同时也能充分引起同行业者的共鸣,为共同推动我们医疗事业的进步贡献力量。

注:本文的写作得到了顾卫红医生,汪德鹏先生、周在威博士、蓝灿辉博士和王凯博士的大力支持与指导,水晶在此表示由衷的感谢!

参考文献及网络连接:

1.水晶视角博客:林林离确诊还有多远?http://www.crystalgene.com/blog/

2. Zlotogora J. Germ line mosaicism. Human Genet. 1998 Apr;102(4)381-6.

3. Prashant Mishra and David C. Chan. Mitochondrial dynamics andinheritance during cell division, development and disease. Nature ReviewsMolecular Cell Biology 15, 634-646, 2014.

4. Musumeci, O. et al. Clinical features and new molecular findings inmuscle phosphofructokinase deficiency (GSD type VII). Neuromuscul Disord 22,325-30 (2012).

5.https://www.nichd.nih.gov/health/topics/musculardys/conditioninfo/Pages/treatment.aspx

【欢迎个人转发分享,机构转载请注明出处“水晶基因”】

(转载)林林病因诊断初步报告-①


转载自:“北京希望组  TAALSM校友”的微信公众号

641

自8月23日我们发出《孩子罕见病,五年未确诊,清华校友求病因线索!》后,已过去两个多月。在这期间,林林和他的父母得到了众多清华校友、企业和媒体的关注。

我们在8月29日《来自TAALSM和林林父母的感谢信》中列示了提供帮助的机构名单,在这里我们再次感谢以下机构的大力支持:

  1. 华大基因
  2. 清华大学医学院
  3. 北京希望组生物科技有限公司
  4. 北京德易检验所
  5. 药明康德
  6. 美国贝勒医学院
  7. 广州嘉检医学
  8. 南加州大学
  9. 复旦大学医学院
  10. 美国哈佛大学波士顿儿童医院
  11. 盛诺一家
  12. Rare Genomics Institute China
  13. 美国约翰霍普金斯大学
  14. 北京航空医学研究所附属医院分子病理中心
  15. 上海市儿童医院
  16. 香港大学医院
  17. 北京国际医疗中心
  18. 北京协和医院
  19. 清华长庚医院
  20. 北京儿童医院
  21. 北京解放军总医院(301医院)
  22. 湘雅医学院儿科组
  23. 北京阜外医院
  24. 优乐复生
  25. 米宝有约
  26. 水晶基因

(以上排名不分先后)

经过国内外众多机构、专家的共同协作,对林林、芊芊和父母的线粒体DNA、全基因组的测序工作已经完成,各家提供免费测序的机构也将测序结果进行了符合伦理规范的有限共享,多家数据分析机构和个人提供了分析报告。

从今天起,我们会陆续发布一些机构提供的报告,以向各位校友、关心林林的各界热心人士报告有关工作进展,同时希望借此可以向大家传递基因测序、遗传病和罕见病的相关知识,让大家了解罕见病确诊的艰难。也希望对基因测序、分子诊断的校友和专业人士仍然能够关注林林,关注行业的努力,共同推动行业发展。

今天的报告,来自“Fellowship for Linlin小组”。

注:“Fellowship for Linlin小组”由清华大学医学院、阜外医院、南加州大学、香港大学、北京希望组、米宝有约等机构组成。

林林基因测序数据分析报告

主笔:北京希望组

清华校友夫妇的孩子林林和芊芊罕见病的问题,由清华校友平台公布后,受到了社会和业界的广泛关注。三家测序公司或机构联系林林父母,进行了基因检测,希望找到致病的原因。

我们这支由清华大学医学院、阜外医院、南加州大学、香港大学、北京希望组、米宝有约等机构组成的被称为“Fellowship for Linlin”的小组,在尹银亮博士的协助下,首先获得了林林的外周血样本,同时进行了线粒体和全外显子组测序;随后华大基因也获得了林林父母的许可,同时进行全外显子组和线粒体的测序工作;药明康德明码生物、复旦附属儿童医院、贝勒医学院及波斯顿儿童医院等组成的小组也随即开展了林林样本的全基因组测序工作当中。

三方人员获得的数据及时进行了公开,以便让更大范围的专家学者参与数据分析解读,尽快获得确切结论,这确实也开创了一种公益性的“疑难杂症”遗传学分析的组织模式。

这三方的相关人员也集中在一个名为“林林的国际诊断合作组”的微信群内,与贝勒医学院、波士顿儿童医院等地的专家一块解读数据,讨论基因测序的结果。微信公众号“水晶基因”对整个过程进行非常不错的总结及评述,在这里我们不在重复叙述。

北京希望组作为其中的一个参与方,我们将已经公布的相关数据和我们的分析数据汇总整理,详细记录一下我们参与整个项目的过程,希望与大家共同努力加速对疾病病因的分析。以下我们分为事件背景,林林线粒体测序,林林外显子测序,武汉会谈,家庭外显子测序,基因拷贝数分析,总结等7个章节来详细还原事情的经过。

事件背景

事情的起始是源自于2015年8月,林林芊芊父母及清华生命科学与医学校友会发出的《孩子罕见病,五年未确诊,清华校友求病因线索!》的求助信,信中希望更多的专业人士能够提供关于该家庭罕见病病因的线索。信中详细描述了林林及其妹妹芊芊的临床相关信息。这些临床信息,是寻找并发现疾病病因的重要资料。林林芊芊的临床表型在微信上被简单归纳如下,但是具体的详细信息请参见原始的清华校友群平台的帖子。

2009年12月,林林出生了。他是足月顺产,之前的妈妈孕检也一切正常,且父母双方皆无遗传病史。只是刚下生的小林林哭声比较弱小,之后便出现喂食困难。继而又因肺炎,窒息等多种状况住院治疗。由于呼吸系统障碍,林林先是佩带BiPAP机来协助气流压入呼吸系统。之后情况进一步恶化,林林不得不接受经插喉管呼吸机。林林的父母为了找出病因,辗转各处求医。但均无确切诊断结果。

在林林将近2岁半的时候,他的妹妹芊芊出生了。刚出生的芊芊健康正常,但不久也出现轻度喂食困难。后来芊芊感染RSV病毒(婴幼儿常见)并出现多痰而住院治疗。幼小的芊芊在18个月时开始发生反复心肺衰竭。

经过详细的分析,从最初公布的林林与芊芊的临床信息中,我们发现林林和芊芊的临床症状比较复杂,无法确切获得可能的临床诊断结果,而且两个孩子之间相同或相似的临床症状较少,主要集中于肌肉病相关症状(如血液肌酸激酶-CK偏高,眼肌麻痹,近端肌无力等);其它临床症状差异较大(如林林主要表现呼吸功能不全,如呛奶、反复性肺炎、多痰、窒息等;而芊芊则主要表现为心脏功能障碍及心肺衰竭等),初步无法判断哪些症状是由遗传因素引起,哪些是由环境因素引起。

有鉴于此,通过与几个微信上面的专家群的讨论,我们认为首先以线粒体测序加上外显子测序技术为基础,寻找导致林林所患疾病的可能的遗传学病因是一个比较切实可行的方案。其它分析小组的专家也陆续采取了类似的实施方案。

值得强调的是,作为一个公益项目,虽然我们在免费帮助患者,我们也希望通过以符合国际规范的正规的流程来运作,所以从项目最开始,我们就利用了已有的伦理项目流程,并且与患者家庭签署了知情同意书。虽然我们不知道其他机构是否也通过了类似的流程与手续,我们认为这一步骤在遗传病诊断的公益活动中是必不可少的。

641

图1. 照片里是来自清华大学校友和她的孩子林林,及两位医护人员。在从满月开始,迄今将近6年的时间里,林林饱受疾病的折磨。尤其是在过去的一年半时间里,他都只能住在医院ICU病房里,靠呼吸机帮助呼吸。更令人不安的是,离孩子发病已经五年多时间,虽然有一些医生的推测结果,但确切的病因仍未确定!

林林线粒体测序

由于林林与芊芊的具体表型差异很大,我们认为线粒体疾病有很大的可能性。其实一种病在不同个体表现各有差异, 最典型的例子就属线粒体疾病的异质性。一个携带有某种线粒体突变的母亲可以传递给各个子女不同数量的突变线粒体DNA,进而导致子女之间的临床表现迥异。

这里需要强调的是,我们没有办法取得林林的肌肉样品,所以采取了外周血,在香港大学医学院提取了DNA,然后在阜外医院分子诊断中心试验室进行Sanger测序。(在此感谢这些工作人员,他们牺牲周末的时间加班加点完成测序工作!)值得强调的是,在临床上有一种情况,是含有有害的线粒体的细胞在血液中的含量由于细胞生物学的原因会随着年龄增长不断减少,所以在血液中的含量可能比较低,在患者几岁之后有可能不容易甚至不能被测序的方法检测出来。

在测序结果出来以后,米宝有约发布了微信新闻,首先对社会公开了测序数据。数小时后,华大基因也发布微信新闻,公布由二代测序所产生的数据与他们对于数据的解释。经过我们自己Sanger测序数据的分析,我们没有能够找到可以解释林林疾病的突变。与此同时,为了防止这种低频的有害突变无法被Sanger测序找出来的情况出现,我们也重新分析了华大基因的二代测序数据(在此感谢华大基因对于二代测序数据的共享),虽然看到了一些比较罕见的突变,但是没有能够找到我们认为比较可信的致病突变。

林林外显子测序

在线粒体测序的同时,阜外医院的工作人员也在对林林马不停蹄的进行外显子组测序。与此同时,华大基因也在对林林进行外显子组测序。有鉴于外显子测序数据会有可能的隐私泄露的问题,所以数据的公布需要非常谨慎,一般为有限制的对于有专业能力的团队进行公开。在华大数据出来后在最短的时间进行了有限制的公开,所以我们将华大数据与阜外数据结合进行了分析,希望能够更准确的找出结论。我们的数据也在产生出来后,由米宝有约进行了有限制的公开。

值得强调的是,许多国内国外的团队对于数据进行了申请,也立刻在微信上发布对于数据进行五花八门解释的报告。这些团队加起来找出了十余个所谓的可能致病突变。在我们看来,这是一种不太负责任的做法,对于患者家庭和其亲属造成了不必要的困扰,对于公众也有一些误导作用,反而使得基因检测的公信力下降。当然,这些报告的出发点是好的,但是部分国内测序公司相对而言缺少严格的临床训练与医学遗传学背景,也缺少严谨的科学态度,把科研级别的报告当成临床级别的报告给出来了。所以,在没有明确结论的时候,公益性的组织最好只与患者家庭和专家团队沟通初步结论,而非因为各种各样的原因在媒体上匆忙发布信息。

我们小组的数据分析专家经过讨论得到以下结论:在林林的全外显子测序结果中,未发现可能的符合隐性遗传模式且对应疾病符合林林已知临床症状的变异(即基因中存在两个可能有害的变异或者一个可能有害的纯合变异)。这一结论否定了在微信上某些团队已公布的分析结果。造成这种分析结论偏倚的主要可能原因之一,是临床症状的高度复杂性,这种复杂性可能使分析人员无法确定:1)患者所患疾病是否一定为遗传病?2)临床症状中哪些可以由环境因素解释?等等问题。

武汉会谈

为了更准确地掌握相关临床信息进行进一步的数据分析,我们北京希望组的一个专家团队与林林母亲于9月11日在武汉光谷生物城进行了4个多小时的会谈,详细收集并分析了林林与芊芊的临床症状,主要是为了确定两个患儿的临床表型是否存在一致性;在繁杂的临床症状描述当中,分辨出哪些症状可能是由于遗传因素引起,哪些可能是由于环境因素(尤其是医疗干预手段)引起;如果不排除遗传病的可能,其可能的遗传模式有哪些等等问题。

我们认为,这种与患者家属的沟通对于罕见遗传病的检测及其重要,毕竟很多重要的信息可能没法从公众平台获得或被忽略。举例而言,许多罕见遗传病都有特异的面部畸形特征,所以面部畸形是临床上用来作疾病诊断的重要参考;林林有明显的面部畸形,如果光看照片可能会认为这是某种遗传病的标志。其实,林林妈妈告诉我们,林林出生后并没有任何面部畸形,所看到的表型只是因为长期携带BiPAP机压迫面部的后天原因造成的。

结合之前公布的临床信息,我们重新整理分析了林林和芊芊的临床症状,并提出了我们比较认可的假设,如下:

1. 出生后体征

(1)林林出生后哭声较小(芊芊出生后哭声正常,林林出生即表现有呼吸功能稍弱的情况,支持后期肌无力的推测);

(2)出生后3天出现喂食(吞咽)困难,满月出现呕奶、呛奶(之后出现肺炎), 肺炎住院期间,喂奶出现第一次窒息,转入ICU抢救。支气管软镜和硬镜检测显示正常。吞钡餐检查(VFSS)显示吞咽困难,其后喂奶时再次出现窒息(血氧心跳急速下降),严重时全身发紫。之后,林林身体状况变得更为糟糕,这个可能导致脑发育损失的事件可能是后期多数严重的运动能力障碍(如面部及肢近端肌无力,眼肌麻痹,爬行能力较弱,颈部无力,一岁半时不能单独走路,两岁多时有明显改善,睡眠时常伴有痰液过多的情况,长期需要物理排痰等)的分水岭;(芊芊则可以较好地进食,但仍表现出肌肉无力的症状。出生后兄妹两有不同程度的支持肌无力的临床表现。后期的严重的运动能力障碍可能是由于首次出现的严重窒息导致的继发性的医源性的功能障碍)。

(3)在出生后20多天,林林睡眠时出现鼾声;四个月时,发现林林在睡眠时,血氧异常,口水堵住呼吸(而芊芊无明显此方面异常,兄妹两人在呼吸系统功能方面表现不一致,但不排除芊芊肌无力的症状比较轻的,未发展到夜间睡眠呼吸功能异常的可能)。

(4)初始心脏功能正常,后出现心脏septum稍增厚,但无功能异常;而芊芊在首次出现心脏功能异常前,心脏功能及结构检测均显示正常。满月前后发生RSV病毒感染并入院治疗,16个月大时因肠胃炎入院治疗,18个月大时常规检测发现心脏发大,后在医院感染副流感病毒,出现心脏衰竭,抢救后定期服用Digoxin和Captopril在停止服用Digoxin后心脏再次发大,并引发心衰。(兄妹两人心脏的结构功能表现明显不一致,由于芊芊心脏在发病前无明显结构异常,心脏扩大及后期的心衰表现,发生在病毒感染后,暂时不排除为病毒所导致)。

2. 疾病家族史

父母双方表型正常,无家族遗传病史。

3. 遗传因素

由于两个患儿在出生后短时间内均表现出相近的(虽然程度有所差异)肌无力症状,所以目前仍无法排除两患儿所患疾病为遗传性疾病的可能。到底哪些性状是由遗传因素引起的呢?我们认为,面部及四肢无力(包括吞咽困难)可能是唯一的遗传性状,也在林林和芊芊身上共有。其他的任何性状都是后发性的或者是医源性的(如后期的严重的运动功能障碍,心脏的功能障碍等等)。

4. 环境风险因素

有很大可能是由环境因素导致的新发基因变化。这种新发突变每个人都会有,完全是随机的,只是偶尔会发生在导致疾病的基因上面,纯属坏运气而已。由于隐性遗传模式的分析方案未获得可能的候选位点,结合最新的在武汉会谈中得到的相关信息,我们认为需要立刻将思路往新发变异方面转移。

图2. 林林妈妈访问北京希望组位于武汉的办公室,与公司成员进行交谈,帮助更好的确定病因,以及更好的理解测序数据。

父母与芊芊外显子测序

与Sanger验证

基于武汉会谈的结果,我们决定对于林林父母也进行外显子测序,寻找新发突变来解释病因。感谢广州暨南大学医学院的研究人员进行了血样的采集和DNA提取工作,并且再次感谢阜外的工作人员进行测序!

对于家庭成员的全外显子组测序结果的分析后,我们发现至少三个新发变异,包括在PFKM,COL6A5和SIPA1中的错义变异,能够改变蛋白质的编码。根据我们的沟通,发现药明康德找到了其中两个变异(PFKM,COL6A5),但是并没有发现SIPA1的变异。

与此同时,我们与药明康德成为仅有的两家拿到芊芊DNA的机构,所以也进行了外显子组测序。测序结果表明,芊芊也有与林林相同的在PFKM和SIPA1 中的错义变异,所以这两个突变和基因的致病可能性增加了很多。

为了更一步确认不是由于测序的误差导致的假阳性,我们又针对这两个突变在全家四个人中进行了Sanger测序,结果表明完全符合我们在二代测序中的发现,也就是说,林林和芊芊都有在PFKM和SIPA1中的新发突变,但是父母没有。

SIPA1基因与疾病的关系尚无明确报道,位于该基因上的新发错义变异未被已有文献报道,不存在于已知变异数据库(包括1000G,ExAC,dbSNP,ESP,Clinvar,HGMD等)中。生物信息学预测软件(SIFT、Polyphen2等)均预测该位点为可能有害变异,物种间保守性高。该基因产物的相互作用蛋白GATA2上游调控蛋白编码基因FHL1,是多种临床症状截然不同的X连锁肌病的致病基因,主要共同临床症状为发病于儿童早期或成年期的严重的(或进行性)肌无力、血清肌酸激酶轻度升高及呼吸衰竭等。但是无直接证据证明该基因本身与肌肉病有关,所以尚无法确定该基因变异与已知临床表型之间的关系。

另外一个新发变异是位于PFKM基因编码区的错义变异,可能与肌肉疾病有关。 这是一个从未被报道的变异,生物信息学分析(SIFT,Polyphen2等)均预测是有害变异,物种间保守性高,已知该基因的致病性变异导致常染色体隐性疾病—糖原储积病,主要表现为肌肉疼痛痉挛,运动不耐,肌肉痉挛抽筋,劳累型肌病及代偿性溶血,根据最新的来自ACMG 2015年的基因变异临床意义判读指南,我们认为该变异为疑似的致病性变异。我们只找出该基因一个可能有害的突变,鉴于所有外显子的测序覆盖度都比较高,假阴性可能性不大(虽然也不能排除微小结构变异)。但是由于遗传模式不符合,所以没法给出确定的诊断。

图3. PFKM和SIPA1的基因变异位点在家系成员中的分布情况。该变异位点仅出现在林林和芊芊的测序数据中(父母未携带),从两个基因变异位点的测序深度及变异所占比例看其数据可靠性高,Sanger测序验证了这一结果真实。

基因拷贝数变异

鉴于我们只能找到一个在PFKM中的有害突变,我们认为存在由结构变异导致隐性遗传疾病的可能,所以下一步我们决定对于家庭进行基因拷贝数的基于Illumina 和博奥芯片平台的检测。这里要感谢博奥晶典生物技术有限公司和博奥检验,在知道我们短时间内没有Illumina 芯片后同意免费利用他们的DNA拷贝数检测平台对于家族进行检测。同时阜外医院及时找到Illumina中华八的900K芯片,也免费进行了基于该芯片的拷贝数变异检测及分析。

我们的初步分析结论:高密度的全基因组范围的染色体芯片检测未发现明显的与已知症状相关的致病性的结构变异。但由于染色体芯片在以上候选基因内部探针分布密度不足(与芯片探针设计分布及基因较小等情况有关),所以很遗憾,利用厂家的分析软件,我们无法从已有芯片数据中看出以上候选基因尤其是PFKM基因内的微小结构变异情况。

总结

经过将近3个月的连续科研,在其他研究团队都已经淡忘或者放弃林林这一个病例后,我们依然在关注,也在想尽办法进行更进一步的分析。尽管目前我们仍然没法给出100%肯定的结论,在这3个月奋战的过程当中,我们自己也接受了一次对于罕见遗传病的再教育,进行了一次对于基因测序行业浮躁现状的观礼,也认识了一些热心的志同道合的朋友。在此我们还要感谢各位在这场战役中提供专家意见与信息的学者和热心人,包括美国贝勒医学院临检实验室的多位教授,美国哥伦比亚大学的专家,美国费城儿童医院的疾病专家等等,就不详细列举了。

基于以上的研究工作,我们认为下一步的分析需要关注以下一些问题,以供学术团体探讨:

(1)关于线粒体的分析结果。目前线粒体的分析结果未发现临床意义比较明确的有害变异,结合线粒体疾病的遗传异质性,可知单独检测外周血细胞的线粒体情况可能会忽略对疾病相关区域组织(如肌肉组织,尤其是与呼吸系统相关的肌肉组织)的线粒体变异信息。

(2)高分辨率的全基因组范围的染色体芯片检测数据中,初步分析结果未发现可能的与临床症状有关的有害变异,下一步可能需要对芯片数据的原始数据利用更灵敏的软件进行详细的分析,以确定受检者基因组在更小的结构变异水平是否存在可能的有害的变异的可能。

(3)进一步的针对严重窒息导致的器官损伤的检测,有助于确定林林后期的严重的运动功能障碍是否是由于这种医源性的损伤导致;对芊芊所服用药物的作用机制、副作用情况、施用情况等临床治疗情况的分析,有助于确定芊芊后续严重的心肺功能障碍是否同样是由于医源性的损伤引起;这些辅助临床检测可以帮助理清临床表型中的遗传因素引起的结果和环境因素引起的结果,有助于排除数据分析中的干扰。

(4)在PFKM中只找到了一个可能的有害突变,不符合经典的PFKM的隐性遗传模式。不过,在遗传学上有很多例子,哪怕是隐性遗传疾病,也有些突变会有dominant negative的作用,使得有该突变的人产生临床性状(一般而言,与经典的隐性遗传性状可能有所不同,或是会轻微一些)。这种可能性非常大,但是需要更多的功能性验证。

(5)贝勒医学院的专家团队在仔细讨论临床表型后指出:现有的影像,病理和代谢的检测结果显示与他们见过其他肌肉病病例相比,也是非典型的。虽然遗传因素无法排除,临床也要考虑病毒类,或自身免疫性的原因。

(6)组织更广泛的专家团队,对已知的候选致病基因位点进行详细的可靠的体内或体外的功能学验证,进一步提供对遗传学分析结果的证据支持。虽然现阶段结果没有建立明确的基因诊断,但是不要着急和失去希望,对于临床上的罕见个例,许多病人都是花了较长的时间才解决问题。

(转载)林林病因诊断初步报告-②


转载自:“优乐复生  TAALSM校友”的微信公众号

11月3日,我们发布了关于林林病因的第一份阶段性报告,得到了广大校友和专业人士的关注。除了向大家汇报了林林病因诊断的初步结果,这份报告还让很多人第一次接触到遗传疾病的分析报告,有一定的科普意义。

今天我们发布第二份初步报告,来自北京优乐复生科技有限公司——

2015年8月23日,一封求助信《孩子罕见病,五年未确诊,清华校友求病因线索!》由清华校友平台公布后,受到了社会和业界的广泛关注。一对清华校友夫妇的孩子林林在出生后不幸患有罕见疾病,从满月至今近6年时间里饱受疾病折磨,目前已只能住在医院ICU病房里,靠呼吸机生存。

为尽快查明致病原因,包括清华大学医学院、阜外医院、复旦附属儿童医院、贝勒医学院、波斯顿儿童医院、香港大学、南加州大学、北京希望组、米宝有约、华大基因、药明康德明码生物在内的多家公司和机构联系林林父母,获得了林林的外周血样本,同时进行了线粒体和全外显子组测序;随后也获得了林林父母的许可,对数据进行了及时公开,以便让更大范围的专家学者参与数据分析解读,尽快获得确切结论。这与长期以来的测序-数据-分析流程全部由同一单位实施有所不同,可以说开创了一种公益性的疑难杂症遗传学分析的众包组织模式。

北京优乐复生公司作为其中的一个参与方,在获得北京阜外医院及华大基因分别提供的患儿林林的 WES 数据后,对数据进行了分析,后期又在阜外医院和米宝有约的大力帮助下,获得了患儿父母及患儿妹妹芊芊的WES及Sanger测序结果。在分析中,我们初步鉴定了一个疑似致病突变。目前,后续实验正在开展过程中。

在数据分析过程中,我们总结了一些经验教训,包括数据分析和生物学判断本身,也包括遗传罕见病的公益性组织模式。现将我们的参与过程详细记录,供更广泛的讨论和参考。

先症者背景

林林于2009年12月足月顺产,妈妈孕检一切正常,父母双方及其它家族成员皆无遗传病史。刚出生时的小林林哭声比较弱小,之后出现喂食困难,继而又因肺炎、窒息等多种状况住院治疗。三月龄及周岁脑部 MRI无异常发现,血液检查发现CK升高,肌电图显示神经传导正常,肌肉活检显示“纤维粗细差异”。六月龄始出现眼动障碍,体检示“心脏瓣片较厚但不影响功能”。由于呼吸系统障碍,林林先是佩带biCap机来协助气流压入呼吸系统,之后情况进一步恶化,林林不得不接受经插喉管呼吸机。林林的父母为了找出病因,辗转各处求医,但均无确切诊断结果。

在林林将近四岁时,他的妹妹芊芊出生。刚出生的芊芊健康正常,但不久也出现轻度喂食困难,后来芊芊感染RSV病毒(婴幼儿常见)并出现多痰而住院治疗。幼小的芊芊在18月龄体检发现心衰先兆症状,“院内感染副流感导致心肺衰竭”,服用地高辛后心衰症状康复,停服地高辛后心衰再次发作。

数据分析

优乐复生在获得了林林的原始测序数据后,即组织公司内最精干团队开展了数据分析工作,以期尽早确定致病原因。

按照林林及芊芊表型,神经网络分析可能为线粒体功能障碍,肌肉代谢障碍。另外,在分析林林的全外显子测序结果时,我们也发现林林携带较高比率的低丰度错义突变,体细胞突变率比数据库中的健康人群对照组相对高,提示DNA修复或基因组稳定性受到影响。由于林林的全外显子测序未显示DNA修复相关基因突变,我们怀疑呼吸链或能量代谢链受到一定压力,这也与前述的表型分析能相互印证。

由于母系家系无发病史,可初步除外母系线粒体杂合漂变,考虑常染色体突变。我们考虑了几种遗传模型,包括符合AR(常染色体隐性)的SNV/indel(SNV:单核苷酸突变;indel:短插入缺失),符合CH(复合杂合)的SNV/indel/SV(SV:染色体结构变异),de novo dominant(新生显性突变)的SNV/SV,以及外显率不完全的孟德尔遗传。我们首先分析了可能的AR/CH情况,但是没有发现任一基因上存在两个可能的致病变异。由于penetration非常强(两个孩子均患病),外显率不完全的概率也不高。这样我们只剩下denovo的一种可能。

因为没有父母对照,我们在林林测序数据中发现的单倍体变异是否属于新生变异实际上是不明确的,我们只能把测序数据中每个被发现的罕见突变都作为可能的致病突变来考虑,这么一来,仅仅需要分析的错义突变(改变蛋白质序列的突变)就达到了500多个。通过将表型输入神经网络进行迭代分析,我们得到了接近50个候选突变。

比较幸运的是,这里面还没有SV突变,都是SNV。否则的话,可能就没办法继续往下排查下去了。对于SNV,我们还能做结构。实在没办法,我们只能对每个携带突变的基因,找出其蛋白质晶体结构(有的只有同源蛋白质结构),一个个去做分子模拟。通过这种方法,我们排除了其它所有罕见突变,定位了一个和肌肉能量代谢相关表型符合,在人群中未发现的突变PFKM E629K。

PFK的中文名是磷酸果糖激酶,催化糖酵解的第三步。在人基因组中,存在PFK的两个homolog(同源基因)PFKL(肝磷酸果糖激酶)和PFKM(肌肉磷酸果糖激酶),另外血小板中还存在第三个同源基因PFKPL(血小板磷酸果糖激酶)。PFK以四聚体形式存在,在肌肉中,只存在PFKM形成的四聚体;在红细胞中,存在PFKM和PFKL组合而成的四聚体。PFK的底物是F6P(磷酸-6-果糖)和ATP,催化产物是F(1,6)P2和ADP。通过分析结构,我们发现PFKM E629侧链正好位于该结构的F(1,6)P2结合口袋(图1:A),该口袋也能结合PFKM的强别构调控分子F(2,6)P2,而后者是PFKM酶活的关键调节分子。E629K突变(图1:B,C,D,F)使整个结合口袋区的电荷分布发生了变化,从结构上来看(图1:E,G),酶功能会受到很大影响。这个结合口袋结构来源是酶二聚体,即使是一个正常的PFKM,结合一个突变的PFKM以后整个酶二聚体也会受到功能上的影响。因此,我们考虑PFKM E629K为一个显性突变。

643

图1:A. PFKM 结构(hmPFKM: PDB 3O8N),示PFKM单体结构及E629。B/C:PFKM E629K突变(resi 629 as sticks);D/F: PFK1(hmPFKpl: PDB 4XZ2) E639K(PFKM E629同源氨基酸侧链, as sticks)突变及电荷分布图,红色为负电,蓝色为正电;E/G: F(1,6)P2(sticks)结合于结合口袋。

PFKM突变造成糖原贮积病 7 型(Tauri disease)。该疾病表型与林林肌肉表型部分相似。部分糖原贮积病 7 型病人为新生儿期发病并迅速发展。严重糖原贮积病 7 型表现为溶血及贫血表型,且运动后可能表现黑尿症,在林林病历中未见。林林携带E629K 突变为杂合,可能为显性负性,根据其蛋白结构推测,假如PFKM E629K为显性负性,肌肉在最坏情况下仍具有 1/4 PFK 功能,红血球在最坏情况下仍具有 3/4 PFK 功能(红血球中同时表达 PFKM 及 PFKL),为可能的一个解释。

在我们从蛋白结构角度入手获得疑似致病的PFKM E629K突变信息之后,我们向林林妈妈申请了父母及芊芊的全外显子测序数据,以及全家的CNV芯片数据。经过验证,芊芊和林林均携带PFKM E629K突变,而父母均不携带(图2)。从我们获得的信息显示,该结果也已被Sanger测序验证。另一方面,我们在不预设先验条件下,使用遗传模型对所有quartet测序数据进行过滤以后,使用神经网络对表型和基因型进行分析,同样只获得了同一个疑似致病的PFKM E629K突变。与单proband WES SV分析一致,CNV芯片分析没有发现任何可能致病的结构变异。因此,我们认为PFKM E629K突变的致病可能性较高。该突变在quartet中遗传模式符合de novo dominant模型,因此,我们认为该突变很可能为一个de novo显性负性突变,突变来源可能为父母其中一方的配子嵌合。后续确认还需要进一步的生化功能实验和分子生物学验证,正在安排展开。

644

图2. 林林/父亲/母亲的PFKM E629K 突变位点二代测序覆盖结果。

总结

近3个月来,优乐复生科学家团队与林林的母亲及业内合作伙伴保持密切沟通,不断验证研究结果,利用数据分析技术鉴定了一个疑似致病突变,并将在此基础上继续协助林林父母对林林的病因展开进一步深入研究。在此我们首先要感谢所有无私提供测序及临床数据的相关机构,也要感谢林林父母同意我们将相关病历及分析过程作为案例向业内公开,与更多的专业人士和机构共同探讨和交流,为林林及可能的更多类似罕见病患者提供帮助。

在这个案例的分析过程中,优乐复生团队认为,尽管全外显子测序在罕见病诊断方面具有很强的解析能力,单测proband(先症者)的策略却很可能流于失败。实际上,在这个案例中,如果不是SNV突变而是一个haploinsufficient CNV甚至是SV,那单纯使用proband测序结果很难拿到结果;即使是SNV突变,如果不是恰好是个蛋白结构很清楚的突变,也没有做过生化,也很难说能不能拿到结果。另外,在测序中的许多平台/实验方法引入的错误,同样可以通过同平台的对照测序数据得以排除。我们认为,对疑难病人trio甚至quartet进行直接全外显子测序,可以缩短从测序到发现鉴定病因的时间,提高鉴定病因的成功率,在很多情况下,对病人是费效比较高的策略。对于某些特定种类疾病,在表型有嵌合特征时,可考虑高深度WES测序。对于SV鉴定,我们认为低覆盖度WGS的费效比应该更高。

其次,表型的鉴定十分关键。在这个案例中,UCL提供的肌肉活检报告提示“类CHKB肌病”,从病理层面直接鉴定了发病位置。临床表型相对复杂,许多表型可能是次生产生,不完全与遗传学有关,但对于严重疾病来说,一定存在一个核心表型直接与遗传背景关联。如何从纷繁复杂的表型中寻找出核心病理缺陷,既要依靠专业病理判断,也要依靠临床经验,还要依靠对生物学的深刻理解。目前优乐复生不仅依靠科研团队的判断,也使用机器学习算法对临床数据和观察结果进行特征分析。实际上,引入数据技术不仅能帮助临床表型判断,可能也可以通过相互迭代,逐步逼近核心基因型-表型关系。在准确判断表型的基础上,我们认为通过一些传统人类遗传学技术以外的方法,如将结构生物学,蛋白相互作用,深度学习发现的可变剪切等引入遗传分析,对鉴定的成功率也有很大的帮助。

最后,我们认为,这类类似“公益众筹”的疑难遗传病测序分析模式,在这次事件后会迅速流行起来,作为遗传病研究机构,优乐复生也很愿意参与。但我们认为其中的知情同意,法律授权,数据归属,结果交流,数据发布等环节需要进一步正规化,否则,对病人及其家庭并无实质帮助,甚至会有一定负面作用。

联系优乐复生:

北京市海淀区永丰工业园丰贤中路7号孵化楼B座4层

赵欣:zhaoxin@eulertechnology.com

0086-18610080763

 

林林离确诊还有多远?


640 (2)

文/水晶基因

世界范围的关注与取得的进展——————–

近来林林的故事牵动着众多医务人员,遗传专家及关注这个特殊家庭的大众的心。水晶基因侦探员综合最新的进展跟大家共同探讨一下。

2009年12月,小林林出生了。他是一个足月顺产的男孩。之前的妈妈孕检也一切正常。父母双方皆无遗传病史。只是刚下生的小林林哭声比较弱小,之后便出现喂食困难。继而又因肺炎,窒息等多种状况住院治疗。

由于呼吸系统障碍,林林先是佩带biCap机来协助气流压入呼吸系统。之后情况进一步恶化,林林不得不接受经插喉管呼吸机。林林的父母为了找出病因,辗转各处求医。但均无确切诊断结果。鉴于林林的肌酸激酶偏高,一度初步判断为肌病。林林临床上支持肌病的表型还包括:大腿肌肉活检显示纤维大小略有差异,面部及四肢近端肌肉无力以及眼肌麻痹。

在林林将近四岁的时候,他的妹妹芊芊出生了。刚出生的芊芊是个面色红润,健康正常的小女孩。但不久芊芊便感染RSV病毒(婴幼儿常见)并出现多痰而住院治疗。幼小的芊芊和她的哥哥一样,也出现轻度喂食困难。芊芊在18个月时开始发生反复心肺衰竭,情况危急。

一个家庭中先后两个患病幼儿,在同情这个家庭的同时不得不思索其原因。究竟是巧合,父母遗传,抑或其他不明环境诱因?

先来对比一下两个孩子的临床表征。林林和芊芊的血检肌酸激酶(CK)都偏高。面部及四肢近端肌肉无力。眼肌麻痹。这些症状在就诊初期提示非典型肌肉病。另外,林林和芊芊的脑部核磁共振均显正常。当然,两个孩子的表现也有许多不同之处。比如,林林的主要障碍集中于呼吸系统功能异常,如多痰,反复肺炎发作,窒息等。而芊芊则主要表现为心脏功能不全,严重心肺衰竭。详情见表一。

表一. 林林兄妹临床症状比对

640 (3)

有没有可能兄妹患同一种病呢?如果是同一种病,又如何解释林林和芊芊的表型上的差异呢?在遗传学上,携带同一突变而表型出现差异这种现象并不鲜见,一种病在不同个体表现各有差异, 最典型的例子就属线粒体疾病的异质性。一个携带有某种线粒体突变的母亲可以传递给各个子女不同数量的突变线粒体DNA,进而导致子女之间的临床表现迥异。另一个常染色体遗传的例子是LMNA相关的疾病。Brodsky等在2000年曾经报道过一个家系(1)。这个家系中有多个家庭成员携带有一个959位的T碱基缺失。但他们的临床症状却不相同。有三位患者疑似肌肉营养不良等肌病,其中两个有房室传导异常,一个房性心律失常,还有一个有扩张性心肌病。对于林林和芊芊的病例,至此只能说并不能仅根据两兄妹的临床症状差异就排除是同一种疾病的可能。

再回到林林和芊芊的病例上。由于林林和芊芊多年求诊未果,他们的父母于2015年8月求助于遗传诊断以期望从DNA水平上得以解释。带着对科学的探求和帮助幼小林林的心愿,多家机构,公司,院所伸出了援助之手。前后有华大基因,清华医学院,药明康德,北京阜外医院,美国贝勒医学院,复旦大学,美国哈佛医学院等十七家专业机构为林林提供免费基因检测和遗传分析解读。戴红政和张巍博士也曾专撰文《测序!测序!测序!为什么给林林测序?》。详细阐述了测序对于疾病诊断的重要性。测序数据的获得只是这个漫长过程的第一步。其中有来自清华大学,阜外医院,香港大学,美国南加州大学,米宝有约和北京希望组成的专家组第一时间采集到林林的外周血,对林林进行全外显子,线粒体和及针对先天性肌营养不良的基因组进行高密二代测序。华大基因也随后采集了林林的外周血启动了外显子组和线粒体二代测序。之后明码生物科技联合复旦大学附属儿科医院,贝勒医学院和波士顿儿童医院也于9月1日采样加入林林的测序队伍。9月4日,北京阜外和华大基因同时完成林林的测序,并公开测序数据邀请多方专家共同解读。随后明码生物宣布完成林林的全基因组测序。所有参与测序单位均以时间顺序列于图一。

图一. 参与林林测序的单位按时间列表

640 (4)

水晶基因侦探综合了迄今为止各方公开的数据。林林接受的所有遗传检测见附表二。在大通量测序介入之前,林林在广州儿童医院进行了脊髓性肌萎缩(SpinalMuscular Atrophy, SMA)以及MELAS和MERRF等线粒体疾病的遗传检测。结果皆为正常。直到2015年的八月份,在多年的就诊过程仍未能得出患病原因的情况下,林林的父母又重新寻求进一步的遗传检测。在了解了林林和芊芊的病例后,先后有三组人员投入了紧张的测序工作中。他们应用二代测序技术涵盖了林林的线粒体基因组,外显子基因组以及全基因组。

清华大学/阜外医院和华大基因几乎同时完成了测序工作。并号召各个临床科室,商业运作单位,遗传专家参与到测序信息的分析解读中来。但之后清华阜外组宣布经过遴选,鉴定,所获序列变异皆不符合林林的特征和遗传方式。于是进而展开对林林父母的全外显子测序。目前测序结果尚未公布。

华大基因的初步解读结果于9月5号公布。在线粒体基因中检出一临床意义未明变异: MT-TE,m.14693 A>G。根据华大的判断和相关报道,该变异与其他致病突变同时存在时,会导致MELAS、耳聋、或LHON等。因此,这个变异更倾向于是个调控因子(Modifier)而非致病原因。 华大的外显子测序结果排除了先天性肌病缺陷突变(Congenital Muscular Dystrophy,CMD), 囊性纤肿和糖原累积缺陷。其他区域基于OMIM数据库和CGD数据库进行解读,均未检出与患者表型相符的已知或疑似致病突变。华大的验证工作仍在进行中。

表二. 基因测序结果

640 (5)

之后华大的测序结果由北京德易东方转化医学研究中心解读公布。水晶基因侦探在此对这些公开的数据做了进一步的梳理,以期与业界同行共同探讨。首先我们想明确一点的是:如果一个DNA序列的变异在没有清楚的临床定义以前,在诊断界一般不倾向于称之为突变。这一点有别于科学研究报道。我们一般会称为变化,变异,未明序列变异等。对序列变异的标准分类水晶团队将另文详细介绍,敬请期待。

1.DNA2基因1个杂合突变:c.2618T>C,p.Y873C;rs200309792,等位基因频率为0.0002;水晶团队更正为ExAC数据库东亚人群频率0.0022;千人基因组数据库南亚人群频率0.001.DNA2 基因突变可以导致下肢肌肉无力,眼外肌麻痹,运动耐受能力下降。其遗传方式为常染色体显性遗传。德易破解的p.Y873C变异的等位基因频率为0.0002.这意味着如果这个变异为致病突变,将有万分之二的人患有此种疾病。而基于水晶基因的频率则患病频率更高。截至目前为止,公开的可见报道有4个病人携带有DNA2突变。鉴

于这一极低的发病频率,p.Y873C极为可能是一比较少见的中性的DNA序列变化,而非病理性变异。

2. TTN基因2个杂合突变:c.38378T>C,p.K12793R, rs189389531;等位基因频率为0.0034。水晶团队更正为ExAC数据库东亚人群频率0.014,千人基因组数据库亚洲人群频率0.014;第二个突变核酸改变为c.77158G>C,p.P25720A。等位基因频率为0.005. TTN基因是遗传性肌病早期呼吸衰竭(Hereditarymyopathy with early respiratory failure, HMERF)的致病基因。遗传方式为常染色体显性遗传。发病年龄多为成年。这一点与本文患者不符。大部分HMERF的患者的致病突变都是从同样携带有突变的父母那里遗传来的。这一点也与本文所描述的家庭相悖。同样的道理,两个DNA序列变化的相对高频率也一定程度上暗示这两个位点不太可能是病理性的有害突变。

3. MTMR14基因1个杂合突变: c.1316C>T,p.T439I。到目前为止,有关MTMR14基因功能的报道甚少。曾有报道MTMR14可能与中央核肌肉病变(centronuclearmyopathy)相关。但并没有十分有力的证据支持。这一疾病的遗传模式为常染色体显性遗传。这种病变的典型临床特征包括新生儿肌张力下降,近端肌无力和眼肌麻痹。但文中所述的兄妹在新生儿期均表现正常,并无肌张力下降,似乎也不支持MTMR14突变为这一兄妹的致病原因。但就这一变异而言,水晶团队倾向定义为功能未明变异(Variant of Unknown Significance,VUS).

4. SLC52A3基因1个杂合突变:c.1402G>A,p.P468S.SLC52A3是核黄素转运蛋白缺乏导致的神经元性肌病的致病基因。这一疾病的遗传方式是常染色体隐性遗传。这一疾病的特征包括神经麻痹,听力缺陷,肌肉无力以及呼吸问题。但所报道两个孩子都不显现听力丧失。另外,如果SLC52A3突变是致病遗传原因,那么这个基因应该有两个突变而非一个。因此从遗传方式似乎也不太支持这一变异是诱发林林临床病症的原因。水晶团队同样建议将这一序列变化定义为VUS.

5.原发性辅酶Q10缺乏症通路上的两个致病基因上分别发现1个杂合变异COQ2基因1个杂合突变:c.83G>T,p.A28E和COQ9基因1个杂合突变:c.625C>G,p.L209V,rs78846023; MAF为0.0048。水晶团队更正为ExAC数据库东亚人群频率0.01, 千人基因组数据库亚洲人群频率0.01。频率如此之高,提示不太可能是致病突变。这两个基因在德易的报道中有可能涉及原发性辅酶Q10缺乏症。这两个基因均为诱发线粒体原发性辅酶Q10缺乏症的核基因。其遗传方式为常染色体隐性遗传。这种缺乏症在基因水平上的发生原因一则为所以某一基因的纯合突变或复合杂合突变。而如果一条通路上的两个杂合突变并不能致病。现在回到德易所报道的两个变异上。假设第一个p.A28E为致病突变,我们需要找到第二个COQ2突变来支持我们的假设。第二个为一COQ9变异,其基因型频率为0.0048。同样道理,如果COQ2是致病基因,那么这个基因应该有两个突变而非一个。现在来简单阐述一下这一缺乏症的的临床表现,原发性辅酶Q10缺乏症主要临床症状为心脏衰竭,高血压和胸部疼痛。这些和兄妹两个的临床表现似乎都有出入。

6. BDNF基因1个杂合突变:m.81G>T,由于这个位点在测序中覆盖率不理想,不符合用于临床信息的要求,暂不作分析。

7. RYR1基因 c.135A>C,p.D1712A,由于这一变异的测序精确度不理想,不符合用于临床信息的要求。这里不予分析。

8. SPEG基因1个杂合突变:c.6304C>T,p.P2102S。这一变异的测序精确度也同样不理想,这里不予分析。

综上可见,目前为止以上序列变异没有非常强的证据支持确诊。需要指出的是这是德易公布的分析结果,并未得到华大的证实。

2015年9月20日,明码生物科技在他们自己的测序基础上,锁定两个疑似变异,并对这两个变异进行了父母一代测序,证实为后天突变(de novo)。然后他们进一步采集了林林父母和妹妹的血样,开展二期包括以上三人的全基因组测序。由于这两个突变并未公开,所以在此不予讨论。

我们离真相还有多远?————————

至此,我们综述了迄今围绕林林诊断展开的工作。以下水晶基因团队作为林林的关注者发表一些看法,期望抛砖引玉,与同行一道尽快找到林林的致病原因。

图二. 林林家系图。林林为先证者,以箭头标出。由于妹妹暂时无法定论是否与林林患有同一种疾病,所以暂时未涂实体阴影标为患者。

640 (1)

首先,水晶基因团队希望先理清遗传诊断须遵循的一般思路——这一思路应当是临床(表型)+ 实验室(基因型)并重模式。虽然许多遗传病表型清晰,常规临床分析加序列测定证实即可找到致病原因,但也有不少遗传病的表型千差万别,很多时候以上模式是无法做出正确判断的。尤其是对罕见遗传病更是这样。林林的病例就是一个典型的例子。这一病例里面的关键问题是:林林和他的妹妹在临床表现上到底是相同还是不同的病理特征这一问题直接左右实验室和分析解读人员努力的方向。因为表型的统一性不但能够帮助判断一种疾病表现遗传与否,而且提示遗传疾病的遗传模式。有了这个模式,才能建立家系内表型和基因型走向上的相关性。这就意味着,最好在实验室检查之前,组织临床专家对林林和芊芊的临床症状做出详细的会诊,调阅所有以前检查的资料。截止目前为止,芊芊的临床检查信息还未公布。在缺乏临床数据的前提下,就有多个问题:

  • 他们的疾病是遗传病吗?儿童罹患疾病只有很少的一部分是遗传性的。有无可能林林和妹妹的临床症状并非遗传导致,而是他们所共同生活的环境中的某种致畸物质所至。这种观点听来似乎有些危言耸听。但致畸咨询分析向来是临床诊断和遗传咨询的一个重要组成部分。致畸剂可以是化学物质,也可以是某种临床治疗,或是怀孕过程中的病毒感染。最著名的例子当属在60年代用于医治早期孕吐的药物Thalidomide,这种药物会诱发胎儿的四肢发育畸形而产生“海豹肢儿”。在某些案例,母亲如果有长期的慢性疾病症状,也会导致孕程不顺利或胎儿致畸。再如母亲如果患有哮喘,那腹中的胎儿可能会由于没有足够的血氧供应而导致大脑或其他器官发育障碍。所以,建议是否在临床会诊中详细回顾父母的生活方式,健康状况,予以排除两兄妹胚胎或环境致畸的可能性。此外,鉴于林林和芊芊均有感染史,会诊中也需要理清原发性病症和继发性病症,以明确哪些症状最可能是先天遗传的。
  • 如果是遗传病,疾病的遗传模式是什么?无疑林林和芊芊的病例是十分罕见的,这给整个临床诊断增加了巨大的难度。第一个临床问题是,林林和芊芊是不是同一种病?大家在从父母和芊芊身上寻找佐证的同时就已经假定兄妹是同一种病症,并且是由遗传原因所致。假如是同一种遗传缺陷导致的兄妹两个的异常,那存在哪几种可能呢?如果父母正常首先会想到的是常染色体隐形遗传,父母为携带者,每次生育有25%几率孩子患病。两个孩子都患病的几率为25% x 25%, 为1/16. 常染色体隐形患病多见于相对比较闭塞的山区,部落,近亲结婚是隐形遗传等位基因纯合的最重要原因。林林和芊芊的父母非近亲结婚,并且双方皆无隐形遗传病史。这种情况在一定程度上减低了兄妹皆患同一种常染色体隐性遗传病的可能。第二种情况为母系线粒体遗传疾病。线粒体DNA的单碱基变异或拷贝数目重复多为母系遗传。而拷贝数目缺失多为新的后天变异。母系遗传即只有母亲才可以向下一代传递突变线粒体DNA。而患病的父亲由于在受精精卵结合时精子的线粒体DNA被丢弃而没有向下一代传递突变的风险。线粒体遗传的另一特点是异质性(heteroplasmy), 即每个细胞可含有不同数量,比例的正常线粒体和突变线粒体。因而不同后代个体因遗传变异线粒体DNA数量不同而导致临床症状各不相同。但携带有这一变异的母亲也可能由于异质性的存在而外观完全正常。还有一种可能就是生殖细胞嵌合体。顾名思义,生殖细胞嵌合体就是生殖细胞有两种甚或多种遗传物质相异的细胞群体组成。这种嵌合体可以存在于卵子,也可以存在于精子。而带有这个嵌合体的本人由于其他体细胞正常而并不发病。多数个体直到生育多个患病后代后才意识到自己的嵌合体状态。如果是常染色体隐性遗传疾病,几个课题组是可以通过测试血液样品寻查突变。但如果存在后两种情况,由于遗传机制的异质性,是否应该考虑测试其他来源的组织如肌肉组织,进一步测试线粒体遗传,而采取父亲的精液来测试生殖细胞嵌合体遗传
  • 目前的努力方向是假定这是遗传变异导致的疾病。即使做出这样的假定,业界投入了大量的测序工作,这样的工作会导向一个更加清晰的结果吗?先从林林的检测规划谈起。林林最初接受了SMA和两个线粒体疾病的检测。直到2015年夏,各个团体开始了全外显子,以及全基因组检测。在此之前,至少从目前公布的材料和病历来看,林林并没有接受基因组微阵列分析来鉴定是否有大的片段拷贝数目变异。此外,至少基于已公布的资料,我们并没有发现林林的核型资料(也许产前已作,未证实)。尽管WES和WGS在越来越昭示它们强大的技术魅力,但由于全基因组微阵列分析在搜寻小片断缺失或增加,染色体水平上的易位的独特优势,在当今的诊断策略,尤其是针对临床诊断未明症状,这一技术依然被列为常规分子检测中的第一选择。在今年8月份期的 Genetics in Medicine 报道了来自GeneDX的一个大规模的比较汇报借以阐述全外显子测序是否可以高效的检测小片段的拷贝数目变异(1)。在他们的报道中,他们平行进行了两项检测。检测一是将全基因组阵列比较杂交已经证实的拷贝数变异,覆盖12个已知缺失或增加盲加到WES中。测试结果显示,所有12个已知变异的WES数据和已知的阵列杂交数据相比,都显示不同程度的偏差。检测二是把WES所探测到的拷贝数目变异反向进行全基因组阵列杂交分析。他们随即挑选了54例具有临床病理意义的CNV进行检测证实。这54例中的34例得到了证实,其他20例由于各种原因,包括背景噪音,检测灵敏度等等而未能得以证实。无疑,这一工作提示我们,全基因组微阵列分析在搜寻拷贝数目变异水平是是不可或缺的。至少目前是不能为WES或WGS替代的。近期的JAMA报道了来自多伦多大学的工作(2)。他们在自闭症的基因诊断中进行了基因组微阵列分析和WES的比对。结果也显示目前基因组阵列仍应和WES相辅相成,这样才是最佳诊断方案。有无可能林林会携带有拷贝数目变异呢?业界是否可以考虑对林林进行全基因组微阵列分析呢

最后,水晶侦探提醒大家,DNA测序不是万能的。对未知遗传病的检查,WES的成功检测率只有15-25%。还有高达80%的病人即使进行了外显子测序但诊断结果仍然不明(3)。再者,WES的结果解释和证实是个巨大的挑战。至今尽管有无数的临床实验室和公司在努力开发各种解读方案和软件,解读的过程在很大程度上还是受到技术上的限制(4)。NGS结果的解释仍须紧密结合临床指征,家庭信息,仍然需要有丰富临床遗传背景和基因诊断背景的专业人士的详细分析,说它是一个侦探断案的过程毫不为过。水晶基因愿与各界同行一道,群策群力,为尽早揭示这一病因贡献力量。

林林的家庭是不幸的,对同一家庭出现这样的情况,相信所有的读者都感同身受。幸运的是,有这么多专家,课题组参与到林林的病因搜寻中来,同时,我们也应看到,这是一个艰难的攻关课题,它涉及到临床专家,基因诊断及遗传咨询的多方支持以及大量的财力、物力投入。我们共同期待林林案例水落石出的一天。也祝愿林林在不久的将来在基因诊断的辅助支持下,得到更完善的治疗,健康成长。

参考文献

1. Brodsky GL et al. Lamin A/C gene mutation associated with dilatedcardiomyopathy with variable skeletal muscle involvement.Circulation. 2000.

2. Miller DT, et al.Consensus statement: chromosomal microarray is a first-tier clinical diagnostictest for individuals with developmental disabilities or congenital anomalies.Am J Hum Genet. 2010.

3. Tammimies K, et al.Molecular Diagnostic Yield of Chromosomal Microarray Analysis and Whole-ExomeSequencing in Children With Autism Spectrum Disorder. JAMA. 2015.

4. Retterer Ketal. Assessing copy number fromexome sequencing and exome array CGH based on CNV spectrum in a large clinicalcohort. Genet Med. 2015.

5. Atwal PS etal.Clinical whole-exome sequencing: are we there yet? GENETICS in MEDICINE.2014.

 

640 (2)

水晶基因以精确、清晰的遗传咨询与分子诊断病例分析为目标,向您传递精准医疗领域最新的进展。水晶基因,为您提供个性化的服务。更多精彩内容,敬请关注【水晶基因公众号】。

Your Gene, Crystal Clear!