更具新闻影响力网站
欢迎投稿本网站
主页 > 旅游 >

首次破译人类基因组

发布时间:2022-04-02 06:07   来源:未知    作者:新博网

作者 | 冯丽妃

北京时间4月1日凌晨,有史以来最完整的人类基因组图谱宣告绘制完成。

它有多重要呢?最新一期Science把封面位置给了这项成果,并一口气刊登6篇论文,多方位概述了人类基因组测序工作背后的新发现以及对新基因组区域的一些初步分析。

更值一提的是,6篇论文的第一作者都是处于职业早期的科学家、研究生和博士后。而且,这项国际合作研究是由一个名为T2T联盟的虚拟社区发起,其中包括33家机构的114名科学家,它甚至没有任何专门的资金支持。T2T联盟联合主席、美国加州大学圣克鲁兹分校的凯伦•米加(Karen Miga)告诉《中国科学报》,“这是一项‘草根’工作。”

Science封面


“高配汽车”


先来了解一下他们究竟做了什么。

早在1990年,人类基因组计划(HGP)就启动了。到2001年,科学家拿到了人类基因组序列的草图。之所以称为草图,是因为这本“生命天书”有很多“缺页”,即基因组序列存在缺失或错误。“缺页”中包括大量高度重复的序列。

“构成人类23对染色体的DNA碱基对太长了,当时测序时总是要切割。然后我们就遇到一个问题——人类遗传密码中有大量的重复序列。”中科院院士、国际人类基因组计划参与者陈润生向《中国科学报》解释,其中一类是像“糖葫芦”一样串联的重复序列,另一类则是散在的重复序列。

“如果串成串,你不知道它串的是99个重复还是100个重复;散在的问题就不知道要把它接到哪一个具有重复基因的片段上。”他补充说,有人将这部分难测的基因形容为“梦幻的”或“隐蔽的”基因。

2003年人类基因组计划宣告完成之后,遗传学家继续对这部分隐蔽基因进行改进,但仍有约8%的序列存在缺失或错误。

今天,这最后一块拼图终于嵌入人类基因组图谱。它被认为是自人类基因组草图首次发布以来进行的最大改进:

•它比上一个版本增加了近2亿个碱基对以及2000多个新基因。

•绘制了更精确的五条染色体臂的图谱,这将有助于进一步增加人们对染色体的认识。

•覆盖了基因组中最复杂的一些区域,包括在重要染色体结构中及其周围发现的高度重复的DNA序列,如着丝粒和核糖体DNA。着丝粒是将两条染色体连接在一起的部分,在细胞分裂中起着关键作用。核糖体DNA为细胞的蛋白质工厂提供指令。还有一些可能帮助物种适应的新基因。

•还发现了人类基因组中超过200万个变异,为622个医学相关的基因组变异提供了更准确的信息。


“人类基因组的这些部分,对我们理解基因组如何工作、遗传疾病、人类多样性和进化非常重要。”米加在邮件中向《中国科学报》回复。

对此,人类基因组计划的中国参与者、中国科学院基因组所研究员于军在接受《中国科学报》采访时则比喻说:“假如说把人类基因组序列比作一辆非常复杂的汽车,与20年前完成的人类基因组草图相比,完整的新序列相当于增添了更多零件。”

“没有它能跑,有它更好。”


技术改变游戏规则


当初草图的“缺页”,科学家并非不想补上,而是受限于技术,根本补不了。

对基因组进行测序就像将一本书切成大量的小段文本,然后尝试通过再次将它们拼凑在一起来重建这本书。

显然,切得越碎,还原工作就越难,也更容易出错。人类基因组计划使用的“短读”技术,也是当时唯一可用的基因组图谱技术,它一次只能读取相当于几个字的遗传密码。

直到过去十年间,第三代DNA测序“长读”技术出现,游戏规则被改变了。“长读”技术可以一次阅读整个句子,甚至是段落。因此,研究人员能够看到大段,甚至整个段落的重复。

在T2T联盟采用的两种技术中,牛津纳米孔DNA测序方法可以一次读取100万个DNA字母,但精度不高;而太平洋生物科学公司的测序方法可以读取大约2万个字母,精度近乎完美。这种两种测序方法的优势“叠加”,生成了完整的人类基因组序列。

“这种技术的进步是划时代的,就像火车从蒸汽机发展到内燃机再到信息化、智能化的大踏步前进。”于军说,这是获取完整序列的后盾。

“长读取序列数据,加上执行基因组重建和质量评估的创新方法,是这项努力成功的原因。”米加说。

图源:Science


“草根”组装


绘制出草图的人类基因组计划,是生物学史上规模最大的科技项目。共有美、英、日、法、德、中六国科学家参与。

相比这一国家级的合作,此次宣布完整图谱的科学家群体则组织松散。他们有各自的供职机构,但都加入了虚拟社区T2T联盟。该联盟由米加和美国国家人类基因组研究所的亚当•菲利皮(Adam Phillippy)领导。T2T是指“端粒到端粒”,寓意是对每条染色体从一端到另一端进行测序,而每条染色体的末端都由端粒构成。

“我们的第一作者都是初期职业早期的科学家、研究生和博士后。这是一项‘草根’工作,并没有任何特定的资金来源基础。T2T代表了一个由充满激情的研究人员组成的虚拟社区,我们共同努力完成了完整的人类基因组测序——尤其是在全球大流行期间。”米加说。

正是这些科学家的共同智慧,解决了绘制完整图谱的另一个大难题。

普通人类细胞的每段DNA都有两个副本,一个来自母亲,另一个来自父亲,往往存在重大差异。当科学家试图组装基因组片段时,来自父母的序列可能会混合在一起,掩盖了个体基因组中的实际变化。

T2T联盟的科学家创新性地通过使用一种不寻常的细胞类型,一举简化了这个谜题。

他们从一个被称为CHM13的细胞系中读取DNA。该细胞系来自完全性葡萄胎,是指当精子使一个没有细胞核的卵子受精时在人体内形成的组织。

这种细胞类型只包含从父亲那里继承的DNA,从而解决父母DNA序列混合的问题。

基于T2T联盟的贡献,新版本基因组被命名为T2T-CHM13。


中国缺位此次完整测序?


在20年多前的国际人类基因组计划中,中国作为唯一的发展中国家,参与了1%的基因序列图谱绘制。

对于这次合作研究中是否有中国科学家参与,米加并未向《中国科学报》直接回复,而是表示:“所有参与者的名字都显示在相关论文中。T2T正在继续发展,欢迎任何国际研究人员加入和参与研究。”

关于这一问题,深圳华大生命科学研究院群体基因组学领域首席科学家金鑫也向记者表示,据他所知没有中国科学家参与其中。

不过他表示,在“长读”技术方面,国内多家机构正处于研发和追赶的阶段,现在也有了一些突破。而且,华大基因参与的名为“万种脊椎动物基因组计划”的国际大科学合作计划,也用到了“长读”技术,能够把整条染色体组装出来。

据介绍,T2T-CHM13将为由基因组参考联盟构建的标准人类参考基因组38 (GRCh38)提供补充。该基因组起源于人类基因组计划,自2000年第一稿以来一直在不断更新。GRCh38并不代表任何一个个体,而是由多个捐赠者的DNA组装而成,被合并为一个线性序列。

对此,于军认为,中国人的基因组与现有的完整白人基因组序列仍然存在较大差异,他希望我国尽快发展三代、四代测序技术,测出完整的中国人基因组序列。

更重要的是,他表示,像我国这样的多民族国家应该了解代表性的个体基因组完整性,从而深入破解中华文明繁衍之谜。


参考文献:

https://www.science.org/doi/10.1126/science.abj6987

https://www.science.org/doi/10.1126/science.abl3533

https://www.science.org/doi/10.1126/science.abj6965

https://www.science.org/doi/10.1126/science.abl4178

https://www.science.org/doi/10.1126/science.abk3112

https://www.science.org/doi/10.1126/science.abj5089

上一篇:日本将成人年龄下调
下一篇:31省昨日新增本土“2086 7789”

分享到:
0
最新资讯
阅读排行
广告位