12月6日,《科学》在线发表了西湖大学生命科学学院、西湖实验室教授俞晓春团队最新成果“完整的端粒到端粒小鼠参考基因组序列”,报道了该团队在解析小鼠参考基因组方面取得的重要突破。这意味着人类历史上第一次看清了小鼠基因组DNA全貌。
目前小鼠的基因“档案”中,最完整的是参考基因组GRCm39,同样也存在约7~8%未被解析的区域。小鼠是生命科学研究中最常见的实验动物和模式生物,这是因为许多生物实验不宜在人体内进行,因此,小鼠的基因组DNA信息直接关系到人类健康的探索。
俞晓春团队综合了众多三代基因测序技术,让它们互相补足,开发了一把能够充分挖掘小鼠基因的“金铲子”。他们以最常用的小鼠C57BL/6的单倍体胚胎干细胞为样本,进行了基因测序和组装,获得了长度为2.77 Gbp(表示十亿个碱基对)的完整的高质量小鼠参考基因组序列,其中包含215.23 Mbp(表示一百万个碱基对)先前未被鉴定的序列,填补了约7.7%的基因组空白。
俞晓春表示,在这项研究中,团队发现了新的蛋白质编码基因。与先前的参考基因组版本相比,本研究额外注释了639个蛋白质编码基因,其中先前未被发现的全新的蛋白质编码基因有140个。这些新的蛋白质编码基因可能参与多种生物学过程,为未来的研究提供了新的方向。
研究较精确地“看清”了核糖体DNA的基因序列。核糖体是细胞内的“蛋白质工厂”,负责合成蛋白质。核糖体DNA是细胞中的一种特殊DNA,它专门负责编码核糖体的RNA(rRNA)——一种核糖体的重要组成部分,帮助核糖体合成蛋白。用简洁的比拟来说,核糖体DNA给出了细胞内rRNA的“蓝图”。这个发现为进一步解析核糖体潜在的蛋白质翻译功能的差异性提供参考。
此外,研究还解析了着丝粒区域的基因序列详情。本研究的结果显示,小鼠各染色体之间的着丝粒长度具有明显差异,且序列内部富含转座元件和片段重复,同时还有散在的基因分布,表明该区域可能会进行活跃的转录和转座事件,驱动着丝粒区域进行适应性改变等行为。对着丝粒区域的解析,有助于理解因着丝粒功能缺陷导致的染色体重排、非整倍性等相关疾病的发病机制。
西湖实验室助理研究员刘俊丽和李麒麟为论文共同第一作者,俞晓春为通讯作者。(来源:中国科学报 温才妃)
相关论文信息:https://www.science.org/doi/10.1126/science.adq8191