20多年前,当科学家首次对人类基因组测序后,人们都惊讶于其中包含的基因太少,甚至不到一些科学家预测数量的1/3。似乎只有不到3万个基因及其编码的蛋白质就足以构建和维持人体运作,而近些年的统计将这一数字将至更低,约为2万个。
但近日一项针对“暗蛋白质组”的新系统分析表明,科学家们漏掉了数千个非传统基因。这些基因隐藏在此前被忽视的基因组片段中,且产生的蛋白质小于平均水平。而这些新发现的基因及其产物可能颠覆人类生物学,并加速医学发现。例如,一个新发现的非传统基因制造的迷你蛋白质,似乎是儿童癌症的关键所在。相关研究近日公布于预印本平台bioRxiv。
该研究领导者之一、美国密歇根大学医学院儿科神经肿瘤学家John Prensner之所以聚焦“暗蛋白质组”并开展深入研究,是因为他太多次在已知基因中搜索与癌症相关的结果,结果都空手而归。
Prensner和同事扩展了基因的标准定义。研究人员通常所说的基因,是DNA序列中具有编码蛋白质潜能的序列,即开放阅读框(ORF)。
经典ORF序列转录产生信使RNA(mRNA),后者进入核糖体,指导氨基酸序列组装成蛋白质。在大多数研究人员看来,如果一个ORF能够产生由100个甚至FC碰碰胡老虎机法典-提高赢钱机率的下注技巧氨基酸合成的蛋白质,那么它就符合被称作基因的条件。此外,经典ORF前端还有一段DNA片段,它吸引了读取基因所需的蛋白质。
但实际上,除了经典ORF外,还有许多非经典ORF广泛分布于整个基因组中。这些非经典ORF与经典ORF相比,由于缺少前端DNA片段因此较短。
非经典ORF序列通常转录产生RNA。这些RNA大多附着在核糖体并被翻译成短氨基酸链或包含不到十几个氨基酸的蛋白质。许多科学家认为由此产生的迷你蛋白并不重要,是“噪声”,很快就会被降解掉。
但大约3年前,Prensner和同事证明癌细胞中含有约550个这种迷你蛋白。而荷兰玛西玛公主儿童肿瘤中心系统生物学家Sebastiaan van Heesch两年前也在心脏组织中发现了类似数量的迷你蛋白质。他们都意识到了这些迷你蛋白并不是可有可无,于是一拍即合,与GENCODE基因注释专家Jonathan Mudge等来自全球20家机构的几十名研究人员组成团队,通过分析梳理其他人的研究,估算究竟有多少非经典ORF存在。结果他们发现,到2022年,科学家已经在人类基因组中追踪到7264个非经典ORF。
为了弄清7264个非经典ORF中有多少能够产生蛋白质,研究团队在PeptideAtlas(肽段)数据库中搜索与这些非经典ORF匹配的迷你蛋白质。分析结果表明,其中1/4能够产生蛋白质,总共产生约3000种蛋白质(一种ORF由于被读写的方式不同会产生不止一种蛋白)。
Prensner和van Heesch已经在追踪他们在黑暗蛋白质组研究中发现的非经典ORF及其产生的迷你蛋白在症细胞是否有重要性。他们在此前发表的一项研究中指出,结果发现尽管迷你蛋白很微小,它们却对髓母细胞瘤的生存至关重要。髓母细胞瘤是一种儿童后颅窝恶性胶质瘤。这些迷你蛋白有望成为生物标志物和药物靶点,发展出新的癌症治疗手段。
相关论文信息:https://doi.org/10.1101/2024.09.09.612016
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:
[email protected]。