近日,中山大学生命科学学院教授贺雄雷团队基于细胞谱系追踪技术构建的发育细胞谱系树,结合群体遗传学的经典溯祖理论思想,建立了一种估计祖先细胞群体大小的统计方法TarCA,以此来研究胚胎发育过程中细胞群体的动态变化。相关成果发表于《自然-方法学》。
在成熟的多细胞生物体内,具有特定功能的细胞群通常源自于一组祖先细胞。细胞群体的谱系多样性是由这些祖细胞的数量决定的,因此估计祖先细胞群体数量是发育生物学的重要研究问题之一。而传统的研究手段主要依赖于组织特异性的启动子介导报告基因的表达,进而对目标细胞群体进行计数。这一类研究手段的可靠性高度依赖于启动子的选择,其中,启动子的组织特异性与时空表达动态都会使估计结果产生偏差。
估计祖先细胞数目的传统方法与TarCA。受访者供图
研究人员给定一颗包含多种细胞类型的细胞谱系树,它的末端节点代表了被采样的细胞,而中间节点则表示祖先细胞。如果一个中间节点的所有子代细胞均为相同的细胞类型,研究人员将其定义为细胞类型特异的单系分支。随后,他们根据单系分支的大小分布计算出随机两个细胞均来自同一单系分支的概率,而该类型细胞的祖先细胞群体数量即为该概率的倒数。
通过计算机模拟数据,该研究发现,与对单系分支进行直接计数的方法相比,TarCA对采样率要求更低,并且在实验噪音存在时仍能够快速收敛。这是因为在TarCA算法中,子代细胞数量较少的祖先细胞权重较低,从而TarCA能稳定地估计出对子代细胞群体做出主要贡献的祖先细胞数量。研究人员在线虫、果蝇与小鼠的细胞谱系数据中,验证了TarCA在处理真实生物学数据中的可靠性。以小鼠为例,研究人员发现不同组织的祖先细胞群体数量在个体间高度一致。另外,除采样获得的终末细胞类型外,TarCA还能对发育初期的胚胎结构的祖先细胞群体数量进行估计,进一步证明了TarCA的可靠性与泛用性。
?
定义细胞命运分配过程中的LUGs。受访者供图
研究人员还将TarCA拓展至早期细胞命运决定过程的研究中。在细胞命运决定的初期,群体内部仅有小部分驱动基因的表达发生了变化,在全转录组水平依然保持稳定;随着细胞命运决定的进行,细胞群体内逐渐产生全转录组水平的表达差异。如何在基因水平,而非全转录组水平,对基因表达在细胞群体中的异质性进行检测,是研究早期细胞命运决定过程的关键难题。为此,该研究使用TarCA算法对基因表达水平在细胞谱系树上的异质性进行了评估,识别出了表达水平与细胞分裂历史事件偶联的基因(LUGs)。
该研究开发的TarCA算法可对任意细胞群体估计祖先细胞数目,而无需事先获得祖细胞的先验信息,也能推算少数细胞中的驱动基因,以此来预测早期细胞命运的分化倾向。这些发现说明TarCA能促进包括人类在内的所有复杂生物组织的谱系多样性的量化,对其建立定量模型至关重要,可以帮助人们解决个体发育可塑性和衰老相关的组织功能退化的问题。(来源:中国科学报 朱汉斌)
相关论文信息:https://doi.org/10.1038/s41592-024-02189-7