染色质可及性是 DNA 的一个基本特性,在基因调控和细胞身份中发挥着关键作用,是指核大分子可以接近 DNA 并与 DNA 相互作用的程度。随着单细胞染色质可及性测序 (scCAS) 技术的快速发展,scCAS 数据中细胞类型注释的重要性不断上升,因为它有可能捕获控制每种细胞类型中基因转录的染色质调控景观。然而,现有的自动注释方法仍然存在很大的局限性,包括注释准确性低、无法整合参考数据的信息以及无法识别新的细胞类型。
近日,Quantitative Biology发表了题为“Accurate cell type annotation for single-cell chromatinaccessibility data via contrastive Learning and Referenceguiding”的方法,该方法是一种基于对比学习框架的参考引导自动注释方法,能够有效识别新颖的细胞类型。细胞类型。通过对多个 scCAS 数据集进行广泛的实验,RAINBOW 在已知和新颖的细胞类型注释方面展示了其优于最先进方法的优越性。
RAINBOW基于对比学习框架构建了自动细胞类型注释模型(图1),该模型侧重于学习同类型细胞之间的共同特征并区分非相似细胞之间的差异,从而增强不同细胞类型的异质性。此外,RAINBOW 将外部参考数据的信息合并为先验知识。此外,通过对未标记数据进行无监督聚类并选择平均熵较高的聚类,RAINBOW 可以有效识别新的细胞类型。全面的基准测试实验表明,RAINBOW 在注释细胞类型方面优于当前领先的方法。此外,RAINBOW 有望揭示细胞的新生物过程和功能。
免责声明:本文由用户上传,如有侵权请联系删除!