空间蛋白质组学:构建复杂组织的尺度图谱

编辑丨toileter当人类前行至远方,我们以自己的脚步衡量出道路,以道路为丝线绘制出这片大地的地图。 而现在,我们将目光望进自己的体内,意图探索生物系统的交错复杂。 与此,空间蛋白质组学为我们带来了更清晰的笔迹,使得人类在对抗疾病的道路上得以踏上更便捷的道路。

图片

编辑丨toileter

当人类前行至远方,我们以自己的脚步衡量出道路,以道路为丝线绘制出这片大地的地图。而现在,我们将目光望进自己的体内,意图探索生物系统的交错复杂。与此,空间蛋白质组学为我们带来了更清晰的笔迹,使得人类在对抗疾病的道路上得以踏上更便捷的道路。

空间蛋白质组学,涵盖了广泛的基于免疫组织化学的方法,包括但不限于循环免疫荧光 (cycIF)、索引共检测 (CODEX)、迭代漂白扩展多重性 (IBEX)、多重离子束成像 (MIBI) 和成像质谱流式细胞术 (IMC)。这些方法可用于生成标本(如组织和器官切片)的高度多路复用图像,以了解其蛋白质组成和空间组织,是许多全球图谱项目的基础。

除此之外,在深度视觉蛋白质组学 (DVP) 这项技术中,复杂样品被激光解剖,单个解离的细胞通过质谱法进行分析,从而保留其空间背景信息以创建空间蛋白质图谱。该技术的一个主要优点是它不受可用抗体数量的限制,因此实现了更大的蛋白质组覆盖率。

质量控制CyLinter

为了防止在组织切片出现伪影的情况下造成单细胞分析方法失败,CyLinter 被设计开发出来作为 Napari 多通道图像查看器的插件。CyLinter 由一组用  Python 编程语言编写的质量控制(QC)软件模块组成,这些模块以灵活的方式处理图像和相应的单元数据,其中模块可以迭代运行,同时为模块内部和模块之间的进度添加标签。

CyLinter 将四个文件作为每个组织标本的输入:拼接和配准的多路复用图像(TIFF/OME-TIF)、由分割算法生成的细胞识别掩码、显示分割细胞之间边界的二进制图像以及空间特征表,以逗号分隔值(CSV)格式表示,包括每个分割单元的位置和计算的信号强度。

CyLinter 与组成它的 metaQC 模块一样,它的聚类模块允许其用户在执行 UMAP(24)或 t 分布随机邻域嵌入(t-SNE)数据降维和 HDBSCAN 基于密度的聚类任务时,可以识别出高维特征空间中的离散细胞群;而 clustermap 模块则负责生成每个簇的蛋白表达谱。

图片

图 1:使用 CyLinter 清理数据集

这些 QC 步骤允许用户对隐去或者保留结果数据应用一系列客观标准,并生成检查以修改先前数据的过滤模块输出。在结束流程后,CyLinter 会输出一个经过编辑的空间特征表,用以表示多个样品的数据详情与 QC 报告。以此来实现分析的可重复性与透明度。

CyLinter 网站:https://labsyspharm.github.io/cylinter/

基因特异性推断CalicoST

肿瘤会通过捕获人体体细胞突变而进化,包括核苷酸、CNA 与大规模结构变异。尽管体细胞的突变发生在 DNA 中并且没有通过 SRT 直接测量,但大 CNA 会在基因表达中留下特征。为了更好地追踪这种痕迹,CalicoST 应运而生。

CalicoST 从肿瘤的一个或者多个 SRT 样本中推断等位基因特异性 CNA 和肿瘤进化的系统重建。通过识别每个癌症克隆转录区域的基因特异性整数拷贝数,揭示对总拷贝数上不可见的事件。之后它会为每一个点位分配一个克隆标签,指示该点位的拷贝数配置文件。之后,它将其与已识别的拷贝数谱对比,以进行结合体细胞进化和克隆空间传播的系统地理学的迭代发育。

在非单细胞分辨率的 SRT 技术中,CalicoST 可以推断与建模正常细胞与癌细胞的混合物,以此更加准确的判断基因特异性拷贝数与癌细胞繁殖数量。其输入的空间坐标矩阵支持它同时处理来自同一个肿瘤的多个区域或者对其切片。

图片

图 2:CalicoST 从来自同一个患者的样本中推断基因特异性拷贝数与肿瘤

CalicoST 识别通常难以推断出肿瘤的倍性扩大化,尤其是仅针对于推断总拷贝数的变化。在某些转录计数与拷贝数中性区域没有实质性差异的情况下,会导致CalicoST 错过许多拷贝数。

CalicoST 代码:https://github.com/raphael-group/CalicoST/

技术发展前景

高度多路复用图像中通常存在的伪影,比如标本本身存在的伪影,或者染色过程中与图像采集过程中存在的伪影,亦或是最终处理出现的伪影,都会对单细胞分析造成巨大影响。第一类本身自带的通常无可避免,后两者虽然可以最小化,但无法通过良好的实验完全消除。

伪影生成的伪集群可以借由 CyLinter 来删除。不过,清晰可见的编辑特征分析通常建立在大量数据采集上。CyLinter 旨在利用高度多重组织图像 QC ,加速和系统化人类视觉审查,使其与多种组织类型兼容。解放了人工审查的同时,其获得了大量用于训练自己的数据。

人工检查员也可以以此来纠正人工审查的错误,并将有效结果传递至未来将会登场的云平台上,以此来放开对功率与运行负荷的限制。

CalicoST 需要足够多的杂合 SNP 覆盖率以获得信息丰富的 BAF 值,而基于探针的技术不对 SNP 进行测序。此外,单个基因的畸变无法与差异表达明显区分出来,这就导致畸变斑点数量会出现异常。除此之外,基因的高变异性与CalicoST 对样本数量的要求导致难以推断高拷贝扩充的准确数字。

在此基础上,需要进一步迭代其基础架构与 GPU 性能,改进其选择克隆的模型标准,与其他空间测量相结合,把后台存储库搭建在云台上,以最广阔的网络数据来支撑起复杂多变的实际变异模型。在后续的未来中,CalicoST 野火通过对表征耐药克隆与药物敏感克隆的细微差异上,以全新的角度来研究耐药性。

结语

空间蛋白质组学的未来非常出色,而应用在其上的这些全新技术将会在人类对抗畸变肿瘤的路上留下一盏盏指引路线的明灯。更好的显微镜,更全面的数据库,更清晰的分析结果,这些技术改进引领我们在这条道路上走得更远,我们将会更加深入的了解到人体更深处的奥秘。

再次感谢在科技前沿努力的工作者,也恭喜空间蛋白质组学荣获nature 2024年度方法。

原文链接:https://www.nature.com/articles/s41592-024-02565-3

相关资讯

仅总参数量0.1%、单GPU 15分钟完成微调,人类基因组基础模型NT登Nature子刊

编辑 | 萝卜皮从 DNA 序列预测分子表型仍然是基因组学中的一个长期挑战,通常是由于注释数据有限以及无法在任务之间转移学习所致。 在这里,英国伦敦 InstaDeep 的研究人员提出了在 DNA 序列上进行预训练的基础模型,称为 Nucleotide Transformer;其参数范围从 5000 万到 25 亿,并整合了来自 3,202 个人类基因组和 850 个不同物种基因组的信息。 这些 Transformer 模型可生成特定上下文的核苷酸序列表示,即使在低数据环境下也能实现准确预测。

ScienceAl 2024「AI+药物&医疗&基因组&细胞」专题年度回顾

编辑 | 白菜叶2024 年,药物、医疗、基因组学和细胞生物学领域迎来了前所未有的技术突破与创新。 从 AI 驱动的药物设计到基因编辑的精准控制,从单细胞分析到多模态医疗决策,这一年见证了科学与技术的深度融合,为人类健康带来了无限可能。 在药物研发领域,AI 驱动的分子设计与优化方法不断涌现,显著提升了新药发现的效率与精准度。

抗体亲和力增强17倍,百奥几何、复旦团队AI方法模拟细微蛋白质互作,登Nature子刊

编辑 | 萝卜皮提高抗体与其靶抗原的结合亲和力是抗体疗法开发中的关键任务。复旦大学与百奥几何(BioGeometry)团队联合推出了一种可预训练的几何图神经网络 GearBind,展示了其在抗体亲和力成熟中的潜力。通过多关系图构建、几何消息传递和大规模未标记蛋白质数据的预训练,GearBind 在多个测试集上的表现优于现有方法。研究人员基于 GearBind 推导出一个强大的集成模型,成功用于增强两种不同抗体的结合能力,实验数据显示设计的抗体突变体显著提升了性能。该研究以「Pretrainable geometri