咨询电话:021-58952328
Nat. Methods | 高通量成像测序平台Condenseq表征决定核内凝聚体的蛋白序列2025-07-15

分享一篇发表在Nature Methods上的文章,标题为“Characterizing protein sequence determinants of nuclear condensates by high-throughput pooled imaging with CondenSeq”,通讯作者有两位,一位是于基因泰克公司任职的Aviv Regev,她是人类细胞图谱研究最重要的领导者;另一位则是来自Broad研究所的Kalli Kappel,主要研究兴趣在于揭示RNA和蛋白质序列与分子功能的联系。

 

1

 

生物凝聚体是由蛋白质或核酸组装而成的无膜细胞器,具有重要的生理和病理功能。然而,目前对于生物凝聚体的研究主要集中在单个蛋白质或蛋白质家族上,无法确定这些研究揭示的凝聚体序列特征是否具有普适性,现有的研究方法也难以对大量蛋白质序列变体进行统一研究。因此,作者开发了CondenSeq,结合荧光标记合成蛋白质序列的高通量成像(一种原位条形码测序方法)和计算分析来表征数千个蛋白质序列在细胞核中形成凝聚体的倾向。

在CondenSeq分析流程中,作者通过构建蛋白质序列文库与慢病毒侵染,使每个Hela细胞都表达一个GFP荧光标记的蛋白质序列,随后对细胞进行成像,并使用合成原位测序读出细胞表达的特定蛋白质序列的条形码,随后通过自动图像分析提取并量化每个条形码对应细胞中凝聚体的特征。

 

6

 

在进行条件优化以及概念验证后,作者设计了一个包含14,622个合成蛋白质序列的文库,每个序列长66个氨基酸,并将他们分为三组进行检测,使每个CondenSeq样品包含~5000个序列。作者发现,电荷相关参数与凝聚体形成的相关性最强,例如,凝聚体的蛋白质序列往往具有更高的每残基净电荷(mean hydropathy and net charge per residue, NCPR),因此,高正电荷的氨基酸残基促进凝聚。另外,色氨酸对凝聚体形成的促进作用最强。作者还利用机器学习来预测蛋白序列与核仁或染色质的共定位并发现与其他类型凝聚体相比,核仁和染色质凝聚体的形成更依赖高正电荷的K和R残基。

最后,作者利用一种预测蛋白相互作用的计算方法FINCHES来预测蛋白与所有长度超过100个氨基酸的人类内在无序区域(IDR)之间的相互作用,分析同型相互作用和异型相互作用形成凝聚体的趋势。作者发现,同型相互作用主要由低电荷氨基酸和芳香族残基(F/W/Y)驱动,形成单纯相分离凝聚体;异型相互作用主要由 高正电荷残基(R/K)驱动,并促进凝聚体与核仁或染色质的共定位。

总之,作者开发了结合高通量成像与原位测序的CondenSeq技术,可用于蛋白序列与凝聚体形成关系的大规模研究。

本文作者:ZCL

责任编辑:MB

DOI:10.1038/s41592-025-02726-y

原文链接:https://doi.org/10.1038/s41592-025-02726-y