目前为止,O-GlcNAc 是唯一一种已知的修饰核蛋白的糖基化形式,被修饰的核蛋白包括 RNA 聚合酶 Ⅱ 和许多转录因子。但是 O-GlcNAc 修饰在哺乳动物染色质中的调控功能仍不清楚。为了解析糖基化对哺乳动物染色质功能的影响,首先需要确定 O-GlcNAc 修饰蛋白在基因组上的分布。本文中作者将 O-GlcNAc 修饰蛋白的全基因组分析、细胞内 O-GlcNAc 糖基化水平调控、RNA 聚合酶 Ⅱ 降解等技术相结合,发现 O-GlcNAc 修饰蛋白在异染色质区域和活跃转录因子启动子上分布的密度较高,与 RNA 聚合酶 Ⅱ 结合区域有高度重叠。同时,OGT 敲低实验的结果表明 O-GlcNAc 修饰对细胞基因转录总体呈现正向促进作用;RNA 聚合酶 Ⅱ 降解实验还发现 RNA 聚合酶 Ⅱ 降解会导致编码转录因子和 DNA 修饰酶的启动子处的 O-GlcNAc 修饰水平下降,以及编码转录机制的一组启动子处的 O-GlcNAc 修饰水平增加。
首先,作者通过改进的 CUT&RUN 技术,使用泛 O-GlcNAc 单克隆抗体 HGAC85 在小鼠胚胎干细胞(ESCs)中确定了 O-GlcNAc 修饰蛋白在基因组上的分布位置。CUT&RUN 分析显示 O-GlcNAc 修饰蛋白主要定位在活跃启动子和异染色质区域。接下来,作者使用在相同条件下生长的野生型(WT)ESCs 的 RNA-seq 数据,评估了启动子处的 O-GlcNAc 信号与其表达水平之间的相关性,结果表明 O-GlcNAc 修饰蛋白占据的启动子平均表达量高于缺乏 O-GlcNAc 修饰蛋白的启动子。为了识别候选蛋白并表征 O-GlcNAc 峰的局部蛋白质环境,我们通过计算方法筛选了合并的 O-GlcNAc 重复样本与 ChIP-Atlas 数据库中的 21,205 个 ChIP-seq 峰数据集在启动子区域的共定位峰。在与 O-GlcNAc 峰重叠的染色质结合蛋白中,许多先前已经被报道过具有 O-GlcNAc 修饰,例如 TET1 和 TET2。值得注意的是,超过 70% 的 O-GlcNAc 信号与 RNA 聚合酶 II 结合位点重叠。因此,作者检查了所有基因启动子处 O-GlcNAc 修饰蛋白和 RNA 聚合酶 II 占据的密度。图 1E 显示了 RNA 聚合酶 II 与 O-GlcNAc 占据位点之间存在强烈的关联,几乎每个位点的 O-GlcNAc 信号都较窄。这种基因组上的 O-GlcNAc 谱图可能由 RNA 聚合酶 II 自身糖基化或者转录机器中其他 O-GlcNAc 修饰成分贡献。几种与 O-GlcNAc 共占据率较高的蛋白质在功能上都与 RNA 聚合酶 II 相关,并参与转录起始过程。总的来说,基因组分析表明,除了异染色质外,在一系列转录活跃的基因启动子上发现了高密度的 O-GlcNAc 修饰蛋白,并与 RNA 聚合酶 II 和一些特定的相关因子共定位。

在观察到 RNA 聚合酶 II 和 O-GlcNAc 修饰蛋白在基因启动子上的高相关性后,作者评估了 O-GlcNAc 修饰调节其表达的程度。为了干扰 O-GlcNAc 糖基化,作者通过瞬转 siRNA 敲低了细胞中的 OGT。敲低后的差异基因表达分析确定了 836 个下调和 592 个上调的基因(图 2B),其中,有 31 个下调和 2 个上调的基因与野生型细胞中的 O-GlcNAc 峰重叠,表明糖基化在增强其表达方面起着直接作用(图 2C)。基因集富集分析(GSEA)显示,差异表达基因中富含“RNA 聚合酶 II 特异性 DNA 结合转录因子(TFs)”的编码基因(图 2D)。这一类基因中,无论是上调还是下调的基因都各不相同。值得注意的是,只有下调的 RNA 聚合酶 II 特异性 TFs 有一部分基因在其启动子区域有 O-糖基化修饰,这表明其他该类 TFs 的上调可能是由间接的次级效应引起的。总体而言,O-GlcNAc 修饰增强了编码 TFs 的一小部分基因启动子的转录。下调的 O-GlcNAc 修饰启动子还包括参与转录共调控和解旋酶活性的基因,这表明 O-GlcNAc 修饰对于维持活跃转录相关基因的表达是必要的。其他下调的直接靶标包括编码 DNA 核酸酶和内切核酸酶的基因。

接下来,作者研究了 O-GlcNAc 修饰是否影响 RNA 聚合酶 II 的亚核分布。作者使用受激发射损耗(STED)显微镜技术,对通过酶法去除了细胞核 O-GlcNAc 修饰的 ESCs 细胞本身以及 ESCs 分化为神经前体细胞(NPCs)的过程进行了内源性 RNA 聚合酶 II 簇成像。pan-O-GlcNAc ChIP-seq 实验显示,细胞分化对 O-GlcNAc 修饰蛋白的整体基因组分布影响微乎其微。为了细化对 O-GlcNAc 的调控,作者通过在 ESCs 中表达核定位序列(NLS)修饰的细菌 O-GlcNAc 水解酶 BtGH84(图 3A)构建了快速 O-GlcNAc 调节方法,并估计了 BtGH84-NLS 表达后 RNA 聚合酶 II 上 O-GlcNAc 修饰去除的速率(图 3D,E)。数据显示,在 BtGH84-NLS 表达 24 小时后,RNA 聚合酶 II 的 O-GlcNAc 修饰降低至检测限以下。在验证了BtGH84-NLS 酶扰动方法对 RNA 聚合酶 II 的作用后,作者对去除了核蛋白上的 O-GlcNAc 修饰后的 RNA 聚合酶 II 簇进行了超分辨率成像(图 3F)。虽然在 ESCs 中,BtGH84-NLS 的表达对 RNA 聚合酶 II 簇的荧光强度没有明显影响,但在分化为 NPCs 后,观察到信号强度显著增加(图 3G),说明核内低 O-GlcNAc 修饰水平导致每个 RNA 聚合酶 II 簇在分化为 NPCs 后簇内的蛋白数量增加,作者推断这可能是低 O-GlcNAc 水平和染色质重塑的共同作用。

作者还通过之前建立的人类 DLD-1 结直肠癌细胞中的 RNA 聚合酶 II 降解系统探究了 RNA Pol II 糖基化对 pan-O-GlcNAc CUT&RUN 信号的贡献程度。2,834 个 DLD-1 ChIP-Atlas 数据集的比对结果表明 RNA 聚合酶 II 是与 O-GlcNAc(图 4B)基因组重叠最大的转录因子。在 DLD-1 细胞中,O-GlcNAc 信号与 RNA 聚合酶 II 在所有启动子上的占据情况之间的整体相关性比在 ESCs 中更为明显(图 4C)。RNA 聚合酶 II 的降解导致 O-GlcNAc 信号在转录起始位点周围发生轻微的整体重新分布(图 4C)。进一步对 O-GlcNAc 信号进行聚类分析,了五个不同的位点组(总计 6544 个位点)(图 4D,E)。簇 1、2、3(分别为 284、584 和 1490 个峰)在 O-GlcNAc 占据率上没有显著变化,因此它们的 O-GlcNAc 信号与 RNA 聚合酶 II 的存在无关。簇 2 中的基因编码参与组蛋白甲基化和转录共激活活性的蛋白质(图 4F)。由簇 5 (2986 个峰)组成的启动子集合在 RNA 聚合酶 II 降解后失去 O-GlcNAc 修饰,因此结合蛋白的 O-GlcNAc 修饰依赖于 RNA 聚合酶 II 或 RNA 聚合酶 II 本身是 O-GlcNAc 信号的主要贡献者。GSEA 的第 5 簇鉴定出许多与转录起始相关的基因,包括 Gtf2e1、Taf6、Snapc2、Taf5、Taf12、Taf11、Taf8 和 Taf1。出乎意料的是,这一分析还发现了一组启动子,在 RNA 聚合酶 II 缺失时其 O-GlcNAc 水平增加(第 4 簇;1200 个峰)。这些启动子编码与 RNA 聚合酶 II 活性特异性相关的蛋白质,如 Prim1、Polr3c、Polr1a、Polr3g 和 Polr1d(图 4F)。其对应新合成 RNA 的产量在快速降解 RNA 聚合酶 II 后显著下降。O-GlcNAc 的增加可能反映了这些启动子在 RNA 聚合酶 II 缺失时招募了 O-GlcNAc 修饰的蛋白质,或者已经结合的蛋白质具有更多 O-GlcNAc 修饰。例如 NELFE 和 INTS3,它们在 RNA 聚合酶 II 缺失的细胞中显示出与 O-GlcNAc 的重叠增加(图 4B,分别增加了 1.8 倍和 6.3 倍)。总之,这些数据表明,RNA Pol II 的下调导致数千个启动子处的 O-GlcNAc 水平发生变化,揭示了局部糖基化依赖于 RNA Pol II 或转录过程。

综上所述,作者的功能基因组方法确定了 O-GlcNAc 修饰蛋白在哺乳动物细胞染色质基因组中的分布,并揭示了 O-GlcNAc 和 RNA Pol II 之间的条件依赖性的相互作用。
原文链接:
https://doi.org/10.1186/s13059-025-03537-2