82 / 2026-04-05 23:54:50
基于多组学技术解析蚂蚁染色体特征
蚂蚁,重复序列,A/B区室,染色质环,拓扑关联结构域,着丝粒
摘要待审
率真 石 / 武汉华大生命科学研究院
启业 李 / 武汉华大生命科学研究院

染色体是遗传物质的主要载体。除了基因和顺式作用元件以外,其结构组成还包括相当数量的转座元件和串联重复序列。在果蝇等物种中,大量重复序列在染色体上聚集分布,基因含量相对较少,这样的区域被称为泛着丝粒区域(pericentromeric regions)。其中,真正的着丝粒功能区域被 CENH3 (Centromere-specific Histone H3)组蛋白所标记,该蛋白参与动粒组装,确保分裂过程中染色体的正确分离。近年来,随着长读长测序技术的发展,许多物种的着丝粒序列组成和演化特征得以深入解析。研究显示,尽管着丝粒结构保守,其序列组成在不同物种中高度分化,并呈现出极快的演化速率,这一现象被称为“着丝粒悖论”。



着丝粒不仅反映染色体的演化特征也可能参与调控染色体在细胞核内的空间排布。着丝粒不仅反映染色体的演化特征也可能参与调控染色体在细胞核内的空间排布。在分裂间期,染色质以特定构象折叠于细胞核中,研究普遍认为主要存在两种构象类型:一种是染色体之间相互独立的空间分布,称为染色体疆域(Chromosome Territory)构象,另一种则表现为着丝粒在三维空间上聚集互作,被称为 Rabl 构象。传统基因组学研究主要聚焦一维线性序列特征,对三维结构关注有限。随着 Hi-C 相关技术及其分析方法的日益成熟,染色质三维构象对基因表达调控的重要性逐步显现。A/B 区室(Compartment A/B)代表了染色质在细胞核中的宏观分区,分别对应转录活跃区域和抑制区域;拓扑关联结构域(Topologically associating domain, TAD)作为独立的调控单元,可限制调控元件的作用范围;染色质环(Chromatin Loop)则是远程调控的结构基础。



目前对染色质构象的认知多基于少数后生动物模式物种,而对演化上关键节点或者经历过剧烈染色体重排的非模式物种知之甚少。蚂蚁属于昆虫纲、膜翅目、蚁科,目前已报道物种超过 17000 种,展现出丰富的形态、行为和生态多样性。蚁科在演化历史上经历了大规模的染色体重排,其单倍体染色体数目范围极大(n=1 至 n=60),是目前已知染色体数目变异最为剧烈的昆虫类群之一。因此蚂蚁是染色体演化的理想研究对象,但是在染色体发生大规模重排的背景下,蚂蚁的染色体结构特点目前仍有待解析。



本研究涉及 5 个科共22种蚂蚁,基于高质量基因组(包括 2 个 T2T级别和 20 个染色体级别基因组),结合 Hi-C、ATAC-seq 、H3K4me3 CUT&Tag和H3K27ac CUT&Tag等多组学数据,从重复元件分布、着丝粒序列、三维染色质结构等方面系统解析蚂蚁的染色体演化及其对基因表达调控的影响。主要研究结果如下:



1. 蚂蚁基因组中串联重复序列以卫星串联重复序列和微卫星串联重复序列为主,转座元件主要包括DNA转座子、LTR反转录转座子、LINE转座子、RC/Helitron转座子和未分类转座子,其中DNA转座子数量占据绝对优势,平均占比为75.15%。在各转座子超家族中,DNA/TcMar是最主要的类型,平均占比达到37.2%,未知转座子次之,平均占比达到17.7%;其余转座子类型的占比呈现物种特异性。



2. 蚂蚁染色体中转座重复序列高度聚集分布,形成高密度重复区(High-Density Repeat region, HDR),其余区域称为 LDR(Low-Densit Repeat region, LDR)。相较于低密度重复序列区域(LDR),HDR 基因分布较少,且长度与物种总基因组大小呈强正相关,是蚂蚁染色体的泛着丝粒区域,着丝粒预测区域也与HDR高度重合。



3. 在法老蚁11条染色体中共鉴定出 12 个着丝粒,其中7号染色体包含2个着丝粒,所有着丝粒均位于 HDR 中,进一步说明HDR 是蚂蚁泛着丝粒区域。这些着丝粒序列组成存在显著差异,根据重复序列含量的不同可分为串联重复序列主导型、转座元件主导型和串联重复序列与转座元件共存型三种类型,并且着丝粒串联重复序列和 特定DNA 转座元件高度重叠,除了1号染色体主要由DNA/Mule、DNA/TcMar和DNA/P三种转座元件构成,其他着丝粒串联重复序列均由DNA/TcMar所构成,对着丝粒串联重复序列单体进行构树发现Chr1的着丝粒单体自成一支,其余DNA/TcMar主导的单体自成一个大支系。CENH3 蛋白未显示明显的转座元件序列偏好性;



4. 蚂蚁物种中同时存在染色体疆域和 Rabl 两种染色质构象,且 Rabl 构象物种的染色体间互作主要富集于着丝粒所在的 HDR。



5. 本研究在100kb分辨率西鉴定了A/B区室,发现染色体 A/B 区室与 LDR 和 HDR 高度相关,平均 71% 的 A 区室属于 LDR,91% 的 B 区室属于 HDR ,其中 HDR 区域基因密度显著较低,基因表达水平普遍受到抑制,且染色质可及性较低,与已知的 A/B 区室特征一致。尽管蚁科演化经历了大规模染色体重排,A/B 区室的整体结构仍相对保守。



6. 本研究在50kb分辨率下鉴定了TAD,蚂蚁中存在明显的拓扑关联结构域,相较于LDR,HDR中的TAD数量更少,平均长度更长,LDR的区域调控更加精细。另外,蚂蚁的Hox基因均位于同一个TAD中,表明Hox基因在蚂蚁中结构保守。



7. 本研究在10kb分辨率下鉴定了染色质环,蚂蚁染色质中存在广泛的染色质环结构,在能够达到10kb的6个物种中,染色质环锚定基因的表达显著高于非染色质环锚定基因,在HDR和LDR中都是如此。此外,染色质环锚点基序在 HDR 与 LDR 之间表现出差异:HDR 锚点兼具功能保守性与可塑性,而 LDR 锚点则更为保守,主要富集与发育调控和环境应激响应相关的转录因子。



8. 本研究针对法老蚁补充了 ATAC-seq、H3K4me3 CUT&TAG、H3K27ac CUT&TAG等数据, 法老蚁中启动子-启动子环为主要类型,其锚定基因的表达水平显著高于未被锚定的基因,前者主要富集于蛋白质降解与转运相关基因,后者则多与环境感知、信号传导及代谢产物合成等功能特化的基因相关。此外,相当数量的锚点参与多个环的形成,构成枢纽锚点,相比于非枢纽锚点,枢纽锚点富集更多的管家基因和环锚定蛋白基序,提示其在基础表达调控网络中发挥关键支撑作用。



综上所述,本研究从重复序列分布、着丝粒结构及三维染色质等多角度系统地揭示了蚂蚁染色体的演化特征与调控机制。一定程度上填补了该类群染色体演化相关研究的空白,也为理解着丝粒演化和三维染色质特征及其调控提供了新的见解。

重要日期
  • 会议日期

    04月16日

    2026

    04月19日

    2026

  • 04月06日 2026

    初稿截稿日期

主办单位
西北农林科技大学
西安交通大学
浙江大学
华中农业大学
中国遗传学会三维基因组学专委会
承办单位
西北农林科技大学
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询