橘小实蝇(Bactrocera dorsalis)是一种双翅目昆虫,其体型小、端粒和着丝粒结构保守性差、杂合度高,遗传背景复杂,缺乏高质量的参考基因组。以往的方法多基于混样测序后组装,但是这会引入复杂的单倍型差异,导致组装碎片化,或是基于近亲繁殖后再进行研究,这种方法对大多数害虫来说不可行,它们难以多代繁殖,且容易发展出高遗传异质性、纯合致死率高,频繁近亲繁殖后某些野生型表型会丧失。橘小实蝇是水果和蔬菜生产中的主要害虫,迫切需要完整高质量基因组结果来指导新型害虫防治技术的开发。
2025年12月,中国农业科学院深圳农业基因组研究所王桂荣研究员和崔鹏研究员,发表了橘小实蝇的基因组组装结果。该研究在单体雄虫的基础上,成功组装出了接近600Mb、着丝粒和端粒区域较为完整、并包含性染色体的T2T级别基因组,揭示了性染色体演化的复杂历史和嗅觉受体基因家族扩张的秘密,为害虫绿色防控提供了宝贵的遗传资源。该成果发表在期刊Nature Communications上,文章题目“Telomere-to-telomere genome assembly of the Dipteran Bactrocera dorsalis from a single individual”。诺禾致源为本研究提供了相关建库测序服务。
主要结论
1.基因组组装与注释
利用PacBio HiFi reads (~32×)、ONT超长N50 59Kb reads(~159×)和Hi-C reads(~56×)进行橘小实蝇T2T基因组的组装。最终基因组大小为596.16Mb,包括5条常染色体和XY性染色体,组装contig N50为98.67 Mb,GC含量为36.34%,BUSCO值为99.57%。基因组共注释到15574个基因,重复序列占基因组的 56.69%。

图1 橘小实蝇的基因组组装
2.基因组结构特征-端粒、着丝粒结构和NUMT分析
双翅目物种在端粒和着丝粒序列上表现出高度多样性,本研究组装了5个常染色体+X染色体的无间隙着丝粒,其具有结构完整性,鉴定出BdoSat1、BdoSat2和BdoSat3三种着丝粒卫星DNA,共计42.98Mb。BdoSat1和BdoSat2均独特存在于常染色体中,而BdoSat3主要存在于性染色体上。
与果蝇中复杂的端粒结构不同,橘小实蝇常染色体末端有一个528bp的重复单位,而在性染色体中缺失,在性染色体中,许多串联重复的rDNA序列集中在末端,在某种程度上类似于端粒在保护染色体末端和防止基因组降解中的作用。
NUMT是广泛存在于真核生物中的线粒体DNA片段插入到核基因组中的现象,本研究共识别出105个NUMT位点,这些位点可进一步聚类为11个共线性区域,主要位于2号染色体和X染色体上,11个NUMTs中线粒体基因区域的表达水平极低。

图2 核DNA序列中的NUMTs
3.性染色体特征
X染色体长度为67.73 Mb,Y染色体长度为7.17 Mb,X染色体上共标记了578个基因,Y染色体上标记了52个基因。共识别出5523个与性别相关的DEGs,其中在外生殖器表达差异最大。基因集富集分析显示雄性特异性基因在与能量产生相关的通路中显著富集。研究首次在Y染色体上鉴定到一个在雄虫全组织表达的ATP合成酶β亚基基因,推测与雄虫生命活动的高能需求相关。
通过与22个双翅目昆虫染色体水平的组装进行比较基因组分析发现,X染色体起源多样,证明双翅目经历了独立的性染色体转变。

图3 X和Y染色体的结构及基因特征
4.功能基因组学-气味受体基因
该研究在橘小实蝇中发现了110个候选气味受体基因,其中超过50%的气味受体基因表现出串联复制(2-10个)。发现了一个包含三个串联拷贝的OR88a基因簇。通过CRISPR/Cas9敲除实验证实,BdorOR88a对雄性实蝇识别强效引诱剂甲基丁香酚(ME)至关重要。敲除该基因后,雄虫对ME的趋向性显著降低。
如今,诺禾致源已经全新推出PacBio三代超微量建库测序技术,基于Revio平台SPRQ试剂,起始量低至20ng,难以利用单只昆虫进行测序的壁垒已经打破,真正让超微量样本也能实现 “高质量测序自由”!
诺禾致源PacBio Revio平台的HiFi产品具有高产出(SPRQ试剂单Cell 最高172Gb)、高准确率(Q30+)的优点,Nanopore PromethION平台的100K /200K Ultra Long ONT产品具有长读长,Reads N50高(可达200K)的优点,为T2T基因组、Perfect T2T基因组产品提供了有力的支撑。在动植物基因组组装上具有丰富的经验,已完成T2T水平组装的物种囊括动物(代表物种-猪-2.6Gb),植物(代表物种-辣椒-3.1Gb),昆虫(代表物种-蝴蝶-约1Gb),水产(代表物种-某鱼-1Gb),真菌(代表物种-银耳-30Mb单倍型)等50余个物种,样本数150+。
Perfect T2T基因组:所有染色体均组装出完整的端粒到端粒序列,具有较高的准确度(QV)及完整度(BUSCO),并且无结构性拼接错误。
T2T基因组:部分染色体组装出完整的端粒到端粒序列,具有较高的准确度(QV)及完整度(BUSCO),并且无结构性拼接错误。

诺禾致源致力于三代基因组相关研究,在T2T(完美基因组)、图形泛基因、超大基因组及基因组多组学等经典领域均发表了高分文章,拥有专利授权18项、软件著作权40余项,在国际期刊合作发表署名论文140余篇,累计影响因子超过1400+,完成1000+物种的基因组图谱构建,为您提供专业、全面的测序及技术支持。
参考文献:
[1] Liu W, Lin Q, Wang Q, Liu W, Jia J, Zhang J, Yang L, Lu Y, Cui P, Wang G. Telomere-to-telomere genome assembly of the Dipteran Bactrocera dorsalis from a single individual. Nat Commun. 2025 Dec 3;16(1):10861. doi: 10.1038/s41467-025-65870-1.
Copyright@2011-2025 All Rights Reserved 版权所有:北京诺禾致源科技股份有限公司 京ICP备15007085号-1