MENU

首页

当前位置: 首页» 图片轮播

Nature | 基因组所张兴坦团队破译栽培甘蔗基因组,揭开甘蔗 “甜蜜进化史”

2026-05-28 10:32:00

【字体:

  

甘蔗基因组是植物界最复杂的难题之一,长期以来,被视为作物基因组的“珠穆朗玛峰”。以栽培甘蔗为例,基因组含有10至12套染色体、超过100亿个碱基对,不同来源的染色体之间高度相似,犹如一本“天书”中混入了大量“孪生页面”,如何区分、归纳这些“孪生页面”,成了破题的关键所在。


张兴坦团队长期从事植物复杂基因组的组装算法开发,自主开发了ALLHiC、HapHic等主流基因组组装算法。2018年,他们成功破解了甘蔗野生种“割手密”基因组。


这一次,他们将目光投向了组装难度更高、基因组更复杂的现代栽培甘蔗品种“蔗王”(POJ2878),提出了新的组装策略,不仅破解了栽培甘蔗组装等多倍体基因组分析难题,还为甘薯、苜蓿、油茶等其他多倍体作物的基因组学分析提供了解决方案。


2026年5月27日,中国农科院基因组所(大鹏湾实验室)张兴坦团队联合中国热带农业科学院、云南省农业科学院、福建农林大学、广西大学等10余家单位,在国际顶级学术期刊《自然(Nature)》上发表了题为“Genetic architecture of sugarcane traits in a polyploid genomics framework”的研究论文。该研究针对多倍体基因组分析核心难题,自主开发出成套分析工具,首次成功构建了栽培甘蔗“蔗王”的全染色体完整基因组,并揭示了甘蔗从野生植物驯化为全球最主要产糖作物的遗传密码。该研究不仅为多倍体基因组学分析提供新方法,也为开展高糖含量甘蔗精准育种指明方向。

62eae20581769c8048303eefd7ea1354.png


一图读懂


破解栽培甘蔗组分析难题

现代栽培甘蔗并非来源于单一物种,而是由野生割手密种和早期驯化的热带种经过多轮杂交回交后形成的高度复杂多倍体,其基因组之所以难解,核心在于三道“技术壁垒”:

组装难——多套高度相似的染色体让基因组“拼图”无法唯一确定。

关联分析难——传统GWAS无法处理复等位基因变异和剂量效应。

表达计算难——短读长测序无法准确区分高度相似的等位基因转录本。

针对这三大难题,研究团队逐一开发了专用算法。



C-Phasing:让118条染色体各归其位。

多套高度相似的染色体,就像一堆长得一模一样的“孪生页面”,很难分清彼此。研究团队整合PacBio HiFi、ONT超长读长和Pore-C三代测序技术,开发了C-Phasing单倍型分型算法。该算法利用Pore-C捕获的染色质三维空间接触信息,通过“超分区”策略将118条染色体逐一区分并精确归属到10个同源群。最终完成的甘蔗奠基品种POJ2878基因组组装,连续性指标(contig N50)达到15.60 Mb,交换错误率仅2.02%,折叠错误率仅0.82%,远优于此前发表的所有甘蔗基因组。这一组装如同给甘蔗基因组拍了一张“高清全身照”——每条染色体的来源、结构和重组历史都清晰可见。


KMERIA:给遗传分析装上 “高精度显微镜”。

传统GWAS基于二倍体假设设计,在多倍体中会遗漏大量关联信号。研究团队自主开发了针对多倍体k-mer关联分析工具KMERIA,能够在不依赖预先基因分型的情况下,直接从测序数据中检测与性状关联的遗传变异,同时捕获复等位基因变异和剂量效应。这相当于为多倍体基因组安装了一台“显微镜”,能看到传统方法看不到的遗传细节。


Allele-Express:等位基因专属的“计量杯”。

在多倍体中,不同等位基因的转录本高度相似,短读长RNA测序往往“张冠李戴”。研究团队利用MAS-ISO-seq全长转录组测序技术,结合自主开发的Allele-Express分析流程,实现了多倍体等位基因表达的准确定量,准确率较传统方法提高了36%(R² = 0.95 vs 0.70)。

三大工具环环相扣,构成了一套从基因组组装到关联分析再到表达验证的完整多倍体基因组学分析框架。


甘蔗的“甜蜜进化史”

甘蔗是全球最主要产糖作物,贡献全球约 80% 的食糖。

有了高质量基因组和专用分析工具,研究团队希望回答一个关键问题:甘蔗何以成为"甜蜜之王"?

为此,团队开展了迄今规模最大的甘蔗群体遗传学研究,对来自全球19个主要甘蔗产区的981份甘蔗种质进行重测序,其中包括78份热带种(S. officinarum)、290份野生割手密种(S. spontaneum)和613份杂交栽培品种,系统还原了甘蔗从野生植物到“甜蜜之王”的进化历程。

研究发现,在野生甘蔗的演化中,自然选择留下了大批与抗逆、适应相关的基因,让甘蔗获得更强的抗逆能力,得以从起源地逐步扩展到更广泛的区域。在热带种驯化过程中,甘蔗的遗传轨迹发生转变,一大批与糖分合成、转运、代谢相关的基因被强烈选择,与此同时,开花相关基因受到抑制,让甘蔗“不开花、只长糖”,把更多能量集中用于糖分积累。在后续长期人工改良中,更多控制糖分合成、蔗糖运输、细胞大小与生物量的关键基因被不断富集,这些基因协同作用,让现代甘蔗的产糖能力达到前所未有的水平。



研究还发现,甘蔗的高含糖量不仅由糖分代谢相关基因决定,更藏在它独特的细胞结构之中。甘蔗茎秆内负责储存糖分的薄壁细胞,就像是天然的“糖仓库”,细胞越大,能够储存的蔗糖就越多,含糖量也就越高。团队进一步找到了控制“糖仓库”大小的关键基因,首次在分子层面证实,糖分运输效率越高,储糖细胞就越大,甘蔗也就更甜。



与以往认知不同的是,研究发现,来自野生种割手密的优异单倍型对甘蔗增产增糖有利但并非越多越好,而是存在最佳剂量,也就是说保持亚基因组整体平衡才能实现最优效果。


该研究不仅提出了新的多倍体基因组学分析框架,还首次从细胞与基因个层面完整揭示了甘蔗高糖的细胞学和分子基础,为加快培育高含糖量甘蔗新品种提供了新靶点。


中国热带农业科学院副研究员王俊刚、基因组所(大鹏湾实验室)博士后李晓锋、博士生王毅斌、中国热带农业科学院副研究员林继山、基因组所(大鹏湾实验室)博士后陈帅、云南省农业科学院副研究员刘洪博和基因组所(大鹏湾实验室)毕业生陈晓是论文共同第一作者。广西大学张木清教授、福建农林大学明瑞光教授和基因组所(大鹏湾实验室)张兴坦研究员是论文的共同通讯作者。


该研究得到了国家自然科学基金、中国农业科学院科技创新工程、海南省重大科技计划、热带作物生物育种全国重点实验室创新团队等项目的资助。


原文链接:https://www.nature.com/articles/s41586-026-10576-7


TOP TOP