MENU

新闻中心

当前位置: 首页» 新闻中心» 科研进展

Nature Genetics | 绕过比对迷宫,基因组所张兴坦团队开发多倍体全基因组关联分析新方法

2026-06-15 10:06:00

【字体:

  

如果把基因组比作一张拼图,那么多倍体则拥有多张高度相似的拼图。

从打散的拼图碎片中找到自己需要的那块,并不是一件容易的事。

传统的方法是将碎片逐个与参考序列进行对比,从而确定每个碎片在拼图上的位置。对于只拥有一张拼图的单倍体,这种方法虽然繁琐,但能成功拼完。然而在面对多倍体时,这套方法显得“力不从心”。

由于多倍体拥有多幅几乎一模一样的拼图,打散后的碎片混在一起,根本分不清哪块来自哪一幅,利用传统方法不仅容易拼错位置,更无法精准统计同一块拼图重复出现的次数,就像是走进了错综复杂的比对“迷宫”,不仅容易出错,还会消耗大量的算力。

面对多倍体分析难题,张兴坦团队决定绕过对比“迷宫”,提出一种不依赖参考序列比对的多倍体GWAS研究新方法,并成功在二倍体水稻、四倍体苜蓿、六倍体甘薯、多倍体栽培甘蔗验证可行。

该研究为多倍体作物精准设计育种提供了强有力工具,将大幅加速优良品种培育进程。



一图读懂


2026年6月12日,中国农科院基因组所(大鹏湾实验室)张兴坦团队在《自然·遗传学(Nature Genetics)》上在线发表题为“A k-mer-based genome-wide association study approach empowering gene mining in polyploids”的研究论文。该研究通过开发多倍体基因组关联分析新方法KMERIA,绕过了传统序列比对和变异检测,直接利用k-mer拷贝数捕捉多倍体剂量效应,攻克了多倍体复杂基因组GWAS难题。该研究不仅为多倍体作物重要农艺性状的深度解析打开了全新大门,也为小麦、甘蔗、甘薯等大宗作物的精准设计育种提供了强有力的底层算法与分子工具。



多倍体作物的“遗传迷雾”

小麦、马铃薯、棉花、甘蔗……这些支撑全球农业的骨干作物绝大多数为多倍体。多倍体赋予了它们更强的生长势、更高的产量以及更强的适应性,但同时也给遗传育种学家出了一道难题。

传统的统计遗传方法(GWAS)依赖于将测序片段与参考基因组进行比对鉴定得到的基因型信息。然而,在多倍体中,同源染色体高度相似,测序短片段常常会比对到多个错位地点,导致变异检测错误百出。“剂量效应”难以捕捉,不同于二倍体的“有或无”,多倍体在同一个等位基因位点可能存在2个、3个或更多个同源拷贝,这种剂量对作物性状影响至关重要,传统方法对此无法准确捕捉。结果是,大量与品质、抗性相关的基因被隐藏在“遗传迷雾”中。


KMERIA:跳过迷宫,直奔终点

KMERIA摒弃了传统基于序列比对的基因型鉴定思路,而是直接从原始测序数据中提取全基因组k-mer,通过“数k-mer”来直接反映等位基因剂量,并进行基因组关联分析(图1)。

第一步:k-mer计数(Counting)。

对所有样本的原始测序数据进行质控和修剪,然后将整个基因组序列打碎成固定长度的序列片段(k-mer),统计每种k-mer出现的频次。

第二步:矩阵构建(Matrix construction)。

将所有个体、所有种类的k-mer频次汇总,构建出一个庞大的k-mer原始丰度矩阵。

第三步:矩阵修剪(Matrix pruning)

对原始丰度矩阵进行测序深度矫正,过滤异常深度的k-mer,剔除低频罕见k-mer,并将其标准化为连续性等位基因剂量矩阵。

第四步:关联测试(K-mer testing)

结合混合线性模型(LMM),将标准化后的k-mer作为基因型分子标记,进行全基因组关联分析(GWAS)。

第五步:定位回归(Post-GWAS)

将通过显著性检验的显著关联的k-mer,在图基因组或线性基因组中确定基因组坐标。

通俗理解为,虽然我们一开始跳过了“迷宫”,但赢得比赛后,我们还得知道奖品在哪。KMERIA把那些“功臣k-mer”在基因组地图中对号入座,找到决定表型差异的基因在基因组的具体位置。

图1 | KMERIA算法思路


破解多倍体复杂基因组遗传分析难题

KMERIA不仅在模拟数据上表现优异,在真实作物群体中也展现出了通用性:

二倍体水稻:成功复现了控制直链淀粉含量的关键基因Waxy,其检测信号尤为显著。

四倍体苜蓿:首次鉴定2个调控苜蓿植株形态的新基因。

四倍体马铃薯:不仅精准定位到成熟期基因,还挖掘出5个与马铃薯果皮颜色与果肉颜色相关的基因位点。

六倍体甘薯:重新鉴定到经典叶形调控基因IbFbox,并锁定新基因IbCUC3。

栽培甘蔗:面对这一传统变异检测完全失效的极端复杂基因组,传统GWAS方法几乎全军覆没,而KMERIA成功定位出多个调控分蘖角度、株高和分蘖数等性状的关键基因。


破解“野生甘蔗迷宫”

为了进一步检验KMERIA在实际育种中的应用潜力,研究团队将KMERIA应用到野生甘蔗-割手密(Saccharum spontaneum,倍性跨度4x-16x),通过KMERIA成功锁定了两大农艺性状的关联基因位点:

KMERIA在割手密6号染色体上检测到一个与蔗糖简纯度强关联的信号,对应镁转运蛋白基因(SsMGT)。研究发现,该基因上游存在一段7.9 kb的大片段结构变异(SV),它抑制了镁离子的转运效率,从而负调控蔗糖的积累。这一发现为高糖甘蔗育种提供了关键分子标记。

另外,KMERIA定位到了调控甘蔗分蘖的核心基因SsNGA5。通过水稻异源过表达验证后,水稻的分蘖数显著下降了30.6%,证实了其生物学功能。此外,还挖掘到SsNAC20、SsARF8、SsLOG、SsSCR等多个分蘖调控新基因。

通过直接将序列特征与等位基因剂量结合,KMERIA让多倍体“丢失的遗传力”有了被重新发现的可能。结合日渐成熟的图泛基因组技术,有望找到那些长期隐藏在非参考基因组区域的复杂变异。多倍体算法工具的不断创新有望加速小麦、甘蔗、马铃薯等多倍体作物分子育种从“经验育种”向“精准设计育种”跨越。


基因组所(大鹏湾实验室)张兴坦研究员为本文通讯作者。基因组所(大鹏湾实验室)博士后陈帅、云南省农科院刘新龙研究员为论文共同第一作者。基因组所(大鹏湾实验室)在读博士生屈伸洋、宋雨函、柴琨,博士后夏中强、李晓锋,云南省农科院张跃彬研究员、刘洪博副研究员,中国热科院王俊刚副研究员,广西大学张木清教授,山东农业大学李宏博教授参与了此项研究。浙江省人民医院陈国波副研究员、瓦赫宁根大学Chris Maliepaard教授对该研究做出了重要指导。

该研究得到国家自然科学基金、广西壮族自治区科技重大专项、中国农业科学院科技创新工程、崖州湾科技创新项目、热带作物育种国家重点实验室等项目的资助。


原文链接:https://www.nature.com/articles/s41588-026-02641-8

TOP TOP