诺禾致源

 > 

科技服务

 > 

基因组测序

全基因组关联分析—实现多个目标性状基因高效定位

全基因组关联分析(GWAS)是将群体中个体的变异信息与性状的表型信息结合,以基因(位点)间连锁不平衡(LD)为基础, 将目标性状表型的多样性与基因(位点)的多态性进行统计学关联分析的方法,最终定位目标性状关联的位点和基因,具有“材料来源广、遗传变异多、性状定位全”的优势。 图1 GWAS一次定位多种性状

关联分析方法

  • 1.SNP based GWAS

    基于单核苷酸多态性(single nucleotide polymorphism,SNP)与表型数据关联分析。 图2 SNP-GWAS分析示意图
  • 2.Haplotype based GWAS

    单倍型块( haplotype block )指染色体上存在着的连续的、稳定的、几乎不被重组所打断的单倍型区域。一个单倍型块有几个常见 的单倍型。以单倍型块为基础,进行性状与基因的关联分析。
    图3 Hap-GWAS分析示意图
  • 3.SV based GWAS

    结构变异(Structural Variation ,sv)包括缺失、插入、重复和反转,是基因组变异的主要来源,大量研究已证实SV广泛存在于物 种基因组内,且对表型影响广泛。 图4 SV-GWAS分析示意图
  • 4.K-mer based GWAS

    常规GWAS分析方法是利用测序数据比对参考基因组来完成遗传变异的检测,在基因组组装效果不理想的情况下,可以通过相互比较 来自不同样本的恒定长度k的序列(称为k-mers)集,来识别更广泛的遗传变异类型,如SVs等。 图5 K-mer-GWAS分析示意图

诺禾优势

  • 1.一次实验实现多性状定位

    • 40天

      项目周期
    • GENE

      性状定位
    • 2000

      样品并行分析
  • 2.三代测序提升SV-关联分析

    三代关联分析是利用三代重测序技术获得群体的结构变异信息,筛选与目标性状相关的结构变异。并与二代GWAS分析结果相结合,从而达到更精确的性状关联基因定位效果。
    • 120天+

      项目周期
    • 10 kb起

      测序读长
    • SV-GWAS

      分析内容
  • 3.快速、稳定、高质量测序数据

    全基因组关联分析采用先进的Illumina测序平台,快速、高效地读取高质量的测序数据。 诺禾致源高性能计算平台(High Performance Computing,HPC)采用DELL计算节点和Isilon存储的高效组合,实现快速稳定的测序数 据分析及交付。随着公司业务的发展,高性能计算平台将会持续更新并扩容,以保证高效的数据处理和安全的数据存储。
    • PE150

      测序读长
    • ≥80%

      测序质量Q30
    • 20,280个

      物理核数
    • 1,727T flops

      计算峰值速度
    • 400TB

      总内存
    • 58.6PB

      总存储
  • 4.科学方案设计

    从材料选取,建库测序,到数据分析,每一步都需要科学、缜密的设计,以保障高质量研究成果。

    材料选取

    DNA样品
    二代≥1.0μg
    三代≥10μg

    群体大小
    ≥200个

    二代PE150
    三代Pacbio或Nanopore

    信息分析

  • 5.出色完成每一个项目环节

    至2021年12月,诺禾致源已对畜牧、作物、果蔬、花卉、普通植物、水产等上百个物种进行了关联分析。“科学的方案设计,严格的质控管理,专业的分析团队,丰富的项目经验,优质的项目服务”确保每一个环节都能出色完成,助力科学研究。
    • 50人

      分析团队
    • 10年

      项目经验
    • 800+

      结题项目
    • 1对1

      项目服务

信息分析

全基因组关联分析首先进行群体分层,分析了解材料的分层信息;然后进行连锁不平衡分析,连锁不平衡的水平可决定关联分析的精度、所选标记的数 目;最后结合群体基因型和表型数据,使用基于混合线性模型进行全基因组关联分析,对分析所得的与目标性状强关联的位点进行基因功能注释。
全基因组重测序(三代+二代WGS) 全基因组重测序(WGS) 简化基因组测序(GBS)
1. 已有参考基因组序列的动植物自然群体;
2. 样本间无明显的亚群分化(如生殖隔离等);
3. 所研究表型性状遗传力较强,有多年多点表型记录数据。
≥200个样本(WGS);
挑选至少10个代表性个体做三代
≥200个样本
三代(Pacbio&Nanopore):≥30X
二代(WGS):≥10X
基于SNP:≥10 X/个体
基于CNV:≥30X/个体
10~20W Tags平均8 X/Tag
测序数据质量评估
与参考基因组比对
SNP、CNV、SV检测及注释 SNP、CNV检测及注释 SNP检测及注释
差异SV分析
群体SV分型
构建系统进化树
群体主成分分析
连锁不平衡分析
性状关联分析
目标性状相关区域基因功能注释
构建单体型图谱
构建系统进化树
群体主成分分析
连锁不平衡分析
性状关联分析
目标性状相关区域基因功能注释
构建单体型图谱
构建系统进化树
群体主成分分析
性状关联分析
目标性状相关区域基因功能注

常见问题

  • 1. GWAS所需的最低样本数是多少?

    • 原则上样本数越多越好,目前GWAS产品建议WGS需要200个样本以上,GBS需要300个样本以上,三代技术可酌情降低样本量。
  • 2. 是否需要多年多点的表型鉴定实验消除环境对表型的影响?

    • 建议进行多年多点表型鉴定实验。动植物的表型性状由基因型(G)、环境效应(E)共同作用。即非遗传因素(不同的实验环境) 对表型有一定的影响,是需要考虑的。研究者可以基于一定的统计方法来降低这种环境差异对表型造成的影响:
      (1)可以将单年的表型数据分别进行分析,最后比较结果并汇总;
      (2)将多年多点的表型数据进行育种值计算再进行全基因组关联分析。
  • 3. 不同区域的样本需要人工驯化消除生长背景差异吗?

    • 如果条件允许是建议将不同地域的样本放在同一环境中培育,以消除生长背景的差异造成的假阳性结果。在大样本量的条件下 (e.g. 1000个以上),建议样本分布的区域不多于3个,为了尽量减少环境噪音的影响,不建议跨区域采样。
  • 4. 不同性状可在一个个体上交叉吗?

    • 不同性状可在同一个个体上交叉,如以株高和颜色性状划分群体,两个群体间会有重叠的个体存在,不影响分析的结果。
  • 5. 无参考基因组可以做GWAS吗?

    • 无参考基因组的情况下,可以采用简化基因组测序技术(RAD-seq或GBS),通过聚类检测SNP。聚类检测得到的SNP可以用于全 基因关联分析,但是由于缺乏基因组注释信息,找到关联位点之后无法进一步进行基因注释。
  • 参考文献

    • [1] Aijun Wanga, Yuqi Jianga, Xinyue Shu et al. Genome-wide association study-based identi cation genes in uencing agronomic traits in rice (Oryza sativa L.) [J].Genomics.2021.
      [2] Zhiying Ma, Yan Zhang, Liqiang Wu et al. High-quality genome assembly and resequencing of modern cotton cultivars provide resources for crop improvement[J]. Nature Genetics, 2021.
      [3] Identifying genetic variants underlying phenotypic variation in plants without complete genomes[J]. Nature Genetics.2020.

拓展材料

  • 收藏好文

    多策略GWAS分析,不只有SNP
  • 线上课程

    动植物后基因组时代|结构变异或将超越单核苷酸多态性

更多内容,可扫描侧边栏"一对一业务咨询"二维码添加科研服务经理咨询。

售后服务可联系侧边栏"在线客服"、电话400-6581585,或发送邮件至 services@novogene.com

Copyright@2011-2024 All Rights Reserved    版权所有:北京诺禾致源科技股份有限公司    京ICP备15007085号-1

一对一业务咨询

一对一业务咨询

在线客服

联系方式

联系电话

400-658-1585

企业邮箱

service@novogene.com
返回顶部