基因组测序>
建库测序>
人类基因组测序>
动植物基因组测序>
微生物基因组测序>
转录调控测序>
表观组测序>
单细胞测序>
空间转录组>
基因分型>
质谱分析>
蛋白组学分析>
代谢组学分析>
免疫定量>
多组学联合分析>
分子育种>
基因合成>
原则上样本数越多越好,目前GWAS产品建议样本数在200个以上。
1、样本数量:原则上样本数量越多越好,质量性状要求的样本数目小于数量性状,主效基因控制控制的数量性状小于微效基因控制的数量性状。自然群体大小至少200个样品。
2、材料的选取是影响后续分析结果的重要因素,总结文献及项目经验,建议材料选择参考如下原则:
a、原则上样本间不能有明显的亚群分化(例如生殖隔离等)即遗传背景差异小;如果样本间存在亚群分化,则每个亚群建议样本量在200个以上;
b、主要为自然群体,群体来源广泛、遗传多样性丰富:可以根据研究性状需求,在各地 区进行取材,保证群体来源广泛,可在全球范围内收集种质资源,也可在国内各省份收集,详细的采样策略可参考下表。
c、样本数不少于200个:在全基因组关联分析中,原则上样本数目越多越好。参照文献 报道以及项目经验,建议样本数不少于200个。
3、表型性状:目标性状选取建议选择遗传力高的性状。性状的表型记录越清楚越有利于后期的分析,表型的鉴定可参考如下原则:
a、所有个体的性状表型鉴定部位尽量保持一致,如鉴定果实成熟时全部取植株中部果实;
b、尽量使所有个体在同一环境中进行表型鉴定,建议利用多年或者多点进行表型鉴定以 消除环境对表型的影响;
c、表型记录准确;
d、如材料难以满足上述鉴定条件,可以估算个体表型育种值作为表型值;
e、若无法进行多年多点表型鉴定,则需要保证数据一定记录准确和完整。
类别 | 物种 | 样本数 | 采样情况 |
原生动物类 | 疟原虫 | 1,162 |
取自柬埔寨、越南、老挝、泰国、缅甸、孟加拉国、刚果、尼日利亚的13个地区,个体采集后均进行青蒿素处理 |
林木类 | 毛果杨 | 649 |
取自英属哥伦比亚、华盛顿、俄勒冈、加利福尼亚4个地区,1,100个个体,对其中649个个体进行测序,选取测序深度7X以上的544个个体进行分析 |
三角叶杨 | 448 | 取自英属哥伦比亚森林 | |
畜牧类 | 牛 | 234 |
取自荷兰种、德国种以及泽西种牛3个种类关键祖先的后代 |
作物类 | 谷子 | 916 |
812株取自中国北部、西北部、中部及南部,90株取自世界其他地方、14株杂种 |
大豆 | 286 | 取自国内各个省份,随机采样 | |
大豆 | 302 |
选取302株大豆测序(包括栽培种、地方品种和野生种),根据群体分层结果选取139株进行GWAS研究 |
|
高粱 | 971 |
选取971分来自世界各地的高粱,根据群体分层结构选取336份进行GWAS研究 |
建议进行多年多点表型鉴定实验。动植物的表型性状由基因型(G)、环境效应(E)共同作用。即非遗传因素(不同的实验环境)对表型有一定的影响,是需要考虑的。研究者可以基于一定的统计方法来降低这种环境差异对表型造成的影响:
1. 可以将单年的表型数据分别进行分析,最后比较结果并汇总;
2. 将多年多点的表型数据进行育种值计算再进行全基因组关联分析。
建议是单一性状的样本支持数在200个以上,同一个体可对其多个性状进行研究,因此研究多个性状时总样本数不要求是性状数x200。
研究人员对测序深度对GWAS结果的影响进行了评估。结果显示,当测序深度为2X,样品基因分型的检出一致性在90%以上,当测序深度为4X的时,为96%以上,6X时98%以上。此外,当测序深度达到5X时,个体的1X覆盖度达到90%以上,满足后续GWAS的分析需求,而当测序深度达到7X以上,个体1X覆盖度达到95%以上,不进行缺失推断即可满足分析需求。综合考虑项目的成本及结果准确度,建议的测序深度≥5X。
不同性状可在同一个个体上交叉,如以株高和颜色性状划分群体,两个群体间会有重叠的个体存在,不影响分析的结果。
根据文献的报道及在线数据的模拟情况,样本量大时低深度测序即可满足后续分析的需求,但样本量较少时则需要高深度的测序。而测序深度与分析群体大小两个因素都是影响分析结果的因素,当测序深度较低时可以缺失推断,因此两者相比群体大小对分析结果的影响更大。
在全基因组关联分析中,前期对样本的采集情况(表型分布均匀,环境一致)会对后续分析的假阳性结果存在最大的影响,在分析过程中会采用如下方法降低分析结果的假阳性:
1. 结合群体分层信息,利用混合线性模型,对结果进行校正;
2. 必要时还会采取多种线性模型进行分析降低假阳性;
3. 采用Bonferroni校正法来校正GWAS分析中多重假设检验后的P值以降低假阳性的概率。
因此,前期对样品的采集及表型的记录需要准确详细。
根据已有的文献报道,获得与性状关联的候选基因后,常见的验证方法有以下几种:
1. 可同已发表的同一物种或者其他物种的相关性状QTL或者GWAS分析所找到的基因进行
比较,若为其他群体证实的基因,表明可靠程度较高,如水稻、小麦、大豆、白菜、
牛、羊、斑马鱼等分析较多的物种;
2. 若是没有相关的研究成果,可通过家系群体QTL分析或者更大群体的GWAS验证,进一
步验证GWAS所得结果,如水稻、拟南芥、大豆等易获得群体的物种;
3. 结合转录组或者表达谱分析,验证相关区域或者位点调控的通路信息。
Copyright@2011-2025 All Rights Reserved 版权所有:北京诺禾致源科技股份有限公司 京ICP备15007085号-1