基因组测序>
建库测序>
人类基因组测序>
动植物基因组测序>
微生物基因组测序>
转录调控测序>
表观组测序>
单细胞测序>
空间转录组>
基因分型>
质谱分析>
蛋白组学分析>
代谢组学分析>
免疫定量>
多组学联合分析>
分子育种>
动植物基因组测序>
动植物育种分析>
基因合成>
与参考基因组比对
比对率、覆盖深度、覆盖度分析
样本比对率,指比对到参考基因组上的reads数目除以有效测序数据的reads数据,反映了样本测序数据与参考基因组的相似性。覆盖深度,指比对到参考基因组的碱基总数除以基因组大小;覆盖度,指被测到的该物种基因组的碱基总数占该物种基因组长度的百分比;覆盖深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。SNP和InDel检测及注释
开发SNP和InDel标记
SNP主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,包括单个碱基的转换、颠换等。InDel是指基因组中小片段的插入和缺失。我们采用GATK软件进行样本SNP和InDel的检测,利用ANNOVAR软件对SNP和InDel检测结果进行注释。Category | Number of SNPs | |
Upstream | 203,062 | |
Exonic | Stop gain | 2,142 |
Stop loss | 564 | |
Synonymous | 247,194 | |
Non-synonymous | 167,809 | |
Intronic | 321,306 | |
Splicing | 1,471 | |
Downstream | 189,867 | |
upstream/downstream | 51,199 | |
Intergenic | 986,703 | |
ts | 1,256,052 | |
tv | 915,265 | |
ts/tv | 1.372 | |
Total | 2,171,317 |
Category | Number of Indels | |
Upstream | 51,341 | |
Exonic | Stop gain | 105 |
Stop loss | 36 | |
Frameshift deletion | 2,240 | |
Frameshift insertion | 1,926 | |
Non-frameshift deletion | 3,394 | |
Non-frameshift insertion | 3,250 | |
Intergenic | 47,779 | |
Splicing | 174 | |
Downstream | 38,676 | |
upstream/downstream | 8,584 | |
Intergenic | 299,574 | |
Insertion | 216,190 | |
Deletion | 240,923 | |
Total | 457,113 |
子代SNP和InDel频率差异分析
寻找有显著差异的SNP和InDel位点
1. 子代SNP、InDel频率计算
基于亲本检测结果,筛选出两个亲本间差异且纯合的SNP、InDel位点,作为多态性标记。以某一亲本为参考,分别计算两个子代池在标记位点的SNP-index、InDel-index。完全与参考基因组相同的SNP-index、InDel-index值为0;完全与参考基因组不同的SNP-index、InDel-index值为1。2. 子代SNP、InDel频率差异计算
分别计算两个子代池△(SNP-index )、△ ( InDel-index ) 及合并后的△( All-index ),3. 子代SNP、InDel频率差异分布
采用滑动窗口法,分别统计每个窗口中各标记位点的△(SNP-index)、△(InDel-index)及△(All-index)。以△(All-index)为例,进行1,000次置换检验,选取95%(蓝色)置信水平作为筛选的阈值。图中的黑色折线即为以窗口形式展现的△(All-index)分布,置信水平以上的窗口作为候选区间。目标性状区域定位
找到与目标性状关联的区域
选择95%置信水平下,大于阈值的窗口作为候选区间。为了不忽略掉微效QTL的影响,在全基因组范围内挑选候选SNP和InDel,如果参考亲本和子代表型相同,则挑选子代池中All-index接近0的位点;如果参考亲本和子代表型相反,则挑选子代池中All-index接近1的位点作为候选位点。Category | Number of SNPs | |
Upstream | 28 | |
Exonic | Stop gain | 1 |
Stop loss | 0 | |
Synonymous | 2 | |
Non-synonymous | 4 | |
Intergenic | 27 | |
Splicing | 0 | |
Downstream | 22 | |
upstream/downstream | 2 | |
Intergenc | 160 | |
ts | 192 | |
tv | 131 | |
ts/tv | 1.465 | |
Total | 323 |
Category | Number of Indels | |
Upstream | 5 | |
Exonic | Stop gain | 0 |
Stop loss | 0 | |
Intronic | 4 | |
Splicing | 0 | |
Downstream | 9 | |
upstream/downstream | 0 | |
Intergenic | 59 | |
Insertion | 278 | |
Deletion | 46 | |
Total | 324 |
候选基因提取和功能注释
获得候选基因及基因功能
对于候选的多态性标记位点,提取ANNOVAR的注释结果,优先挑选引起stop loss或stop gain或非同义突变或可变剪接或移码突变的位点所在的基因作为候选基因。Copyright@2011-2024 All Rights Reserved 版权所有:北京诺禾致源科技股份有限公司 京ICP备15007085号-1