美格生物动植物基因组重测序

2017-08-12

  技术简介

    动植物全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。它可以获取最全的基因组信息,找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDelInsertion/Deletion)、杂合性缺失(LOH)、拷贝数变异(CNV)以及基因组重排导致的结构变异位点(SVStructure   Variation)。根据不同用户需要,通过生物信息手段,分析不同个体基因组间的结构差异,同时完成注释。

    美格动植物全基因组重测序技术应用于种群遗传多态性分析、进化分析、挖掘功能基因、指导育种等众多研究领域。


    技术路线步骤

    1、获得全基因组DNA

    2、随机打断成小片段

    3、末端补平、末端加A'、连接头

    4、生成带接头片段

    5、获得长度合适的目的DNA

    6、PCR扩增

    7、生成DNA-seq文库

    8、QC质控

    9、测序



    数据分析流程:

    1、获得原始测序序列

    2、序列对比

    3、进行覆盖度计算、SNP、Indel,结构变异检测

    4、SNP、Indel,结构变异检测生物信息学注释



    数据分析内容:

    1数据量产出:总碱基数量、Total Mapping ReadsUniquely Mapping Reads统计,测序深度分析

    2一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列

    3SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组信息对检测到的变异进行注释

    4InDel检测及在基因组的分布:在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需要3Paired-End序列的支持

    5Structure Variation检测及在基因组中的分布:目前SBC能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

    案例分享:Nature Genetic: 黄瓜全基因组遗传变异图谱

    研究目的

    揭示黄瓜进化与多样性之谜

    材料方法

    从全世界范围内收集了115个黄瓜品种,对其进行了重测序,测序深度平均为18.3X

    研究结果

    1印度品种表现出了更多的基因多样性;

    2在驯化过程中,果蔬比谷物的基因多样性下降趋势更大;

    3检测到112个候选驯化清除,黄瓜的味苦性状基因Bt上发现了一个长度为442kb富含67个基因的选择性区域;

    4发现西双版纳品种中ore基因的CsaBCH1片段上第257个氨基酸发生了改变,这导致编码β-胡萝卜素羟化酶的基因失效。

    参考文献

    Qi J, Liu X, Shen D, et al. A genomic variation map provides insights into the genetic basis of cucumber domestication and diversity. Nature genetics, 2013.

    返回首页

分享