三代测序仪以其超长读长的优势,在基因组组装中备受青睐,目前广泛应用的是PacBio三代单分子荧光测序和Nanopore三代单分子纳米孔测序,因Nanopore测序读长更长且通量高的特点,近几年在基因组组装应用中崭露头角,先后在Nature Biotechnology上发表了人的基因组、Plant cell上发表了野生番茄基因组、Nature Genetics上发表了高粱基因组等等,测序技术已相当成熟。
ONT测序结果展示
作物类(部分)
林木类(部分)
动物(部分)
水产(部分)
中药材(部分)
注:Species:分析的物种信息;SeqNum:各个长度范围内序列的数目;SumBase:指各个长度范围内序列的总长度;N50Len:reads N50长度;N90Len:readsN90长度;MeanLen:平均reads长度;MaxLen:最长reads长度;MeanQual:质量值。
以上是总结的部分作物类、林木类、动物、水产和中药材的下机数据结果展示,从以上的数据不难看出,平均raeds长度几乎均在20Kb以上,最长reads高达1.6Mb以上(不同样品DNA抽提难易程度不同,会造成一定的影响)。
基因组组装结果展示
上表中最后一列MeanQual就是下机数据的质量值,与碱基准确度的换算公式为:准确度 = 1-10^(-Q/10),经计算? Nanopore下机数据单碱基的平均准确率约为86%左右,这样经过校正的数据再用Canu、SMARTdenovo、WTDBG等软件进行基因组的组装,再经过二代数据的polish之后,碱基的准确度可达到99.99%以上呢!
废话少说,直接上组装结果!
植物(部分)
动物(部分)

注:Species:分析的物种信息;CtgNum:contig数目;CtgLen:contig总长度;CtgN50:contigN50长度;CtgN90:contigN90长度;CtgMax:最长contig长度;GC(%):GC含量占比。
注:物种:分析的物种信息;Complete BUSCOs:找到完整基因数;Complete and single-copy BUSCOs:其中单拷贝基因数;Complete and duplicated BUSCOs:多拷贝基因数;Fragmented BUSCOs:预测不完整基因数;Missing BUSCOs:没有预测出来的基因数。
评估结果显示基因完整度均在90%以上!!说明Nanopore数据的组装连续性和完整性都是非常好的,是值得广大科研工作者信赖的哦!
百迈客ONT平台发展历程
?

推荐文章