久久产久射久精国久品在线看_免费试看30分钟保湿套装_伊犁直飞2025直达入口

 分类: 转录组测序

英文题目:Transcriptome landscape of the developing olive fruit fly embryo delineated by Oxford Nanopore long-read RNA-Seq

中文题目:利用OxfordNanopore长读长RNA-Seq对发育中橄榄果蝇胚胎的转录组学研究

研究背景

橄榄果蝇或橄榄蝇(Bactroceraoleae)是栽培橄榄树主要的害虫,像所有的昆虫一样,橄榄蝇会完全变态。然而,尚未探索早期胚胎发育过程中发生的转录动力学,而在没有完全注释的基因组的情况下进行详细的转录组学分析具有挑战性。收集发育前6个小时每小时的橄榄蝇胚胎进行ONT测序,每个时间点获得3100万reads,与橄榄蝇基因组比对效率在98%,全长覆盖率大于50%,在发育的前六个小时中检测到68%的预测的基因的表达。鉴定了3553个新基因和共79,810个转录本,与NCBI预测的转录组相比,转录组多样性增加了四倍。胚胎发育的前六个小时的特征在于显著的转录组变化,每个胚胎的转录物总数从胚胎发育的第一小时到第二小时降至一半。基于时间共表达的基因聚类,在胚胎发育的前六个小时表达的基因的基因集富集分析显示参与转录和翻译,大分子生物合成和神经发育的基因高度富集。总之,cDNA分子的全长测序详细表征同种型复杂性和B.oleae的第一胚胎阶段的转录动力学。

结果分析

1、目前B.oleae基因组组装和基因组注释

橄榄蝇有六对染色体,其中包括一对异色性染色体,雄性为异性性染色体,最初通过qPCR估计B.oleae基因组大小在322Mb左右。作者之前提交过一版本基因组,该注释包含总共13936个基因和假基因,其中,分别被预测为蛋白质编码13198,非编码392和假基因346。此外,预测2,759个基因具有可变剪接。而基因和转录本的平均长度分别为9,597bp和2,259bp,长的基因为497,921bp,而长的转录本为59,475bp。

2、橄榄蝇的转录组测序鉴定出新的基因和亚型

作者获得了3100万次reads,其中使用Canu对2200万reads(71%)进行了错误纠正,只关注全长reads,通过确定为具有5’引物和poly(A)和3’引物的序列全长序列。ToFU转录组结果包含总共11,883个基因和79,810个亚型(表北京百迈客生物科技有限公司1),其中8330个基因与NCBI注释基因匹配,而3553个基因是新的。所有这些都对应于橄榄蝇转录组在同种型水平上比当前NCBI注释的四倍扩增。针对UniprotSwiss-prot数据库的预测蛋白质序列的搜索显示高比对的是双翅目,其次是哺乳类动物(图1B)。尽管鉴定了3553个新基因,但预计只有269个含有开放阅读框。与注释基因相比,超过50%的新基因是单外显子,其中超过80%的基因是多外显子并且还包含更高百分比的单同种型基因。且新基因的表达量要低于已注释基因。在结构上,SQANTI根据其剪接点和基因组坐标将转录本分为9类,分别为FSM,ISM,NIC,NNC,基因组基因,反义,融合,基因间区和基因内含子(图1E)。

3、RNA-Seq数据的直接标准化优于相对标准化

为了获得转录数,在cDNA合成步骤中以每个时间点使用的每个胚胎数的恒定比率添加ERCC内部加标RNA标准。在测序和比对后,通过2个步骤实现标准化,使用Mandalorion对测序深度进行相对标准化,得到每10000个映射读数的每个基因读数的转录本丰度(RP10K),我们注意到我们的RNA标准品的相对标准化丰度随时间变化,这很可能是由于胚胎中poly(A)RNA含量的变化(图2A)。在第二步中,我们使用ERCC标准生成的标准曲线将我们的相对计数转换为每个胚胎的计数。在这里,我们注意到ERCC标准并没有随着时间点的不同而发生显著的变化(图2B)。有趣的是,与相对表达相反,当所有基因的每个胚胎的转录物的数量相加并在时间点上绘图时(图2C和D),该谱与每个胚胎产生的cDNA相似(补充图4A),因此验证标准化方法。相邻时间点北京百迈客生物科技有限公司显示出比远距离时间点更高的基因表达相关性,其中连续样本的Spearman相关性始终等于或高于0.96。

4、胚胎的总mRNA含量和生物学重复验证绝对定量

通过将每个胚胎的每个基因的所有转录物相加并计算以毫微克计的当量来计算每个胚胎的总mRNA(图3A),总mRNA在1hpo时从1.2ng/胚胎下降至2hpo时为0.61ng/胚胎,然后在3hpo时增加至1.49ng/胚胎,然后在6hpo采样结束时降至0.93ng/胚胎,反映了每个胚胎的总转录本(图2D)。假设2-5%的总RNA是多腺苷酸化的,mRNA水平与我们在每个胚胎中获得的总RNA产量一致。

进一步寻求确定观察到的表达模式是否可以在不同的生物样品组中重复并使用实时定量PCR(qPCR),这是当前用于量化基因表达的标准方法。然而,qPCR基因表达的相对方法需要鉴定内参基因其表达在样品间保持稳定。使用作者的数据来确定这些常见内参基因以及GAPDH的表达水平的变化,评估了3个基因的qPCR表达;SRY,HID和LINGERER,用RPL19和14-3-3zeta作为内参基因,在不同的生物重复样品组中(跳过6小时时间点)。我们观察到类似的基因表达趋势(特别是14-3-3zeta与RPL19相比)。为了进一步探索表达谱,我使用差异表达的明显的基因进行主成分分析(PCA)和层次聚类分析,第一个主成分将前3个时间点与最后3个时间点分开,分层聚类进一步表明前3个和后3个时间点是分别共同聚类的。


5、母体到受精卵转变表明胚胎mRNA含量发生了显着变化

线虫,昆虫,鱼类,两栖动物和哺乳动物在内的许多后生动物的发育胚胎的特征在于显著的转录变化,其中之一是胚胎依赖从母体到受精卵转录物的变化。MZT过程包括两个阶段,首先是在卵子发生过程中清除大部分母本转录本和最初加载到卵母细胞中的蛋白质,然后开始受精卵转录。在黑腹果蝇中,MZT已被广泛研究,胚胎依赖于母体转录本和蛋白质直至受精后2-3小时。然而,在MZT期间,在2hpf结束时,母系编码的蛋白质中有多达20%的母系供应的转录物不稳定,而另外15%的母本转录本通过化学编码的蛋白质3hpf不稳定。黑腹果蝇母系不稳定基因富含细胞周期功能,而母系稳定基因则富含家族保持功能,如代谢,翻译。

使用我们的时间进程数据来阐明MZT在B.oleae中的作用机制,这个过程在我们所知的范围之前还没有被研究过。我们在检测跨时间点的发育过程中每个胚胎的总mRNA含量时发现了一个有趣的现象(图3A),与1hpo时相比,2hpo时每胚胎的总mRNA下降51%,3hpo时相比2hpo时增加143%。实际上,表达基因的数量在1,2和3hpo之间是相似的,使用时间进程的数据,利用GFOLD在连续时间点之间进行差异表达,GFOLD是为没有生物重复的样品设计的,已显示GFOLDlog2倍数变化与qPCR确定的倍数变化相关性较好。使用±0.5的Gfold截止值将基因编码为上调或下调。确定了1496个基因,这些基因在2hpo时比1hpo下调。这些基因富含母体降解的转录物,在此称为母体降解的基因。实际上,在1hpo时,母体降解基因的表达水平高于其他基因的表达水平,与其他基因相比,相同基因在2hpo时表现出相似的表达水平,表明这些基因不稳定至其他基因的基础水平。

我们对3个类别基因集进行富集分析;母体降解基因,受精卵基因和母体稳定/上调基因。母体降解基因也是1hpo中表达高的基因,富含细胞过程,发育和新陈代谢(图6)。母体降解的基因也富含转录因子,例如DREF,BEAF-32A,PNR,它们是相应的果蝇同源基因。类似母体降解基因,母体稳定/上调基因在翻译,生物合成过程,基因表达,代谢过程等方面得到丰富,反映了快速生长胚胎的高代谢活性,DREF转录因子也在这些基因中富集。受精卵基因富含特定的组织形成和发展过程,包括:后肠发育,模式规范,消化道形态发生等功能。

6、基于时间表达动态的基因聚类

基因表达是一个严格调控的过程,在胚胎发育过程中,基因表达的时空动态调控对器官的正常发育至关重要。基于其时间表达动力学的基因聚类不仅将表达基质的复杂性降低为简单的基因集,而且还可以鉴定具有与先前所示相似的生物学功能的基因。实际上,我们鉴定了在不同时间点表达达到峰值的基因,证明了高度动态的转录本动力学,并表明这些基因在确定的发育期间具有特定的作用(图7)。我们进一步将这些集群分为3组;1)基因在3hpo达到峰值并且通常随时间降低,称为早期基因(图7A),2)基因,其表达维持3-5hpo,称为中间基因(图7B和C),和3)基因其表达仅在5和/或6hpo时增加,称为晚期基因(图7D)。富集显示,如先前在母体类别的基因中所观察到的,早期基因和中间基因在细胞过程和代谢过程中富集,而晚期基因在专门的发育过程中富集。

7、长读长RNA-Seq完善了基因在性别决定途径中的注释

双翅目昆虫的性别决定机制在很大程度上是相同的,在果蝇(Drosophilamelanogaster)中,性别决定机制已被广泛研究,性致死基因(sxl)作为主要调节因子,根据性染色体与常染色体的比例,调节本身和变异基因(tra)的性别特异性选择性剪接。tra反过来调节性别特异性双重性别的选择性剪接(dsx),这是级联的最后一个成员和性别差异发育的中介。B.oleae同源物已经鉴定了sx1,tra和dsx。然而,主要的调控方式仍然难以捉摸。已经提出橄榄蝇的性别决定在胚胎发育的前6小时内发生,并且通过类似于黑腹果蝇中的性别决定机制的tra和dsx的可变剪接来调控。在转录组数据中,我们能够观察到tra和dsx的各种可变剪接。使用来自成年雄性和雌性头部的数据来识别性别特异性亚型。在dsx的情况下,与成龄相比,早期发育阶段的亚型复杂性显著不同。在数据中,看到具有不同转录起始位点和长度较长的亚型,因为在发育的早期胚胎阶段存在突出的亚型(图8),成龄头部组织中的这些亚型转移到较短的亚型中,外显子4存在于雌性中但不存在于雄性中。由于我们无法在早期胚胎阶段检测到这些性别特异性亚型,我们认为它们的表达在发育过程后期开始。然而,它们在后期阶段的积累代表了在发育早期阶段激活的性别调控系统。北京百迈客生物科技有限公司。

讨论

由于受精卵的兴趣和令人费解的性质,胚胎发育已在模型生物中广泛研究。然而,在生物中没有很好表征,长读长RNA-seq有可能揭示迄今未知的基因,完善注释信息,并扩展亚型多样性。作者汇集了混合性别橄榄果蝇(Bactroceraoleae)胚胎,这些胚胎在产卵的前6个小时后每小时收集一次。这些时期的研究很有意义,因为之前对B.oleae的研究表明,在此期间开始通过基因的可变剪接介导的性别决定机制。此外,来自地中海实蝇(Ceratitiscapitata)的证据表明,在此期间发生极细胞(原始生殖细胞)的建立,因此,在此期间阐明转录状态非常重要。

作者在转录组中包括雄性和雌性头部以扩展转录组数据。总的来说,我们的转录分析工作提供了丰富的资源来识别早期发育基因和转录异构体以及一系列广泛的可变剪接变体。

最近文章
四子王旗| 堆龙德庆县| 乐清市| 怀来县| 兰州市| 肃北| 永胜县| 工布江达县| 婺源县| 河北省|