抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

有的时候存在这种情况:我手上有两个近缘植物的基因组测序数据,这两个物种可能没有人做过,或者别人做过但是没有提供参考基因组。而课题组因为经费不足,只测了一个物种的Hi-C(嗯,说的就是我),那如何以组装的基因组为参考,把另一个近缘物种基因组也组装到染色体级别呢?

记录一下基于近缘物种参考基因组的染色体水平组装和注释,用到的软件是RagTag以及配套的Liftoff

基因组注释(4)——基因预测这篇博客中记录了怎么用braker3进行蛋白编码基因的预测,当时为了方便安装和使用,直接下载了官方的singularity容器。用过braker3的朋友会发现,官方给的BRAKER标准运行流程中是不包括UTR区域预测的,也就是说,最后得到的gtf/gff文件中没有3’或者5’UTR区域的信息。

前排提示,以下操作是个人尝试,不保证一定正确。

串联重复序列注释这篇笔记里记录了如何用TRF软件进行TR预测,这款软件可以使用-m参数得到屏蔽后的序列,当时没写如何把Hard masking结果转换成Soft masking,这里就补个档。这两种屏蔽方式的结果文件是可以相互转换的。

这一篇笔记主要记录下ES6版本的Javascript的入门学习笔记,只记录了自己了解的基础知识,实际用这门语言的时候还是要多查阅文档。

前一篇笔记介绍了HTML的基础,这一篇主要记录下CSS的基础知识。

不知不觉用Hexo建站也快一年半了,以前下载安装Node.js、搭建Hexo博客和使用volantis主题,以及到最后部署到服务器上,这一系列流程都是跟着教程和volantis的中文社区操作,因为自己是纯小白,属于两眼一抹黑干就完事了的那种。遇到bug也是各种百度谷歌,别人咋改文件自己跟着改,也完全不懂其中原理。

整理笔记的时候翻到两年前做的R入门笔记,还记得21年冬天那个时候是第一次接触R,华中农业大学的孔秋生教授来塔里木大学做的R语言讲座。两年了有些东西过时了,整理下做个备份吧~顺便回头复习复习,温故而知新 ^_^

前面说了如何用eggNOG-mapper快速注释功能基因,我们最后得到了很多结果文件,其中最重要的是两个annotations文件。这里主要讲一下怎么整理结果文件,并且对注释的结果做质量评估。

继续更新一下基因组注释,在基因组注释的第5篇博客中,我们已经拿到了Braker3预测的功能基因,并且删除了其中可能被TE插入而失去功能的基因。仅仅拿到这些基因CDS序列和蛋白序列肯定是不够的,我们还需要知道这些蛋白具体行使什么生物学功能。

前阵子课题组的师弟问我怎么统计CDS序列的密码子频率,其实百度一下有很多在线分析网站可以把序列丢进去,直接出结果……