抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

前面说了如何用eggNOG-mapper快速注释功能基因,我们最后得到了很多结果文件,其中最重要的是两个annotations文件。这里主要讲一下怎么整理结果文件,并且对注释的结果做质量评估。

继续更新一下基因组注释,在基因组注释的第5篇博客中,我们已经拿到了Braker3预测的功能基因,并且删除了其中可能被TE插入而失去功能的基因。仅仅拿到这些基因CDS序列和蛋白序列肯定是不够的,我们还需要知道这些蛋白具体行使什么生物学功能。

前阵子课题组的师弟问我怎么统计CDS序列的密码子频率,其实百度一下有很多在线分析网站可以把序列丢进去,直接出结果……

前阵子去兰州开全国植物生物学大会,做实验的师弟问了我一个问题:什么是ATAC-seq?因为王茂军老师课题组有同学在做CUT&Tag,我脑海里第一个出现的也是CUT&Tag,两者的研究内容虽然不同,但是使用的分析方式是非常相似的。正好看到菲沙基因做过这两个技术的讲座,这篇博客就整理一下介绍这两个技术以及衍生技术的分析原理,加深下自己的理解,详细的分析流程留到以后需要做的时候再记录。

前一篇博客主要讲了如何使用juicer进行Hi-C测序的下机数据处理,这篇博客我们按照Aiden团队的基因组组装“CookBook”继续接下来的操作,主要记录下3D-DNA软件的配置运行,以及如何手动调整结果。

前面经过三代数据结合二代数据的组装和polish,已经把基因组组装成了contigs的水平,下一步就是进一步提升到染色体水平。从实现的方式上来说有Bionano的光学图谱技术(作用是减少Scaffold数量,基因组纠错),Hi-C技术,遗传图谱以及依靠算法实现的基于近缘物种参考基因组的染色体水平组装(比如RagTag)。

最近中期答辩结束,稍微有点空闲的时间捋一捋数据结构和算法方面的知识。虽然现在用python实现排序就一个sort()函数的事,但是还是想锻炼下自己的思维,从底层代码学习一下10种经典排序的实现方式。

本篇笔记主要记录如何在linux命令行中用TASSEL5PLINK2软件做GWAS分析,以及如何可视化GWAS结果(在R中绘制曼哈顿图和QQ图)。关于GWAS是做什么的,以及基本概念介绍可以看上一篇笔记介绍:群体基因组学——概述和图表详解 - 我的小破站 (shelven.com)

最近看群体遗传学的文章,苦于不能理解研究者做的另人眼花缭乱的图表……哎,该补补基础了。这篇笔记先从樊龙江主编的《植物基因组学》教材开始学习基础概念,有部分摘自知乎和一些文献,加上这个领域论文图表的解读和自己的理解做汇总整理。下一篇笔记自己实操跑一下GWAS流程。

本篇笔记主要记录三维基因组学的学习,以及演示如何利用Hi-C数据分析Compartment和拓扑关联结构域(TAD),所使用的分析Hi-C数据的软件为HiC-Pro,可视化软件为HiCPlotter和R包HiTC。