1. 前期准备
- 不同物种的蛋白和cds序列:
os.pep, os.cds, sb.pep, sb.cds
- 依赖程序:
blast+, clustalw2, ParaAT, KaKs_Calculator注:所依赖程序需提前安装好,并添加到环境变量中
- 所用脚本:
axt2one-line.py, calculate_4DTV_correction.pl
2. 获得不同物种之间的同源序列
对参考物种的蛋白序列构建索引
1 | makeblastdb -in sb.pep -dbtype prot |
将目标物种的蛋白序列与参考物种进行比对,并保留最优匹配结果
1 | blastp -query os.pep -db sb.pep -evalue 1e-5 -max_target_seqs 1 -num_threads 12 -out os2sb.blastp_out.m6 -outfmt 6 |
提取最优匹配的同源序列基因对
1 | cut -f1-2 os2sb.blastp_out.m6|sort|uniq > os2sb.homolog |
合并目标物种和参考物种的蛋白序列和cds序列
1 | cat os.cds sb.cds >os_sb.cds |
3. 使用ParaAT程序将蛋白序列比对结果转化为cds序列比对结果
1 | # 新建proc文件, 设定12个线程 |
4. 计算kaks值和4dtv值
1 | cd os2sb_out |
5. 使用calc_kaks_4dtv.sh脚本一步计算kaks值和4dtv值
1 | nohup sh calc_kaks_4dtv.sh os sb & |
查看脚本文件
1 |
|
脚本运行完后会生成以下结果文件
最终得到的结果在os2sb_out文件夹中的all-results.txt文件中
6. 绘制kaks值和4dtv值的密度分布图
1 | setwd("/Users/Davey/Desktop") |
本文出自于http://www.bioinfomics.top转载请注明出处 !