anvio的pangenome分析使用步骤
1. 检查fasta文件的contig名字是否唯一,可以使用anvi-script-reformat-fasta命令来重命名
1 | anvi-script-reformat-fasta fasta \ |
2. 建立contig database
1 | anvi-gen-contigs-database -f Patient_6557_E_faecalis_cultivar.fa \ |
3. 使用不同的数据库来注释contig database
1 | anvi-run-kegg-kofams -c $i --kegg-data-dir /data/Food/analysis/R0987_nextgen/Erkang.Zhang/anvio_database/kegg_database |
这会直接在database文件中加入注释信息
4. 建立external contig db的路径信息txt
1 | (echo -e "name\tcontigs_db_path"; find /data/Food/analysis/R0987_nextgen/Erkang.Zhang/anvio_pangenome/gluconobacter_potus -name "*_rename.fasta.db" | awk -F'/' '{file=$NF; split(file,a,"."); print a[1]"\t"$0}') >Gluconobacter_potus_external_genomes.txt |
5. 利用contig db建立genomes storage
1 | anvi-gen-genomes-storage -e external-genomes.txt \ |
6. 进行pangenome的分析
1 | anvi-pan-genome -g PROCHLORO-GENOMES.db \ |
7. 建立可交互式网页
1 | anvi-display-pan -p PROJECT-PAN.db -g PROJECT-PAN-GENOMES.db |
8. 在teagasc的hpc上建立网页
1 | #在电脑terminal上登陆 |
9. 可以计算genome之间的ANI并将数据储存到pan db中
1 | anvi-compute-genome-similarity --external-genomes Gluconobacter_potus_external_genomes.txt \ |
10. 最外层有function注释的图
1 | anvi-display-functions --external-genomes Gluconobacter_potus_external_genomes.txt --annotation-source COG24_FUNCTION --profile-db COG24-PROFILE.db |
11. 计算rarefaction
1 | anvi-compute-rarefaction-curves -p Gluconobacter_potus_Pan/Gluconobacter_potus_Pan-PAN.db --iterations 100 -O rarefaction.svg |