0%

anvio的pangenome分析使用步骤

anvio的pangenome分析使用步骤

1. 检查fasta文件的contig名字是否唯一,可以使用anvi-script-reformat-fasta命令来重命名

1
2
3
4
anvi-script-reformat-fasta fasta \
-o contigs-fasta \
--simplify-names \
--report-file contig-rename-report-txt

2. 建立contig database

1
2
3
anvi-gen-contigs-database -f Patient_6557_E_faecalis_cultivar.fa \
--project-name E_faecalis_P6557 \
-o E_faecalis_P6557.db

3. 使用不同的数据库来注释contig database

1
2
3
anvi-run-kegg-kofams -c $i --kegg-data-dir /data/Food/analysis/R0987_nextgen/Erkang.Zhang/anvio_database/kegg_database

anvi-run-ncbi-cogs -c $i --cog-data-dir /data/Food/analysis/R0987_nextgen/Erkang.Zhang/anvio_database/COG_database

这会直接在database文件中加入注释信息

4. 建立external contig db的路径信息txt

1
(echo -e "name\tcontigs_db_path"; find /data/Food/analysis/R0987_nextgen/Erkang.Zhang/anvio_pangenome/gluconobacter_potus -name "*_rename.fasta.db" | awk -F'/' '{file=$NF; split(file,a,"."); print a[1]"\t"$0}') >Gluconobacter_potus_external_genomes.txt

5. 利用contig db建立genomes storage

1
2
anvi-gen-genomes-storage -e external-genomes.txt \
-o PROCHLORO-GENOMES.db

6. 进行pangenome的分析

1
2
3
4
anvi-pan-genome -g PROCHLORO-GENOMES.db \
--project-name "Prochlorococcus_Pan" \
--output-dir PROCHLORO \
--num-threads 6

7. 建立可交互式网页

1
anvi-display-pan -p PROJECT-PAN.db -g PROJECT-PAN-GENOMES.db

8. 在teagasc的hpc上建立网页

1
2
3
4
#在电脑terminal上登陆
ssh -J erkang.zhang@hcux401.teagasc.net -L 5555:localhost:5555 erkang.zhang@compute09
#然后conda激活环境,并运行
anvi-display-pan -p Gluconobacter_potus_Pan/Gluconobacter_potus_Pan-PAN.db -g Gluconobacter_potus-GENOMES.db --server-only -P 5555

9. 可以计算genome之间的ANI并将数据储存到pan db中

1
2
3
4
5
anvi-compute-genome-similarity --external-genomes Gluconobacter_potus_external_genomes.txt \
--program pyANI \
--output-dir ANI \
--num-threads 12 \
--pan-db Gluconobacter_potus_Pan/Gluconobacter_potus_Pan-PAN.db

10. 最外层有function注释的图

1
2
3
anvi-display-functions --external-genomes Gluconobacter_potus_external_genomes.txt --annotation-source COG24_FUNCTION --profile-db COG24-PROFILE.db

anvi-interactive -p COG24-PROFILE.db --server-only -P 5555 --manual

11. 计算rarefaction

1
anvi-compute-rarefaction-curves -p Gluconobacter_potus_Pan/Gluconobacter_potus_Pan-PAN.db --iterations 100 -O rarefaction.svg