time
|
Bacterial Genomic Seuqnece Data Mining & Bioinformatic Analysis |
|
Rapid Analysis of Genetic Relationship among Achromobacter spp. Strains by Batch-ANIm |
||
Batch-ANIm由ANI计算软件Jspecies和多个功能程序脚本组成。该软件通过Aspera高速完成大量基因组序列下载,平行启动多个Jspecies程序并自动完成两两基因组配对和序列导入,能够快速计算获得大量基因组两两之间ANI值。使用方法详见https://www.microbialgenomic.cn/Batch-ANIm.html。 |
||
如果使用Batch-ANIm,请引用一下参考文献: 利用Batch-ANIm快速分析无色杆菌属菌株间的亲缘关系. 基因组学与应用生物学, 2021, 40(2):695-704. |
||
Batch_ANIm下载地址: Batch-ANIm.tar.gz | ||
使用说明 | ||
1. 依赖程序及模块安装与配置(Installation of required programs) and Perl modules =========================================================================== |
||
|
Batch-ANIm运行前,需要安装好Java、Aspera、MUMmer、以及相关Perl模块,此外运行 Jpecies 时,需要设置工作文件夹和MUMmer执行文件路径(But before running, Batch-ANI needs to pre-install Java, Aspera, Mummer, several Perl Modules,and R packages. In addition, the paths of workplace and mummer in Jspecies need to be set.) Perl模块列表(Perl Modules list): R程序及相关安装包(R software and packages list): MUMmer安装(MUMmer installation) Jspecies设置 (Jspecies set): Aspera安装(Aspera installation): |
|
2. 运行Batch-ANIm(Running Batch-ANIm) ========================================= |
||
|
(1) genome_batch_retrive.pl 采用Aspera高速下载基因组序列数据; 输入文件:每一行包括一个基因组FTP下载地址的文本文档 下载格式说明:用户可以根据需要下载全基因组的注释文件、全全基因组核苷酸序列文件 、全部编码基因核苷酸序列、全部编码基因氨基酸序列 例如: genomes/all/GCF/001/571/245/GCF_001571245.1_ASM157124v1/GCF_001571245.1_ASM157124v1_genomic.fna.gz 只下载全基因组的核苷酸序列文件 genomes/all/GCF/001/571/245/GCF_001571245.1_ASM157124v1 涵盖所有基因组的数据。 #在使用之前,用户应该安装Aspera并为以下参数设置绝对路径,例如: 用法: 执行例子: 参数 单个基因组数据的文件格式解释(Example for explaination file format for individual genome data) (2)Batch_import_conf.pl 根据菌株名文件列表生成配置文件,平行启动多个Jspecies,并自动完成基因组序列导入和基因组配对选择。 运行Batch_import_conf.pl前,启动Jspecies,设置Jspecies工作文件夹绝对路径,推荐使用Batch_import_conf.pl的ANI_direction参数作为工作文件夹,同时设置nucmer执行文件路径,具体使用说明参见http://imedea.uib-csic.es/jspecies/index.html.(before using jspecies, the users needs to set the absolute pathway for workplace (recommend to use ANI_direction as workplace), and nucmer manually. Please refer to jspecies usage available at http://imedea.uib-csic.es/jspecies/index.html.) 用法: 参数
***Jspecies程序全部运行完成后,用户需要手工分别保存每个平行运行的结果,并将结果文件存放在同一个文件夹下,此文件夹为test_to_matrix.pl的输入数据文件 (3)text_to_matrix.pl将多个平行运行Jspecies产生的结果文件转换成一个完整的ANIm矩阵文件;输入文件:文件夹存放有多个ANIm结果文件。 用法: 执行例子: 参数: (4)ANIm_matrix_cluster.R根据“100-ANIm”进化距离值,对菌株进行聚类分析 参数: (1) out_file: 聚类输出的pdf文件绝对路径 (2) matrix: ANIm矩阵文件绝对路径
Rscript ANIm_matrix_cluster.R out_file matrix Rscript /home/xiangyang/Batch-ANIm/ANIm_matrix_cluster.R /home/xiangyang/Batch-ANIm/1027_genome.out /home/xiangyang/Batch-ANIm/1027_test.out_distance |
|
Dr. Xiangyang Li (E-mail: lixiangyang@fudan.edu.cn, lixiangyang1984@gmail.com), Fudan university; Kaili University; Bacterial Genome Data mining & Bioinformatic Analysis (https://www.microbialgenomic.cn/). Copyright 2019—2025, Xiangyang Li. All Rights Reserved. |