依赖:
依赖的软件需要使用export添加到环境变量中,以实现流程的调用。
安装:在流程目录下运行以下命令
pip install ./bmk-ocean-stars
配置文件:
## 测序数据
FQ /path/to/ont-reads.fastq
## 荧光解码文件
FLU /path/to/flu_info.txt
## 参考基因组序列、gtf文件
Genome /path/to/ref/genome/fasta
GTF /path/to/ref/gene/gtf
## HE图片文件
HE /path/to/HE.tif
## 输出目录及输出前缀
OUTDIR /path/to/result/dir/
PREFIX outfile-prefix
### 程序运行线程数
Threads 8
Link1 TACGT
流程说明:
流程分为4个步骤,如下所示:
步骤1:运行GenomeMap,将ONT reads与参考基因组比对。
步骤2:运行MatrixMake,识别barcode、UMI并生成表达矩阵文件。
步骤3:运行AllheStat,处理HE图片。
步骤4:运行WebReport,得到网页版报告。
流程参数:
-c config.txt 数据配置文件
-s 步骤选择,0为运行1-4所有步骤,也可选择个别步骤单独运行,多个步骤中间使用“,”分割。
参考命令:
./BSTMatrixONT -c config.txt -s 0
./BSTMatrixONT -c config.txt -s 1,2,3,4
./BSTMatrixONT -c config.txt -s 1,2
目录结构及结果说明:
outdir/
├── 01.GenomeMap 步骤1运行结果目录
│ ├── HXFA2-3.sort.bam 基因组比对bam文件
│ ├── HXFA2-3.sort.bam.bai
│ └── mapping.sh
├── 02.MatrixMake 步骤2运行结果目录
│ ├── bam
│ ├── bc_umi_read.tsv barcode-umi-reads数文件
│ ├── bc_umi_read.tsv.stat
│ ├── cache_raw_expression.pkl
│ ├── filtered_feature_bc_matrix
│ ├── final_matrix 过滤后的matrix文件
│ ├── flu_recognition barcode芯片位置识别目录
│ ├── HXFA2-3.bc_gene_umi.bc_stat barcode检测结果统计文件
│ ├── HXFA2-3.bc_gene_umi.map_stat 比对类型结果统计文件
│ ├── HXFA2-3.bc_gene_umi.stat barcode-gene-umi对应文件
│ ├── raw_feature_bc_matrix
│ ├── reads_cumi.tsv barcode-gene-umi数文件
│ ├── reads_info.tsv reads相关信息文件
│ └── web_summary.html 网页版统计结果文件
├── 03.AllheStat 步骤3运行结果目录
│ ├── allhe
│ ├── all_level_stat.txt 不同水平的spots统计
│ ├── BSTViewer_project BSTViewer软件输入数据
│ ├── heAuto_level_matrix
│ ├── level_matrix
│ ├── stat.txt
│ └── umi_plot umi count图片统计图目录
├── 04.WebReport 步骤4运行结果目录
│ ├── prefix.filelist
│ ├── index.html 网页版报告html文件
│ └── src 网页版报告src目录
└── prefix 收集的基因表达矩阵等文件目录
├── barcode_pos.tsv barcode类型对应的芯片位置文件
├── barcode.tsv 芯片对应的barcode类型文件
├── bc_gene_umi.stat.gz barcode-gene-umi对应文件
├── bc_umi_read.tsv.gz barcode-umi-reads数文件
├── features.tsv features.tsv文件
└── matrix.tsv 基因表达矩阵文件
]]>