用于过滤候选突变以估计自发突变率的软件包。
项目描述
安装
CaMu.py可以使用 pip 轻松安装。只需运行命令:
pip install camu
pip 将自动安装包含在CaMu.py.
此外,必须安装samtools >= 0.1.19 和gatk >=4.1.2 并将其添加到路径中。
用法
安装后CaMu.py,主模块camu可以通过
python3 -m camu <additional parameter>
提供-h或--help作为附加参数会打开帮助页面。
在这里,您可以看到运行所需传递的所有其他参数camu。
对于整个脚本,有必要提供一个文本文件,在第 1 列中提供所有示例 VCF 文件的路径,并在第 2 列中使用-i提供相应的 BAM 文件。
此外,必须通过-c提供控制 BAM 文件的路径。
最后,必须使用-r给出参考基因组的路径。
如果要单独运行任何脚本,可以使用调用脚本
python3 -m <scriptname>
其中 <scriptname> 必须由下面给出的 5 个模块之一( 、 等)进行preprocessing.py交换filterDupAndLinked.py。
过滤假阳性候选突变以加速直接 µ 估计的 DNM 计数
对于自发突变率 μ 的直接估计,有必要计算每代每个位点发生的自发从头突变 (DNM) 率。因此,计算 DNM 对于估计 µ 是必不可少的。
原始方法是:
- 测序样品和对照 --> FASTQ 文件
- 测序结果的组装 --> BAM 文件
- 执行一些过滤步骤
- 变体调用
- 提取样本中发生但不受控制的变异->候选突变
目前必须使用像 IGV 这样的基因组浏览器手动整理生成的候选突变 (CM) 列表。
不幸的是,大约。这些 CM 中有 90% 不是真正的 DNM,它们被证明是假阳性。
CaMu.py旨在通过过滤掉绝大多数假阳性 CM 并准备剩余的 CM 以使用 IGV 进行快速手动管理,从而加速 DNM 计数的整个过程。
CaMu.py由 5 个主要的 Python 模块组成:
preprocessing.pyfilterDupAndLinked.pydetectFIO.pysnapshotIGV.pyIGVsessions.py
preprocessing.py从一个输入文本文件开始,该文件在第 1 列中包含所有样本的 VCF 文件的路径,在第 2 列中包含所有相应 BAM 文件的路径。这些 VCF 和 BAM 文件被读出并进一步处理,以找到可能的 DNM 变体 -候选突变CM。
粗略的方法如下:
以下脚本CaMu.py进一步过滤 CM,以筛选出与其他突变完全相关的那些、那些仅由于最有可能是 PCR 重复的读数而被包括在内的那些,以及那些在其他样本中或在对照样本的 BAM 文件中多次出现的变异。
最后,对于所有剩余的 CM,IGV 会话和 IGV 快照是在其中创建的IGVsessions.py,snapshotIGV.py以进一步简化剩余 CM 的手动管理。
这是一个概述:
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。