Skip to main content

用于过滤候选突变以估计自发突变率的软件包。

项目描述

卡姆标志

安装

CaMu.py可以使用 pip 轻松安装。只需运行命令:

pip install camu

pip 将自动安装包含在CaMu.py.

此外,必须安装samtools >= 0.1.19 和gatk >=4.1.2 并将其添加到路径中。

用法

安装后CaMu.py,主模块camu可以通过

python3 -m camu <additional parameter>

提供-h--help作为附加参数会打开帮助页面。

在这里,您可以看到运行所需传递的所有其他参数camu

对于整个脚本,有必要提供一个文本文件,在第 1 列中提供所有示例 VCF 文件的路径,并在第 2 列中使用-i提供相应的 BAM 文件。

此外,必须通过-c提供控制 BAM 文件的路径。

最后,必须使用-r给出参考基因组的路径。

如果要单独运行任何脚本,可以使用调用脚本

python3 -m <scriptname>

其中 <scriptname> 必须由下面给出的 5 个模块之一( 、 等)进行preprocessing.py交换filterDupAndLinked.py

过滤假阳性候选突变以加速直接 µ 估计的 DNM 计数

对于自发突变率 μ 的直接估计,有必要计算每代每个位点发生的自发从头突变 (DNM) 率。因此,计算 DNM 对于估计 µ 是必不可少的。

原始方法是:

  • 测序样品和对照 --> FASTQ 文件
  • 测序结果的组装 --> BAM 文件
  • 执行一些过滤步骤
  • 变体调用
  • 提取样本中发生但不受控制的变异->候选突变

目前必须使用像 IGV 这样的基因组浏览器手动整理生成的候选突变 (CM) 列表。

不幸的是,大约。这些 CM 中有 90% 不是真正的 DNM,它们被证明是假阳性。

CaMu.py旨在通过过滤掉绝大多数假阳性 CM 并准备剩余的 CM 以使用 IGV 进行快速手动管理,从而加速 DNM 计数的整个过程。

CaMu.py由 5 个主要的 Python 模块组成:

  1. preprocessing.py
  2. filterDupAndLinked.py
  3. detectFIO.py
  4. snapshotIGV.py
  5. IGVsessions.py

preprocessing.py从一个输入文本文件开始,该文件在第 1 列中包含所有样本的 VCF 文件的路径,在第 2 列中包含所有相应 BAM 文件的路径。这些 VCF 和 BAM 文件被读出并进一步处理,以找到可能的 DNM 变体 -候选突变CM。

粗略的方法如下:

预处理管道

以下脚本CaMu.py进一步过滤 CM,以筛选出与其他突变完全相关的那些、那些仅由于最有可能是 PCR 重复的读数而被包括在内的那些,以及那些在其他样本中或在对照样本的 BAM 文件中多次出现的变异。

最后,对于所有剩余的 CM,IGV 会话和 IGV 快照是在其中创建的IGVsessions.pysnapshotIGV.py以进一步简化剩余 CM 的手动管理。

这是一个概述:

卡姆概述

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

camu-0.1.7.ta​​r.gz (15.7 kB 查看哈希

已上传 source

内置分布

camu-0.1.7-py3-none-any.whl (18.9 kB 查看哈希)

已上传 py3