Skip to main content

可配置重试。

项目描述

mask-plasmid:从组装好的基因组中创建一个快速的 BED 文件

构建状态

背景

在使用微生物基因组数据构建系统发育树时,必须尽可能接近克隆框架。

识别克隆框架的常用技术是将读数映射到参考基因组,然后过滤掉所有感兴趣样本中不存在的任何位点。

一般来说,质粒不应该是克隆框架的一部分。虽然理论上它们可能是克隆框架的一部分,但对于短读取数据,很难说质粒是否都相同。然而,更重要的是,完全不可能说质粒和染色体是从样品的最近共同祖先垂直继承的。

因此,通常建议从分析中删除质粒。

当一个读段是属于质粒还是属于染色体时,问题就出现在小读段数据中。有时质粒被插入染色体,有时读数应该映射到质粒但错误地映射到染色体,因为质粒不包括在分析中。因此,在将读取映射到参考以识别潜在变体和克隆框架的情况下,应从用于识别的潜在读取池中删除模棱两可的读取(即,可以映射到染色体或质粒上)变种网站。

如果在尝试映射读数之前从参考数据集中删除质粒,则无法识别模棱两可的读数。因此,更好的策略可能是将质粒保留在参考数据集中,映射所有读数,识别可变位点,然后屏蔽质粒位点。

这可以使用Snippy 4通过使用该 --mask选项并为其提供 BED 文件来实现。

这个工具有什么作用?

该工具将生成一个 BED 文件,其中包含 Genbank 文件中的每个基因座,可以轻松编辑该文件,然后--mask在使用Snippy 4.

安装

pip install mask-plasmid

跑步

mask-plasmid <my_gb.gbk[.gz]> > plasmids.bed

发展

推送到 Pypi

以下命令将:

  • 运行测试
  • 清理当前分支
  • 打版本
  • 生成分布
  • 清理当前分支
  • 用版本标记提交
  • 推送到github
  • 推送到 pypi
git commit -a -m <message>
pipenv run inv deploy <new_version_number> [<patch|minor|major>]

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

mask_plasmid-0.1.8.macosx-10.13-x86_64.tar.gz (3.5 kB 查看哈希

已上传 source

内置分布

mask_plasmid-0.1.8-py2.py3-none-any.whl (16.5 kB 查看哈希

已上传 py2 py3