在 vcf 中创建分阶段和非分阶段块的所有可能组合
项目描述
单倍体洗牌器
在 vcf 中创建分阶段和非分阶段块的所有可能组合
背景
该工具采用相位、非相位或部分相位 VCF 文件,并生成与 VCF 文件中存在的相位一致的所有可能的相位块组合。
细节
首先,此工具从 VCF 文件中读取所有变体,并将变体组合在一起(如果它们兼容)。
- 如果一个变体是分阶段的(使用
PS标签),它只与具有相同阶段 ID 的其他分阶段变体兼容。 - 纯合变体始终与其他变体兼容,因为它们是每个阶段组的一部分
- 杂合变体仅在它们被定相且相 ID 匹配时才兼容。
为了生成分组变体的所有可能组合,haplotype-suffler 使用计数器生成二进制模式,以确定应该修改哪些调用。要修改变体,我们只需反转GT字段的顺序,即0/1变为1/0,反之亦然。
由于每个变体都有两个等位基因,我们只需要生成可能的 VCF 文件的一半,因为另一半是镜像(例如0101和
1010)。
用法
haploblock-shuffler test.vcf output
要从输出 vcf 文件生成一致的 fasta 文件,bgzip 并索引输出 vcf 文件
cd output
for i in out_*.vcf; do
bgzip $i
tabix ${i}.gz
done
然后,使用生成共识
samtools faidx $REFERENCE $REGION | bcftools consensus -H 1 out_0.vcf.gz > out_0_1.fa
samtools faidx $REFERENCE $REGION | bcftools consensus -H 2 out_0.vcf.gz > out_0_2.fa
限制
此工具将2^(n-1)在指定output文件夹中生成 VCF 文件,其中n是输入 VCF 中的阶段块数(见上文)。默认情况下,这限制为 11 个块,这意味着最多将创建 1024 个文件。使用 可以增加此限制--max-blocks,但请谨慎使用。
项目详情
关
haploblock -shuffler-0.0.6.tar.gz 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 39a11aeb522ebbe84f030b82874783f6cd1b355688b2398fc8891431f669a3d1 |
|
| MD5 | 79d4ea372511701d3b3ed0d72cb0a9ad |
|
| 布莱克2-256 | 668013bacf469cc94a8496def0a5effee97c8273b5d974af8548a21d77955040 |
关
haploblock_shuffler -0.0.6-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | a2bcd48542d093e24a34c05faf6f5709229bca37aa73677a5257698169ae313d |
|
| MD5 | 5dbc8447731540745a9e2f747e9a999d |
|
| 布莱克2-256 | 95991c9dff7b6c9394e7dada1341ffd8080dafcfb4897a62e42c574e89e6029b |