Skip to main content

LAAC@LSCP

项目描述

儿童项目

介绍

儿童的全天(音频)录音越来越普遍,但没有科学的标准格式可以有利于此类数据的组织和分析。ChildProject 提供标准化规范和工具,用于存储和管理儿童的全天记录及其相关元数据和注释。

文件组织结构

我们假设数据包括三种截然不同的类型:

  1. 音频,我们区分从硬件中提取的原始音频;以及已转换为标准化格式的版本。这些音频是长格式的。目前,我们不预见包括从这些长格式音频中提取的剪辑,并假设任何此类过程都会生成某种形式的注释,然后可以在时间上将其重新投射到长格式音频中。
  2. 注释,我们再次区分原始版本和标准化版本。目前我们可以从Praat的textgrid、ELAN的eaf、VTC的rttm格式导入。
  3. 对应于子项、录音和注释的元数据,因此也将描述转换后的录音。

可用工具

通常使用 LENA 录音机收集全天的录音,并使用 LENA 软件进行分析。但是,LENA 商业环境的开源替代方案正在出现,其中一些如下图所示。

全天录制环境中的一些工具概述

例如,替代硬件包括婴儿记录器和任何其他具有足够电池和存储空间以记录数小时的轻型记录设备。

替代的自动分析选项包括语音类型分类器,它将音频分割成不同的说话者类型(关键儿童、女性成人等)和ALICE,一个自动语言单位计数器。

至于手动注释选项, 可以使用ELAN ,例如采用ACLEW DAS 注释方案。可以使用 Seshat将注释分配给个人并进行评估。最后, 在公民科学家的帮助下, Zooniverse可用于众包分类的某些方面。

在这种情况下,我们提供工具和程序来:

  • 验证数据集(确保元数据、记录和注释位于正确的位置和格式)
  • 将您的原始录音转换为所需的格式
  • 将注释(从 LENA、ELAN、Praat、VTC/ALICE/VCM rttms、CHAT 文件)导入标准化格式
  • 通过比较注释器(混淆矩阵、一致性系数、pyannote 指标)生成可靠性指标
  • 从注释中提取指标(例如平均发声率、持续时间等)
  • 从一组采样算法中注释的录音样本片段
  • 将剪辑添加到 Zooniverse 中的注释管道,并检索随后的注释

通过导入我们的模块,这些工具既可以在命令行中使用,也可以在您的 python 代码中使用。

安装

您可以在我们的文档中找到安装和使用我们的软件包的说明。

引文

如果您使用此项目进行研究,请引用我们的介绍性论文

@article{gautheron_rochat_cristia_2021,
    title={Managing, storing, and sharing long-form recordings and their annotations},
    url={https://link.springer.com/article/10.1007/s10579-022-09579-3},
    DOI={10.1007/s10579-022-09579-3},
    publisher={Springer},
    journal={Language Resources and Evaluation}
    author={Gautheron, Lucas and Rochat, Nicolas and Cristia, Alejandrina},
    year={2022},
    month={Feb}
}

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

ChildProject-0.0.7.ta​​r.gz (73.1 kB 查看哈希

已上传 source

内置分布

ChildProject-0.0.7-py3-none-any.whl (85.4 kB 查看哈希

已上传 py3