Skip to main content

用于高效实体注释的 SIENA 工具。

项目描述

锡耶纳 1.0.0 发布

僧伽罗语、英语或僧伽罗语-英语语码转换文本语料库的高效实体注释工具。

特征

  • 允许注释僧伽罗语和英语文本数据
  • 完全兼容 Rasa 2.8.x NLU 训练数据文件
  • 允许导出带注释的 NLU YAML 文件
  • 能够基于新的 NLP 技术(包括反向词干)有效地自动注释实体
  • 易于使用的 SIENA CLI,可以在本地启动 GUI 服务器
  • 阅读更多关于文档

正在进行的研究

  • 多个用户的并发实体标记
  • 对非 Rasa NLU 数据文件和文本语料库的导入/导出支持

已知的问题

  • 对 2.8.x 以外的 Rasa 版本的支持正在开发中
  • 基准测试正在进行中

ðŸ“' Docs: https://siena-nlp.github.io
📦 PyPi: https://pypi.org/project/siena/1.0.0/
🪵 完整更新日志:参考相关的 GitHub 分支 (v1.0.0 )

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

siena-1.0.0.tar.gz (86.2 kB 查看哈希)

已上传 source

内置分布

siena-1.0.0-py3-none-any.whl (93.2 kB 查看哈希)

已上传 py3