用于高效实体注释的 SIENA 工具。
项目描述
锡耶纳 1.0.0 发布
僧伽罗语、英语或僧伽罗语-英语语码转换文本语料库的高效实体注释工具。
特征
- 允许注释僧伽罗语和英语文本数据
- 完全兼容 Rasa 2.8.x NLU 训练数据文件
- 允许导出带注释的 NLU YAML 文件
- 能够基于新的 NLP 技术(包括反向词干)有效地自动注释实体
- 易于使用的 SIENA CLI,可以在本地启动 GUI 服务器
- 阅读更多关于文档
正在进行的研究
- 多个用户的并发实体标记
- 对非 Rasa NLU 数据文件和文本语料库的导入/导出支持
已知的问题
- 对 2.8.x 以外的 Rasa 版本的支持正在开发中
- 基准测试正在进行中
ðŸ“' Docs: https://siena-nlp.github.io
📦 PyPi: https://pypi.org/project/siena/1.0.0/
🪵 完整更新日志:参考相关的 GitHub 分支 (v1.0.0 )
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
siena-1.0.0.tar.gz
(86.2 kB
查看哈希)
内置分布
siena-1.0.0-py3-none-any.whl
(93.2 kB
查看哈希)