asdkakdjasdas
项目描述
NLU:Spark NLP 的力量,Python 的简单性
John Snow Labs 的 NLU 是一个 Python 库,用于直接在任何数据帧上应用最先进的文本挖掘,只需一行代码。作为屡获殊荣的 Spark NLP 库的门面,它配备了数十种语言的数百个预训练模型——所有模型都是生产级的、可扩展的和可训练的。
项目网站
查看我们的官方 Spark NLU 页面:https ://nlu.johnsnowlabs.com/ 以获取用户文档和示例
NLU 在行动
NLU 入门
要获得 NLU 的强大功能,您只需通过 pip 安装它并确保 Java 8 已安装并正确配置。结帐快速入门了解更多信息
pip install nlu
在 1 行 python 中使用任何模型加载和预测
import nlu
nlu.load('sentiment').predict('I love NLU! <3')
在 1 行中使用多个模型加载和预测
在 1 行中获取 6 个不同的嵌入,并将它们用于下游数据科学任务!
nlu.load('bert elmo albert xlnet glove use').predict('I love NLU! <3')
NLU 提供什么样的模型?
NLU 在一行代码中提供了数据科学家可能想要的一切!
- NLU 在一行代码中提供了数据科学家可能想要的一切!
- 350 + 预训练模型
- 100 多种最新的 NLP 词嵌入(BERT、ELMO、ALBERT、XLNET、GLOVE、BIOBERT、ELECTRA、COVIDBERT)以及它们的不同变体
- 50 多种最新的 NLP 句子嵌入(BERT、ELECTRA、USE)和它们的不同变体
- 50 多个分类器(NER、POS、情感、讽刺、问题、垃圾邮件)
- 40 多种支持的语言
- 有标签和无标签的依赖解析
- 各种文本清洗和预处理方法,如词干提取、词形还原、规范化、过滤、清洗管道等
在许多不同的不同数据集上训练的分类器
为正确的任务选择正确的工具!无论您是分析电影还是推特,NLU 都有适合您的模型!
- trec6 分类器
- trec10 分类器
- 垃圾邮件分类器
- 假新闻分类器
- 情绪分类器
- 网络欺凌分类器
- 讽刺分类器
- 电影情感分类器
- IMDB 电影情感分类器
- Twitter情绪分类器
- 在 ONTO 笔记上预训练的 NER
- CONLL 上的 NER 培训师
- wiki 20 lang 数据集上 20 种语言的语言分类器。
数据科学 NLU 应用程序的实用程序
处理文本数据有时可能是一项相当肮脏的工作。NLU 通过提供大量组件来消除数据工程密集型任务,从而帮助您保持双手清洁。
- 日期时间匹配器
- 模式匹配器
- 块匹配器
- 短语匹配器
- 停用词清洁剂
- 图案清洁剂
- 俚语清洁工
我在哪里可以看到 NLU 的整个报价?
查看NLU 命名空间,了解 NLU 提供的所有内容!
支持的数据类型
- Pandas DataFrame 和系列
- 火花数据帧
- 带有 Ray 后端的 Modin
- 带有 Dask 后端的 Modin
- numpy 数组
- 字符串和字符串列表
查看以下笔记本,了解如何使用 NLU 的示例。
数据集上的 NLU 演示
- Kaggle Twitter 航空公司情绪分析 NLU 演示
- Kaggle Twitter 航空公司情绪分析 NLU 演示
- Kaggle Twitter COVID 情绪分析 NLU 演示
- Kaggle Twitter COVID 情绪分析 nlu 演示
NLU 组件示例
以下是展示每个 NLU 组件和一些应用程序的协作示例。
-
命名实体识别 (NER)
-
词性(POS)
-
分类器
-
词嵌入
-
句子嵌入
-
依赖解析
-
文本预处理和清洗
-
分块
-
匹配器
需要帮忙?
简单的 NLU 演示
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
ahmedlones-0.0.8.tar.gz
(73.8 kB
查看哈希)
内置分布
ahmedlones-0.0.8-py3-none-any.whl
(136.3 kB
查看哈希)
关
ahmedlones -0.0.8.tar.gz 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 3d783c042a5b95fa868b16ce67bb6f1c1bfbee14ded43435b4608fae3024746c |
|
| MD5 | a53e0edbcf1e161375f7430b8c7da79a |
|
| 布莱克2-256 | 170a87ae02c556dd99189050e25342cd715acb8059bb89fac6c430208fabeb3e |
关
ahmedlones -0.0.8-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | cf351d7012ca9081e10b22f9884968cc25964e565c1480495a1ee9b318de92e3 |
|
| MD5 | cf3412e23a5bb41638d7e7ea6b15597e |
|
| 布莱克2-256 | 78a77ff178994e72a1bececb27113559459124a1a09bce8d649448d2e8833947 |