Mysam:阿拉伯语标签管理器
项目描述
安装
` pip install mysam-tagmanager `
用法
import mysam.tagmaker as tagmaker
例子
测试负载配置
import mysam.tagconfig as tagconfig
import mysam.tag_const as tag_const
import pandas as pd
configuer = tagconfig.tagConfig()
configuer.load_config()
# display
df = pd.DataFrame(tag_const.TAGSDICT)
print('****tagdict ****')
print(df)
*****Result *****
****tagdict ****
1st person 2nd person 3rd person Beh FEH \
ar_attr شخص شخص شخص جر عطف
ar_value متكلم مخاطب غائب باء الفاء
attr person person person preposition conjonction
code I Y H B F
inflect بالباء
part 4 4 4 3 3
pos 4 4 4 2 1
value 1st person 2nd person 3rd person Beh FEH
....
....
您可以通过将参数传递给 load_conf 来加载特定的配置文件。如果文件不存在或无法打开,则加载默认配置。
configuer = tagconfig.tagConfig()
configuer.load_config("tag.config")
如果您想知道输入文件是否打开,请将 'debug' 参数修复为 'True'
如果您想知道输入文件是否打开,请将 'debug' 参数修复为 'True'
configuer = tagconfig.tagConfig()
configuer.load_config("tag.config", debug=True)
测试呼叫标记器
import mysam.tagmaker as tagmaker
taglists = [[u'اسم', u'هاء', u'مجرور',],
u'تعريف::مرفوع:متحرك:ينون:::'.split(":"),
]
for taglist in taglists:
tag_maker = tagmaker.tagMaker()
# encode
tag_maker.encode(taglist)
print(u"+".join(taglist).encode('utf8'))
tagstr = str(tag_maker)
print(tagstr)
# decode a unifed tag string
print(tag_maker.decode())
**** result ****
اسم+هاء+مجرور
N--;--I-;----;----
[(u'نوع الكلمة', u'اسم'), (u'جنس', u'لاشيء'), (u'عدد', u'لاشيء'), (u'إعراب', u'مجرور'), (u'علامة', u'لاشيء'), (u'عطف', u'لاشيء'), (u'جر', u'لاشيء'), (u'تعريف', u'نكرة'), (u'ضمير متصل', u'لاشيء'), (u'استقبال', u'لاشيء'), (u'بناء', u'لاشيء'), (u'زمن', u'لاشيء'), (u'شخص', u'لاشيء')]
تعريف++مرفوع+متحرك+ينون+++
---;--U-;--L-;----
[(u'نوع الكلمة', u'لاشيء'), (u'جنس', u'لاشيء'), (u'عدد', u'لاشيء'), (u'إعراب', u'مرفوع'), (u'علامة', u'لاشيء'), (u'عطف', u'لاشيء'), (u'جر', u'لاشيء'), (u'تعريف', u'معرفة'), (u'ضمير متصل', u'لاشيء'), (u'استقبال', u'لاشيء'), (u'بناء', u'لاشيء'), (u'زمن', u'لاشيء'), (u'شخص', u'لاشيء')]
变形例
>>> tag_maker = tagmaker.tagMaker()
>>> tagcode = 'N--;--I-;----;---'
>>> print(tag_maker.inflect(tagcode).encode('utf8'))
اسم مجرور وعلامة جرّه الياء لأنه جمع مذكر سالم وهو مضاف، والضمير المتصل مبني في محل جر مضاف إليه
添加标签示例
>>> tag_maker = tagmaker.tagMaker()
>>> tagcode = 'N--;--I-;----;---'
>>> tag_new = u"تعريف"
>>> tag_maker.add(tag_new)
>>> tag_new = u"اسم"
>>> tag_maker.add(tag_new)
>>> print(str(tag_maker).encode('utf8'))
N--;----;--L-;----
具有标签的示例
>>> tag_maker = tagmaker.tagMaker()
>>> tagcode = 'N--;--I-;----;---'
>>> tag_search = u"مجرور"
>>> print(tag_maker.has_tag(tag_search, tagcode))
True
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
内置分布
mysam_tagmanager-0.3.3-py3-none-any.whl
(30.6 kB
查看哈希)
关
mysam_tagmanager -0.3.3-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 62a4dbc225df7a3a0008e0421339c9cb60dbbd7710e7a2193969d8c1c76e22ae |
|
| MD5 | 13d324f3bf90e89ac239456c32fd9226 |
|
| 布莱克2-256 | c78c6fdae6bccb04b7050ba332ef75f03d34ec4c32e0b962f4e7a2e7f206d74f |