韩国形态分析器和标注器。
项目描述
KUKoLex
KUKoLex 是韩国大学 NLP&AI LAB 制造的韩国形态分析器和标记器。主要功能如下。
要求
蟒蛇 3
安装
来自 PyPi:
pip install kukolex
来自 GitHub:
pip install git+https://github.com/nlpai-lab/KU_KoLex.git
用法
- pos_tagging(输入)
它将“句子”作为输入,并给出一个词素列表及其 POS 标签作为输出
- 变形(输入)
它将“句子”作为输入并给出一个词素列表。
- 位置(输入)
它将“句子”作为输入,并给出一个 POS 标签列表。
- 名词(输入)
它将“句子”作为输入并给出一个名词列表。
from KUKoLex import kukolex
kukolex.pos_tagging('안녕하세요. 저의 이름은 홍길동입니다.')
# [('안녕', 'NNG'), ('하', 'XSA'), ('시', 'EP'), ('어요', 'EM'), ('.', 'SF'), ('저', 'NP'), ('의', 'JKG'), ('이름', 'NNG'), ('은', 'JX'), ('홍길동', 'NNP'), ('이', 'VCP'), ('ㅂ니다', 'EM'), ('.', 'SF')]
kukolex.morphs('안녕하세요. 저의 이름은 홍길동입니다.')
# ['안녕', '하', '시', '어요', '.', '저', '의', '이름', '은', '홍길동', '이', 'ㅂ니다', '.']
kukolex.pos('안녕하세요. 저의 이름은 홍길동입니다.')
# ['NNG', 'XSA', 'EP', 'EM', 'SF', 'NP', 'JKG', 'NNG', 'JX', 'NNP', 'VCP', 'EM', 'SF']
kukolex.nouns('안녕하세요. 저의 이름은 홍길동입니다.')
# ['안녕', '저', '이름', '홍길동']