Skip to content

Commit

Permalink
Merge pull request #146 from bab2min/dev_issue_145
Browse files Browse the repository at this point in the history
Fixed issue #145
  • Loading branch information
bab2min authored Nov 20, 2023
2 parents 1885556 + a4623a6 commit 40d075f
Show file tree
Hide file tree
Showing 2 changed files with 9 additions and 0 deletions.
1 change: 1 addition & 0 deletions src/KiwiPy.cpp
Original file line number Diff line number Diff line change
Expand Up @@ -755,6 +755,7 @@ struct MorphemeSetObject : py::CObject<MorphemeSetObject>
MorphemeSetObject(py::UniqueCObj<KiwiObject>&& _kiwi)
{
kiwi = std::move(_kiwi);
kiwi->doPrepare();
}

void update(PyObject* morphs)
Expand Down
8 changes: 8 additions & 0 deletions test/test_kiwipiepy.py
Original file line number Diff line number Diff line change
Expand Up @@ -663,3 +663,11 @@ def test_template():
tpl = kiwi.template("{}가 {}를 {}\ㄴ다.")
res = tpl.format([("우리", "NP"), ("들", "XSN")], ("길", "NNG"), ("묻", "VV-I"))
assert res == "우리들이 길을 묻는다."

def test_issue_145():
kiwi = Kiwi()
stopwords = Stopwords()
kiwi.add_user_word('팔이', 'XSV', 10)
text = "루쉰(노신)의 「아Q정전」은 주인공을 통해 중국민족의 병폐,노예근성을 기탄없이 지적한 작품이다. 날품팔이를 하며 그럭저럭 살아가는 떠돌이 농민 아Q는 자기도 모르는 사이에 혁명의 와중에 휘말려 반란죄로 체포되고 사형선고를 받는다.까닭도 모르고 사형집행 서류에 서명을 하게 되지만 글자를 쓸줄 모르는 일자무식 아Q는 온 힘을 기울여 동그라미를 겨우 그린 후.."
tokens = kiwi.tokenize(text, split_sents= True, stopwords = stopwords, blocklist = ['껌팔이/NNG','품팔이/NNG', '날품팔이/NNG'])
assert tokens

0 comments on commit 40d075f

Please sign in to comment.