Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

fix: センテンス内の「」や""などにおける区切り文字を考慮するように修正 #47

Merged
merged 3 commits into from
Feb 10, 2023

Conversation

azu
Copy link
Member

@azu azu commented Feb 10, 2023

センテンスの中に「xxx. yyy.」があると、センテンスの中にさらに区切り文字(。.など)が含まれているケースがある。 この場合も、区切り文字を+1の距離として扱うことで、「」の中にサブセンテンス(文章)を書いているケースをエラーにしないようにした。

デフォルトの区切り文字には [".", ".", "。", "?", "!", "?", "!"] が含まれるので、

Xは「今日は早朝から出発したが、定刻には間に合わなかった。定刻には間に合わなかったが、無事会場に到着した」と言った。

というのはエラーではなくなる。

次のように、「」の中で二重助詞がある場合は、そのままエラーとなる。

あなたは「私は彼は好きだ」と言った。

fix #40

センテンスの中に「xxx. yyy.」があると、センテンスの中にさらに区切り文字(。.など)が含まれているケースがある。
この場合も、区切り文字を+1の距離として扱うことで、「」の中にサブセンテンスを書いているケースをエラーにしないようにした
@azu azu linked an issue Feb 10, 2023 that may be closed by this pull request
@azu azu added the Type: Bug Bug or Bug fixes label Feb 10, 2023
@azu azu merged commit 118552d into master Feb 10, 2023
@azu azu deleted the feature/40 branch February 10, 2023 15:19
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Type: Bug Bug or Bug fixes
Projects
None yet
Development

Successfully merging this pull request may close these issues.

括弧で囲まれた文章が一文として判定される
1 participant