Skip to content

congnghia0609/ntc-vntok

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

89 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ntc-vntok

ntc-vntok is a library Tokenizer for the Vietnamese language.

Maven

<dependency>
    <groupId>com.streetcodevn</groupId>
    <artifactId>ntc-vntok</artifactId>
    <version>1.0.0</version>
</dependency>

Quick start

String s = "VNTok là công cụ tách từ Tiếng Việt.";
System.out.println(s);
VnTok vntok = new VnTok();
String rs = vntok.tokenizeSentence(s);
System.out.println(rs);
//VNTok là công_cụ tách từ Tiếng_Việt .

License

This code is under the Apache License v2.