ntc-vntok is a library Tokenizer for the Vietnamese language.
<dependency>
<groupId>com.streetcodevn</groupId>
<artifactId>ntc-vntok</artifactId>
<version>1.0.0</version>
</dependency>
String s = "VNTok là công cụ tách từ Tiếng Việt.";
System.out.println(s);
VnTok vntok = new VnTok();
String rs = vntok.tokenizeSentence(s);
System.out.println(rs);
//VNTok là công_cụ tách từ Tiếng_Việt .
This code is under the Apache License v2.