Bài viết giới thiệu các phương pháp hiệu quả để phân tách các cụm từ tiếng Việt, gồm cách giải quyết hai loại nhập nhằng tách từ nêu trên, đồng thời giới thiệu công cụ phần mềm tương ứng.
Trong phần trước, chúng ta đã sử dụng các biểu thức để tách nhiều loại thực thể trong văn bản tiếng Việt cũng như giới thiệu hai loại nhập nhằng phổ biến của tách từ, gồm nhập nhằng chồng lấn và nhập nhằng tổ hợp. Chi tiết hai phần xin xem bài viết tiếng Anh ở địa chỉ:
Phần 2: https://techinsight.com.vn/language/en/vietnamese-word-segmentation-part-ii/
Phần 1: https://techinsight.com.vn/language/en/vietnamese-word-segmentation-part-i/
Lê Hồng Phương – FHO
Tin liên quan: