Chuyển đổi số đã trở thành yêu cầu bắt buộc đối với bất cứ doanh nghiệp nào muốn đổi mới, tăng tính sáng tạo và cạnh tranh trên thị trường toàn cầu. Dù chỉ triển khai giải pháp tự động hóa quy trình cho doanh nghiệp hay xây dựng một chương trình chuyển đổi số toàn diện, một trong những công đoạn đầu tiên không thể thiếu đó là số hóa tài liệu văn bản, trong đó nhận dạng kí tự quang học (OCR) là công nghệ cốt lõi.

akaDoc – Giải pháp số hóa tài liệu thúc đẩy chuyển đổi số.

Xuất phát từ nhu cầu đó. Anh Hoàng Anh (Thủ khoa của FU khoá 08) và cộng sự đã nghiên cứu và phát triển akaDoc – OCR Platform giúp số hóa toàn diện văn bản tài liệu trong các công ty, tổ chức. akaDoc cho phép người dùng tùy biến định nghĩa vùng dữ liệu muốn chuyển đổi, nên có thể ứng dụng cho bất kỳ loại văn bản tài liệu nào đồng thời hỗ trợ nhiều ngôn ngữ khác nhau.

Dựa trên một số giải pháp nhỏ, lẻ về OCR, các chuyên gia của FPT Software đã cho ra đời akaDoc. akaDoc tích hợp công nghệ nhận dạng kí tự quang học (OCR) cùng với các kỹ thuật hiện đại nhất của máy học, và xử lý ngôn ngữ tự nhiên (NLP) có thể giúp tiết kiệm từ 60-80% chi phí cho quy trình nhập liệu tại các công ty, tổ chức.

Sản phẩm này hỗ trợ tự động bóc tách nội dung trong ảnh chụp hoặc bản scan tài liệu và số hóa đưa vào cơ sở dữ liệu. Theo đó, người sử dụng dễ dàng tạo và lưu bản mẫu cho các loại văn bản bằng cách xác định các trường thông tin có giá trị. Các tài liệu có định dạng tương tự sẽ được tự động phân loại và xử lý để trích xuất thông tin qua đó giúp các doanh nghiệp có thể tự động hóa các quy trình nghiệp vụ.

akaDoc áp dụng các kĩ thuật xử lý ảnh để giải quyết hầu hết các lỗi phổ biến và nâng cao chất lượng ảnh tài liệu bằng cách tự động loại bỏ nhiễu, xóa phông, xoay và phóng to ảnh trước khi đưa vào trích xuất dữ liệu. Với sức mạnh của các thuật toán xử lý ngôn ngữ tự nhiên, akaDoc có thể giảm từ 60-90% các trường hợp nhận dạng sai và sử dụng dữ liệu được cập nhật làm đầu vào huấn luyện AI engine, giúp chức năng OCR ngày càng thông minh hơn theo thời gian. Nhờ đó, các doanh nghiệp có thể đưa ra quyết định nhanh chóng, đồng thời đảm bảo tính bảo mật dữ liệu và an toàn thông tin.

akaDoc tích hợp công nghệ nhận dạng kí tự quang học (OCR) cùng với các kỹ thuật hiện đại nhất của máy học, và xử lý ngôn ngữ tự nhiên (NLP).

Anh Vũ Minh Phong (PhD về AI bên US) đang tham gia nghiên cứu và phát triển akaDoc cũng cho biết: “Để làm được điều này, đội dự án đã trực tiếp xử lý phần post OCR processing, công đoạn rất phức tạp để tự động sửa kỹ tự lỗi hậu OCR. Cụ thể là áp dụng một số phương pháp máy học và xác xuất thống kê để sửa lỗi các cụm từ bị sai trong quá trình đọc và chuyển đổi thông tin trên ảnh thành chữ.”

Giải pháp này cũng hỗ trợ xây dựng hệ thống trên Cloud hoặc tại hạ tầng của khách hàng. Các bộ sản phẩm bao gồm Webserver, API SDK trên Cloud và Mobile SDK. Đội dự án cũng đã công bố toàn bộ API của nền tảng OCR để các đơn vị trong FPT nói chung và FSOFT nói riêng có thể sử dụng để phát triển các giải pháp số hóa của đơn vị mình.

Đặc biệt akaDoc là sản phẩm kết tinh trí tuệ của nhiều chuyên gia công nghệ, các du học sinh từ Mỹ, thủ khoa hay kỹ sư tài năng của các trường đại học danh tiếng như FU, Bách Khoa, Đại Học Công Nghệ hiện đang làm việc tại FPT Software. Tất cả đều chung một mục tiêu đưa akaDoc trở thành một trong những sản phẩm số hóa văn bản tài liệu tốt nhất trên thế giới.

Hiện, akaDoc đang được triển khai cho khoảng 30 doanh nghiệp, tập đoàn thuộc khối tài chính ngân hàng, bảo hiểm, chính phủ, y tế… tại Việt Nam, Malaysia và Indonesia với độ chính xác vượt trội so với các giải pháp khác. Trong thời gian tới, dựa trên nền tảng OCR của akaDoc, đội dự án sẽ tiếp tục cho ra mắt các sản phẩm/ giải pháp số hóa cùng trong hệ sinh thái bao gồm eBizCard, Skill Inventory, Customer Onboarding, Invoice Automation…

FPT Software

Tin liên quan: