Trong cuộc cách mạng công nghiệp lần thứ tư (CMCN 4.0), công nghệ quản lý dữ liệu và phân tích hiện nay có thể làm tăng lên đáng kể khả năng thu ngân sách cho nhà nước. Công nghệ thông tin và truyền thông cùng những xu hướng mới của CMCN 4.0 tạo ra những thách thức và cả những cơ hội cho các nhà quản lí tài chính công. Công ty Hệ thống thông tin FPT (FPT IS) có thể triển khai các công nghệ của CMCN 4.0, giúp nâng cao khả năng quản lý rủi ro và tăng nhanh số thu ngân sách.

Mỗi ngày trôi qua mà không áp dụng công nghệ phân tích vào các hoạt động cốt lõi, là một ngày nữa Chính phủ bị tổn thất tài chính 1. Chính phủ Việt Nam, giống như hầu hết chính phủ ở các nước trên thế giới, đều phải đối mặt với những hạn chế về nguồn lực và điều này chỉ được giải quyết khi số thu ngân sách được cải thiện. Cũng giống như hầu hết các nước khác, nếu chỉ dựa vào các loại thuế, Việt Nam cũng đang gặp nhiều khó khăn trong việc thu các khoản được quyền thu – một cách ngắn gọn – có thể gọi hiện tượng này là thất thu thuế (Tax Gap). Trong cuộc cách mạng công nghiệp lần thứ tư (CMCN 4.0), công nghệ quản lý dữ liệu và phân tích hiện nay có thể làm tăng lên đáng kể khả năng thu ngân sách cho nhà nước. Công nghệ thông tin và truyền thông cùng những xu hướng mới của CMCN 4.0 tạo ra những thách thức và cả những cơ hội cho các nhà quản lí tài chính công. Tuy các công nghệ mới này tạo cơ hội cho các hành vi gian lận hoặc phạm tội, các công nghệ này cũng sẽ mang đến cho các nhà chức trách nhiều phương thức hơn để phát hiện, nhận biết các hành vi đó, chỉ ra người vi phạm, và giúp thu về những khoản thu còn thiếu. Công ty Hệ thống thông tin FPT (FPT IS) có thể triển khai các công nghệ của CMCN 4.0, giúp nâng cao khả năng quản lý rủi ro và tăng nhanh số thu ngân sách.

 Công nghệ đột phá

Cách mạng công nghiệp lần thứ tư (CMCN 4.0 – 4IR Fourth Industrial Revolution) là sự hội tụ giữa các linh vực vật lí, sinh học và công nghệ số, để tạo ra các hệ thống tự quản (Autonomous system), sinh ra lượng dữ liệu khổng lồ, và cho phép phân tích lượng lớn dữ liệu lớn đó, hình thành nên các sản phẩm mới, quy trình mới và kết nối mới. Nhiều công nghệ mới đang tạo ra ảnh hưởng, và chịu ảnh hưởng ngược lại bởi sự hội tụ đó. Trí tuệ nhân tạo (AI – Artificial Intelligence) và học máy (Machine Learning), robotics và xử lý ngôn ngữ tự nhiên, nhận dạng giọng nói, nhận dạng khuôn mặt và nhận dạng hình ảnh là một số ví dụ trong số đó. Mạng Internet kết nối vạn vật (IoT – Internet of Things), một khái niệm về đến các thiết bị thông minh và máy móc thông minh tự giao tiếp, thu thập dữ liệu và chia sẻ với nhau là một ví dụ khác. Tất cả những công nghệ này đang tạo ra sự đột phá, một cách tích cực , làm thay đổi cách mà chúng ta sống, làm việc, và vui chơi.

Các công nghệ mới đang tạo ra sự đột phá, một cách tích cực , làm thay đổi cách mà chúng ta sống, làm việc, và vui chơi

Đối với việc quản lý tài chính công, không có gì quan trọng hơn khả năng thu thập, lưu trữ và phân tích một cách thông minh khối lượng lớn dữ liệu. Điều này có nghĩa rằng, những công nghệ 4.0 quan trọng nhất chính là công nghệ dữ liệu lớn và phân tích dữ liệu cao cấp, vốn đều chịu ảnh hưởng bởi trí tuệ nhân tạo (AI). Dữ liệu lớn (Big Data) không chỉ là dữ liệu có dung lượng lớn. Dữ liệu lớn được định nghĩa bởi những tính năng cơ bản của nó đều bắt đầu bằng chữ V- “Five Vs”: Dung lượng (Volume) đơn thuần ám chỉ lượng dữ liệu. Vận tốc (Velocity) là tốc độ mà dữ liệu được tạo ra và thu thập. Sự đa dạng (Variety) là nói về độ phong phú của các nguồn dữ liệu bởi nó sẽ không chỉ bị giới hạn trong các loại dữ liệu có cấu trúc của các hệ thống nghiệp vụ và quy trình nghiệp vụ. Ước tính khoảng 80% dữ liệu đều là dữ liệu phi cấu trúc. Các nguồn dữ liệu hiện nay bao gồm dữ liệu từ các mạng xã hội, nội dung điện thoại di động, video, lời nói, dữ liệu từ các thiết bị cảm biến IoT di động hoặc cố định, và dữ liệu địa lý như từ hệ thống thông tin địa lý GIS, hình ảnh vệ tinh… Tính chân thực (Veracity) đề cập đến sự thiên lệch, thông tin nhiễu và những bất thường trong dữ liệu. Cuối cùng, tính biến động (Volatility) phản ánh về việc dữ liệu có hiệu lực trong bao lâu và dữ liệu nên được lưu lại trong vòng bao lâu?

Phương thức phân tích dữ liệu mới

Cùng vối sự bùng nổ của năm đặc tính dữ liệu (5V), những công nghệ cao cấp đã được phát triển và đều xoay quanh trí tuệ nhân tạo (AI), robotics, học máy, nhận dạng và xử lý ngôn ngữ tự nhiên cùng một số linh vực khác. Sự kết hợp của dữ liệu lớn và AI đã tạo ra nhiều phương pháp phân tích dữ liệu mới, nhiều đến mức mà chúng ta có thể phân chúng vào nhiều loại khác nhau: phân tích dự đoán (Preditive analytics), phân tích hành vi (Behavioral analytics), phân tích xã hội (Social analytics), phân tích không gian địa lí (Geospatial analytics), phân tích ngữ cảnh (Contextual analytics) và phân tích nội dung (Content analytics) chỉ là một số ví dụ.

Phân tích dữ liệu lớn và trí tuệ nhân tạo cũng tạo ra một tiếp cận mới để phân tích dữ liệu. Cho tới gần đây, chúng ta định nghĩa trước các câu trả lời cụ thể  bằng cách tạo ra các cấu trúc dữ liệu trong các kho dữ liệu (Data warehouse), để chạy những câu lệnh truy vấn để trả lời cho các câu hỏi. Ngày nay, chúng ta không cần phải định nghĩa trước, những công nghệ phân tích hoàn toàn có khả năng nhận diện dữ liệu và phát hiện các mẫu đặc tính và mối quan hệ giữa chúng. Những tri thức sinh ra bởi những công cụ này có thể trả lời những câu hỏi mà con người có thể không nghĩ đến. Nói một cách ngắn gọn, phân tích dữ liệu lớn là một quy trình khai phá những lượng dữ liệu khổng lồ, phức tạp để tìm ra các đặc điểm ẩn giấu hoặc nhận dạng sự liên quan.

Phân tích dữ liệu lớn là một quy trình khai phá những lượng dữ liệu khổng lồ, phức tạp để tìm ra các đặc điểm ẩn giấu hoặc nhận dạng sự liên quan

Ứng dụng vào thực tế

Phân tích dữ liệu lớn đã được ứng dụng trên khắp thế giới và mang lại nhiều kết quả. Một trường hợp nổi tiếng đó là cách IBM’s Watson2 được dùng để chọn phương pháp điều trị cho bệnh nhân ung thư. Trong việc quản lý nhân lực, những doanh nghiệp lớn như Best Buy đều phân tích dữ liệu nhân viên của họ để tìm ra được thói quen chung nhằm thiết kế nên các chương trình khuyến khích, giảm bớt sự mệt mỏi và xác định trọng tâm tuyển dụng. Những nhà chức trách ở London đã áp dụng các thiết bị cảm biến và camera cố định, cảm biến di động trên xe buýt, thiếtbị định vị vệ tinh (GPS), điện thoại di động để nhận dạng các thói quen tham gia giao thông và thông báo lại với những người tham gia giao thông trong thực tế. Những nhà quy hoạch đô thị này sử dụng dữ liệu từ các vé thông minh để hiểu hơn về việc di chuyển và ùn tắc giao thông, hỗ trợ quy hoạch cơ sở hạ tầng.3

Những cơ quan thi hành luật pháp, từ lâu đã nhận ra rằng cách tốt nhất để đẩy lùi tội phạm là phòng ngừa ngay từ đầu. COMPSTAT – một nền tảng phân tích dữ liệu được triển khai bởi NYPD đang dần hoàn thiện hơn để có thể dự đoán được chính xác ví trị và thời gian của một hành vi phạm tội bằng việc phân tích dữ liệu và kết hợp chúng với nhiều nguồn/loại dữ liệu khác. Họ có thể điều động cảnh sát tới “điểm nóng” và truyền dữ liệu tức thời về tình hình tới đội tuần tra..4

Ở Mỹ, IRS đã triển khai một nền tảng phân tích tinh vi để phân tích việc hoàn thuế từ nguồn dữ liệu của nhiều bên thứ ba khác nhằm xác nhận danh tính và kiểm tra độ chính xác, cũng như sự đầy đủ của việc kê khai thuế. Tất cả đều được thực hiện một cách tự động trước khi bất kỳ nhà chức trách nào kiểm tra lại.5

 Giảm thất thu thuế ở Việt Nam

Không khó để nhận ra rằng công nghệ phân tích dữ liệu lớn có thể giúp cơ quan Thuế Việt Nam giảm thất thu. Thất thu thuế có thể được giảm bớt dựa trên việc thu hồi và chấp hành của ba thành phần đóng thuế: doanh nghiệp lớn, doanh nghiệp tư nhân và các nhà phân phối, kinh doanh thương mại điện tử. Nhiều vấn đề liên quan đến việc quản lý hóa đơn như việc hóa đơn bị làm giả hoặc làm sai, hoặc đơn giản là không xuất hóa đơn sau khi thực hiện giao dịch tiền mặt. Những vấn đề khác liên quan đến việc không đăng ký thành công, trạng thái hoạt động không đúng, báo cáo sai về thu nhập hoặc sơ suất trong việc duy trì tài khoản. Trong lĩnh vực thương mại điện tử, nhiều vấn đề đã xuất hiện đặc biệt liên quan đến các nền tảng trực tuyến như việc không có địa điểm cụ thể hoặc danh tính không rõ ràng.

Những phương pháp phát hiện giả mạo và quản lý rủi ro hiện nay đã từng khá hiệu quả nhưng không thể bắt kịp với lượng lớn và đa dạng các mối nguy hại như hiện nay. Những nguồn dữ liệu nội bộ thường hỗn tạp, bị dư thừa và không thống nhất. Lượng dữ liệu từ bên ngoài cũng khá hạn chế, khó tiếp cận và thường không đủ cập nhật để sử dụng. Công việc phân tích và xử lý cũng tốn nhân lực, khá thủ công và còn phải dựa trên kinh nghiệm của số ít các nhà phân tích.

Bằng việc ứng dụng phương pháp tiếp cận phân tích dữ liệu lớn, các yếu điểm của những phương pháp hiện nay có thể được khắc phục, những vấn đề về thu thuế và chấp hành nộp thuế có thể được giải quyết bằng công nghệ phân tích dữ liệu tiên tiến trên một tập dữ liệu lớn hơn nhiều. Dữ liệu của các cơ quan nhà nước và chính phủ có thể được nâng cao thông qua nhiều nguồn mới, như mạng xã hội, dữ liệu điện thoại di động, camera, dữ liệu từ các thiết bị cảm biến cố định và di động, từ ngân hàng và những cơ quan tài chính khác. Toàn bộ dữ liệu có thể được lưu trữ tại một Data Lake và được quản lý thông qua các hệ thống quản lý dữ liệu lớn như Apache’s Hadoop. Kết quả là dữ liệu cuối được tích hợp, sẽ có chất lượng cao, dễ dàng tiếp cận và thống nhất. Một hệ thống với trí tuệ nhân tạo, áp dụng khả năng học máy (Machine leaning) và học chuyên sâu (Deep learning) có thể được triển khai cùng với các mô hình phân tích hình ảnh và thời gian thực tinh vi để ghi lại được giá trị của dữ liệu và truyền tải các thông điệp tốt hơn đến khách hàng.

Một nền tảng phân tích dữ liệu lớn cho việc quản lý nộp thuế, quản lí rủi ro và nhận dạng hành vi gian lận sẽ mang lại hiệu quả kinh tế. Nền tảng này sẽ nâng cao khả năng giám sát và kiểm soát rủi ro; cải thiện hiệu quả và đẩy nhanh quán trình thanh tra/kiểm tra. Nền tảng phân tích dữ liệu lớn sẽ đưa ra kết quả dựa trên những phân tích một lượng lớn dữ liệu. Quan trọng hơn cả, một nền tảng phân tích dữ liệu lớn sẽ góp phần làm tăng lên đáng kể  số thu ngân sách cho chính phủ. Ngân sách là cần thiết để chi cho các chương trình của Chính phủ cung cấp dịch vụ, nâng cao chất lượng cuộc sống của mỗi người dân Việt Nam.

Phương pháp tiếp cận phân tích dữ liệu lớn sẽ nâng cao khả năng giám sát và kiểm soát rủi ro; cải thiện hiệu quả và đẩy nhanh quán trình thanh tra/kiểm tra

Nguồn:

1 – Accenture Consulting

2 – IBM

3 – InterAmerican Development Bank

4 – InterAmerican Development Bank

5 – Internal Revenue Service

Steven Furst – FPT IS

Tin liên quan: