Công nghệ Reinforcement Learning giúp AI đánh bại con người trong các trò chơi đấu trí như Go và StarCraft. Vậy công nghệ này có thể cải thiện và điều hành nền kinh tế tốt hơn không?

3d rendering of artificial intelligence hardware . Premium Photo

Bất bình đẳng thu nhập là một trong những vấn đề nan giải của các nước trên thế giới. Một trong những biện pháp hiệu quả có thể giải quyết vấn đề này là thuế. Cụ thể, chính phủ thu thuế thu nhập cá nhân từ người dân và sử dụng khoản đó cho các chương trình phúc lợi và các dự án vì cộng đồng. Tuy nhiên, thu thuế cũng gia tăng sự bất bình đẳng, thuế quá cao sẽ khiến người dân chán nản không làm việc, thậm chí trốn nộp thuế. Vì vậy, đây vẫn là vấn đề gây đau đầu cho các nhà hoạch định chính sách toàn cầu.

Nhóm các nhà khoa học từ công ty công nghệ Mỹ Salesforce đề xuất một giải pháp mới mang tên AI. Nhóm phát triển hệ thống tên AI Economist (tạm dịch: Chuyên gia kinh tế AI), sử dụng Reinforcement Learning – công nghệ đằng sau AlphaGo và AlpahZero của DeepMind. Hệ thống này có thể xác định các chính sách thuế tối ưu cho một nền kinh tế giả tưởng, hứa hẹn sẽ đánh giá các chính sách theo một cách hoàn toàn mới. Thành viên của nhóm Alex Trott cho biết, đây là một ý tưởng kì diệu khi ứng dụng công nghệ trong hoạch định chính sách thuế.

AI đánh giá các chính sách trên hai phương diện: Tối ưu hóa năng suất lao động, bình đẳng thu nhập và cho ra kết quả là chính sách thuế có tính công bằng cao hơn 16% so với biểu thuế lũy tiến từng phần. Điều này cho thấy chính sách thuế hiện tại của Hoa Kỳ đang có nhiều cải thiện rõ rệt.

Trong mô phỏng, bốn công nhân AI được các hệ thống Reinforcement Learning điều khiển. Bốn công nhân tương tác với một thế giới hai chiều, thu thập gỗ, đá và giao dịch các tài nguyên này với những người khác, sử dụng chúng để xây dựng nhà và kiếm tiền. Các công nhân có trình độ chuyên môn khác nhau. Công nhân có tay nghề thấp phụ trách thu thập tài nguyên, công nhân có kỹ năng cao hơn thì sẽ mua tài nguyên để xây nhà. Vào cuối năm, nhà hoạch định chính sách AI với các thuật toán Reinforcement Learning sẽ quy định mức thuế, sau đó mỗi công nhân đều phải nộp thuế theo mức quy định.

Cả hai mô hình Reinforcement Learning đều không có kiến thức về kinh tế, nhưng có thể học cách hoạch định chính sách thông qua nhiều thử nghiệm. Hệ thống có thể học được nhiều kiến thức hữu ích chỉ với bốn công nhân AI? Về lý thuyết là được, bởi vì những tương tác đơn giản giữa vài người có thể dẫn đến những hành vi rất phức tạp, chẳng hạn như AlphaGo. Mặc dù vậy, nhóm nghiên cứu đều đồng ý nên tăng số lượng công nhân trong mô phỏng nếu hệ thống được áp dụng trong thực tế.

Kiểm soát hệ thống

Mô phỏng này sử dụng mạng lưới thần kinh (Neural network) để kiểm soát công nhân và nhà hoạch định chính sách AI. Tuy nhiên, khi nhà hoạch định chính sách trở thành một AI, công nhân và nhà hoạch định chính sách sẽ liên tục thích nghi với hành động của nhau. Đây là một thách thức đối với các mô hình sử dụng Reinforcement Learning, bởi vì một chiến lược được đề ra trên nền tảng chính sách thuế có thể không hiệu quả như các chính sách khác. Nhưng mặt khác, AI có thể giải quyết vấn đề này bằng cách thao túng hệ thống. Ví dụ, một số công nhân muốn tránh thuế, họ sẽ giảm năng suất của họ để đủ điều kiện cho khung thuế thấp hơn và sau đó tăng năng suất lại. Nhóm Salesforce cho biết tương tác này giữa công nhân và nhà hoạch định chính sách giúp mô phỏng trở nên chân thực hơn.

Chính sách thuế từ hệ thống AI Economist có chút khác biệt so với các chính sách hiện hành khác. Các chính sách hiện hành có tính luỹ tiến, nghĩa là người có thu nhập cao phải nộp thuế cao hơn, hoặc tính thoái lui, tức là người có thu nhập cao được nộp đánh thuế ít hơn. Ngược lại, chính sách thuế của AI lại hợp nhất cả hai đặc tính trên, áp dụng mức thuế cao nhất cho người giàu và người nghèo, còn mức thuế thấp nhất cho người lao động có thu nhập trung bình, giúp thu hẹp khoảng cách giàu nghèo trong xã hội.

Để kiểm tra xem liệu chính sách thuế từ AI có ảnh hưởng đến hành vi của con người theo cách tương tự hay không, nhóm nghiên cứu đã thử nghiệm trên hơn 100 nhân viên phục vụ cộng đồng trên trang tìm việc làm Mechanical Turk của Amazon và tiến hành kiểm soát nhân viên y như trong trong mô phỏng. Nhóm phát hiện ra rằng, chính sách này khuyến khích các nhân viên giống hệt các công nhân AI, hứa hẹn có thể tác động tích cực đến hoạt động kinh tế trong thế giới thực.

Cải thiện không ngừng

Nền kinh tế mô phỏng trên hệ thống AI cho phép điều chỉnh các tham số và khám phá nhiều kịch bản khác nhau. Ví dụ, nhóm nghiên cứu có thể thêm các tác động của đại dịch như giãn cách xã hội, hạn chế truy cập, hay cắt giảm nhân sự. Theo Socher, việc thay đổi mô phỏng giống với tình hình thực tế có thể giúp đề ra chính sách thuế tối ưu hơn.

LeBaron cho biết khả năng tự điều chỉnh mô phỏng là một điểm cộng của hệ thống, khi các công nhân có thể tự điều chỉnh mã số thuế, khác xa so với chính sách thuế cố định hiện hành. Tuy nhiên, ông cũng cho biết hệ thống này còn nhiều hạn chế, do số đối tượng trong mô phỏng quá ít: 4 công nhân AI và 1 nhà hoạch định chính sách. Vì vậy, ông mong muốn mô phỏng sẽ có 100 nhân viên để hệ thống đạt hiệu quả hơn.

David Parkes, một nhà khoa học máy tính và nhà kinh tế tại Đại học Harvard, người cộng tác với nhóm Salesforce cũng đồng ý rằng nhóm cần tăng số lượng đối tượng trong mô phỏng. Khi có đủ nhân viên và nâng cấp thêm một vài tính năng mới như: thêm công ty vào mô phỏng, hệ thống được kỳ vọng sẽ hoạt động tốt hơn nhiều.

Mặt khác, Doyne Farmer, chuyên gia kinh tế tại Đại học Oxford cho rằng hệ thống này cần nhiều thời gian để hoàn thiện, bởi theo ông “thế giới thực quá phức tạp hơn nhiều”. Nhóm nghiên cứu cũng hiểu được cần cải thiện hệ thống nhiều hơn, để tạo ra một hệ thống toàn diện và đáng tin cậy đối với các chuyên gia kinh tế.

Theo Technology Review

Tin liên quan: