Các nhà nghiên cứu tại Google DeepMind đang sử dụng AlphaZero để thử nghiệm luật chơi mới cho bộ môn cờ vua – trò chơi trí tuệ đã tồn tại nhiều thế kỷ nay.

Các nhà nghiên cứu tại Google DeepMind đang tiếp tục cuộc chiến giữa cờ và Trí tuệ nhân tạo (AI). Tuy nhiên, lần này, họ lại hợp tác với cựu nhà vô địch cờ vua thế giới Vladimir Kramnik để thiết kế và thử nghiệm các phiên bản tích hợp AI cho bộ môn này.

Với mục tiêu cải thiện thiết kế cho luật chơi cờ vua vốn đã cân bằng, đội ngũ nghiên cứu đã tìm kiếm các thay đổi tốt nhất mà họ có thể đem lại cho cờ vua, với tham vọng làm mới cơ chế đánh cờ thông qua AI.

Cụ thể, các nhà khoa học đã sử dụng AlphaZero – một hệ thống học thích ứng (adaptive learning), với khả năng tự học luật mới từ đầu cũng như đạt kỹ năng đánh cờ thượng thừa, để kiểm nghiệm 9 biến thể khác nhau của cờ vua, với sự hỗ trợ của Kramnik.

Ảnh: Wired.

Với mỗi thay đổi, AlphaZero sẽ đánh hàng chục nghìn ván cờ với chính bản thân nó, phân tích mọi nước cờ khả thi cho mọi tình thế trên bàn cờ, qua đó tổng hợp ra các chiến luật và xu thế đánh cờ mới. Sau đó, Kramnik và các nhà nghiên cứu đã thực hiện đánh giá thực tế chơi cờ khi áp dụng các thay đổi này, qua đó rút ra kết luận rằng liệu các luật chơi mới có  giúp cải thiện cờ vua hay không.

Qua hàng thế kỷ tồn tại, cờ vua đã trải qua rất nhiều bước tiến, ngày càng xuất hiện nhiều kiểu chơi nhằm cải thiện các tồn tại trong cờ vua truyền thống, hoặc làm cờ vua phức tạp hơn trong thi đấu. Việc thay đổi luật chơi có thể gây ảnh hưởng rất lớn tới chiến thuật chơi, tính khả dụng và cơ chế đánh cờ. Tuy nhiên, trong lịch sử, việc thay đổi luật cờ là hoàn toàn khả thi, thông qua việc quan sát đủ ván cờ và người chơi cờ.

Chỉ tốn vài giờ để huấn luyện một mô hình AlphaZero trong các điều luật thay đổi là chúng tôi đã có thể mô phỏng được hàng thập kỷ quan sát người chơi,”  các nhà nghiên cứu tại DeepMind chia sẻ. “Qua đó trả lời được câu hỏi ta vẫn thường thắc mắc: bàn cờ sẽ thay đổi ra sao với mỗi chiến thuật được phát triển trong từng biến thể cờ.”

Trong số các thay đổi được thử nghiệm bao gồm một số luật mới như: cho phép người chơi tự ăn quân cờ của mình, cho phép quân tốt được lùi một ô, luật “cấm nhập thành” – không cho phép nhập thành xuyên suốt cuộc chơi, và ấn định kết quả thắng thay cho kết quả hòa khi không còn nước để đi. Hệ thống AI này đã thử chơi 10.000 ván cho mỗi biến thể cờ, với tốc độ 1 nước mỗi giây, và 1.000 ván với tốc độ 1 nước mỗi phút. Ngoài ra, để xác định khách quan ảnh hưởng của việc thay đổi luật chơi lên chất lượng chơi cờ, các nhà khoa học đã xem xét một số yếu tố, trong đó bao gồm tỷ lệ hòa cờ – một yếu tố luôn được người chơi cờ quan tâm.

Tổng quan thử nghiệm cho thấy rằng, đa số biến thể đều giúp tăng tỷ lệ thắng/thua khi chơi cờ. Điều này là tương đối dễ hiểu, do một số luật chơi như “ấn định thắng khi hết nước cờ” khiến tỷ lệ hòa giảm rõ rệt. Đồng thời, các nhà nghiên cứu cũng phát hiện ra rằng, thời gian cho mỗi nước cờ gây ảnh hưởng tới tỷ lệ thắng/thua. Cụ thể, khi người chơi đánh 1 nước cờ mỗi giây, thì tỷ lệ thắng/thua cao hơn rất nhiều so với khi đánh 1 nước cờ mỗi phút.

Tỷ lệ thắng/thua cao hơn rất nhiều khi người chơi đánh 1 nước cờ mỗi giây so với khi đánh 1 nước cờ mỗi phút. Ảnh: DeepMind.

Kết quả thử nghiệm cũng chỉ ra rằng, trong đa số các ván cờ, AlphaZero thường sử dụng các nước cờ đặc trưng cho luật chơi thay đổi, thay vì tuân thủ các nước cờ truyền thống. “Điều này phần nào cho thấy rằng, các luật chơi mới là có ích và có đóng góp vào chất lượng cờ” các nhà nghiên cứu nói.

Ngoài việc phân tích thống kê lối chơi mới của AlphaZero, đội ngũ DeepMind cũng hỏi Kramnik các yếu tố khách quan hơn như vị trí, nước đi, và xu hướng chơi phát sinh từ các biến thể cờ mới. Bởi lẽ, ý kiến của người chơi sẽ thể hiện sự phố biến của các luật chơi mới này trong các cộng đồng chơi cờ vua truyền thống.

Kramnik từ lâu đã ủng hộ luật cấm nhập thành, đồng thời khẳng định rằng, luật chơi này làm cờ thú vị hơn, luật này khiến quân “vua” của cả hai phe dễ bị tấn công hơn, từ đó thúc đẩy người chơi phải tăng cường tấn công. Ông cũng chỉ ra rằng, luật “hết nước cờ = thắng” không gây nhiều ảnh hưởng tới cờ vua truyền thống.

Một kỳ thủ khác là Danny Rensch – Giám đốc Chuyên môn về cờ tại Chess.com, cũng đã nhận xét về kết quả nghiên cứu của DeepMind trong một video. Trái với Kramnik, ông lại cho rằng, luật “hết nước cờ = thắng” sẽ là luật có khả năng gây ảnh hưởng mạnh nhất tới cộng đồng chơi cờ.

Thế hòa trong cờ sẽ không thể được cải thiện chừng nào ta vẫn còn ấn định kết quả hòa khi hết nước,” Rensch nói. “Tôi tin rằng, luật chơi này sẽ không chỉ giúp người chơi mới thích cờ hơn, mà còn thật sự tác động tới các kết quả thắng/thua thường thấy.”

Cho dù AlphaZero có mạnh mẽ tới đâu thì mô hình này vẫn sẽ không thể dự đoán được chính xác những luật chơi nào sẽ được chấp nhận. Cách duy nhất để trả lời cho câu hỏi này là quan sát người chơi thử nghiệm, thay đổi và loại bỏ các biến thể cờ khác nhau.

Theo ZDNet

Tin liên quan: