Cuộc tranh luận mang tính lịch sử giữa 2 nhân vật lớn về AI đã đề cập tới những câu hỏi quan trọng nhất: tạo ra các hệ thống AI hybrid, tìm các điều kiện cần của kiến thức, đồng thời nêu bật lên những khác biệt chi tiết giữa quan điểm của 2 nhân vật này.

Yoshua Bengio (bên trái), đã nghiên cứu về machine learng trong suốt vài thập kỷ, hiện ông đang điều hành MILA – một viện nghiên cứu về AI tại Montreal. Gary Marcus (bên phải), là một nhà tâm lý học tại Đại học New York, đồng thời là một nhà phê bình có tiếng về xu hướng AI hiện nay. Ảnh: MILA.

Mới đây, tại trụ sở MILA tại Montreal đã diễn ra một cuộc tranh luận kéo dài 2 tiếng giữa Gary Marcus – giáo sư tại Đại học New York, nhà kinh doanh với rất nhiều bài viết xoay quanh deep learning, với Yoshua Bengio – một người tiên phong trong lĩnh vực deep learning với rất nhiều công trình sáng tạo.

Trong buổi tranh luận này, 2 học giả đã tìm được rất nhiều tiếng nói chung, cụ thể là về hướng đi tiếp theo của công nghệ trí tuệ nhân tạo, cũng như các công trình về việc đem lý luận tới AI.

Tuy nhiên, khi buổi thảo luận rẽ hướng sang một vào thuật ngữ hay sự kiện cụ thể, thì dường như 2 người lại có những quan điểm rất khác nhau.

Trước hết, Marcus đã bắt đầu bằng việc tóm tắt lại hành trình sự nghiệp của anh, đồng thời nhấn mạnh rằng, công trình về big data đầu tiên của mình là sử dụng các kiến thức từ hồi còn nhỏ, với cương vị là một nhà khoa học về nhận thức. Thứ làm anh hứng thú với các mạng nơ-ron đã tồn tại từ những năm 1990, mà cụ thể là, “các liên kết cổ điện không thể học được những quy mô nằm ngoài không gian huấn luyện.” Trong một số trường hợp, sự thất bại của các mạng nơ-ron đã trở thành lý luận cho những đặc điểm bẩm sinh, được xây dựng thông qua quá trình tiến hóa, chứ không đơn thuần là những thứ học được.

Ông cũng chỉ ra rằng, mình chưa bao giờ nói rằng mọi người nên bỏ rơi deep learning, mà thay vào đó, ông tin rằng nó nên được tái kết cấu thành một công cụ. Ông cũng chia sẻ rằng, bản thân và Bengio từng mâu thuẫn về quan điểm, do Bengio đã phụ thuộc quá nhiều vào các “hộp đen” (tức các mạng nơ-ron). “Gần đây, Bengio lại đang đồng tình với tôi”, Marcus lại nói, cụ thể là đồng tình với quan điểm về các hệ thống AI hybrid có kết hợp machine learning và một số dạng thao túng ký hiệu.

Marcus đã chia sẻ rằng, tuy rằng ông “rất ngưỡng mộ Yoshua”, và “nghĩ rằng Yoshua nên là một hình mẫu về sự chính trực trong trí tuệ”, ông lại thất vọng về việc Bengio không công nhận mình. “Tôi muốn anh ấy dẫn nguồn về tôi, việc không ghi nguồn làm cho những cống hiến của tôi bị giảm giá trị.”

Về phía Bengio, quan tâm chính gần đây của ông là cách các mạng nơ-ron phản hồi với dữ liệu không trong phân phối (out of distribution), hay còn gọi là OOD – một vấn đề trong việc tổng quát hóa ngoài dữ liệu huấn luyện. Ông cũng đã nhắc tới một nghiên cứu mới được công bố, và đã được phê duyệt cho hội nghị ICLR tổ chức vào năm sau, cụ thể là “Một mục tiêu siêu chuyển hóa cho việc học nhằm hóa giải các cơ chế thống thường.”

Sau đó, Bengio đã làm rõ quan điểm của mình về tất cả các bài toán về AI. Theo Bengio, deep learning “không phải là một cấu trúc hay một quy trình huấn luyện cụ thể, mà là một thứ luôn chuyển động, một triết lý được hình thành khi ta thu thập thêm nhiều nguyên lý và nguyên tác.”

Ông cũng chia sẻ rằng, các chương trình tương tự “lấy cảm hứng phần lớn từ não bộ con người, đồng thời sử dụng một phương thức tối ưu hóa, hoặc phối hợp nhiều mục tiêu – nhiều phương thức tối ưu hóa trên nhiều bộ phận.”

Nhắc tới quan điểm mà ông cùng chia sẻ với Marcus, Bengio đã nói rằng, ông “hiện đang băn khoăn một chút về tầm quan trọng của nguyên lý hợp thành.” Ngoài ra, ông cũng lưu ý rằng, não bộ con người có thể kết hợp các khái niệm sẵn có theo những cách rất mới lạ. Ông nói: “Mọi người đã suy nghĩ về vấn đề này từ ít nhất là vài năm trước. Tuy rằng ta vẫn chưa thể giải quyết bài toán này, nhưng mọi người đã dần hiểu về nó.”

Trong quá trình trao đổi, Marcus cũng nhận thấy rằng, quan điểm của ông và Bengio không quá bất đồng với nhau.

Quả thật, nhìn chung thì cả hai học giả đều đồng tình rằng, các hệ thống AI cần một lối tiếp cận hybrid, trong đó một số đặc điểm là bẩm sinh, còn một số giá trị có thể được thao túng ở cấp độ cao, được gọi bằng “ký hiệu” bởi Marcus, và “biến” bởi Bengio. Cả hai cũng liên tục nhắc tới công trình của nhà khoa học Daniel Kahneman trong cuốn sách “Thinking, Fast and Slow,” trong đó nêu rằng, có 2 hệ thống suy nghĩ khác nhau – một quan điểm được đồng tình bởi cả Marcus lẫn Bengio.

Tuy nhiên, 2 người nhanh chóng tranh luận khi đi sâu vào các ví dụ. Cụ thể, khi nhắc tới hệ thống hybrid, Marcus đã hỏi Bengio rằng, “Tại sao ông lại không thỏa mãn rằng hybrid là một phần của lời giải?” Đáp lại, Bengio đã trả lời, “nó còn tùy vào việc anh nghĩ hybrid là gì…” Theo Bengio, ông không quan tâm nếu hybrid là các “thuật toán GOFAI (thuật toán AI truyền thống), như luật lệ và logic, với nhiều cảm hứng, nhưng lại vô giá trị khi được gắn vào các mạng nơ-ron.”

Marcus tin vào các ký hiệu, ông nhắc tới AlphaZero – một AI hybrid với khả năng chơi cờ vua của DeepMind. Theo ông, nó sử dụng ký hiệu thông qua Monte Carlo Tree Search (tìm kiếm cây Monte Carlo). “Bạn phải theo dõi cây của mình, và những cây này chính là những ký hiệu”, ông nói.

Bengio lại bác bỏ quan điểm rằng, tìm kiếm cây là một hệ thống ký hiệu. Thay vào đó, ông khẳng định: “Mấu chốt nằm ở từ ngữ. Bạn có thể gọi đó là ký hiệu nếu bạn muốn, nhưng với tôi thì chúng không phải, ký hiệu là phải quan tới sự bí ẩn của khái niệm.”

Theo Marcus, cả hai người đều cố gắng biến nhau thành những giả định cơ bản nhất để hạ bệ đối thủ, tuy nhiên, ông cũng cho rằng, cả hai đều có cùng một đích đến.

Dù có xảy ra tranh cãi, song Bengio và Marcus đã kết thúc êm đẹp với cái cái bắt tay.

Bengio đáp lại: “Tôi không quan tâm anh sử dụng từ như thế nào, tôi chỉ muốn xây dựng một thứ hoạt động được.”

Cả hai cũng đã trao đổi thêm về các đặc điểm bẩm sinh – cụ thể là những thứ hay được coi là cấu trúc hiển nhiên cho các hạ tầng hình thành sau đó. Theo Marcus, Bengio muốn “đặc điểm bẩm sinh nhẹ”, còn ông thì muốn “đặc điểm bẩm sinh giàu.” Bengio chia sẻ: “Tôi muốn có càng ít đặc điểm bẩm sinh càng tốt.” Còn Marcus thì nói: “Chúng ta lại tiếp tục khác nhau – tôi không muốn quá nhiều, nhưng lại muốn nhiều hơn anh.”

Trên thực tế, những khác biệt trong tranh luận là do 2 học giả có những quan điểm tương đối khác nhau. Cụ thể, Marcus thì hình dung về một hệ thống mong muốn dựa trên các quan sát về tính năng nhận thức, một cách tương đối tổng quát, trong khi Bengio thì đi sâu hơn vào chi tiết, cụ thể là vào các thí nghiệm khoa học hiện tại, cùng với những khả năng của các thí nghiệm này.

Đang xảy ra một cuộc cách mạng,” Bengio nói. “Chúng tôi hiện đang nghiên cứu. Và chúng tôi không chỉ có một thuật toán, mà còn đang liên tục xây dựng và cố gắng mở rộng bộ nguyên lý ứng dụng.”

Ở phần hỏi đáp, đã có rất nhiều câu hỏi được đưa ra, như: Tại sao lại cần kiến thức bẩm sinh trong deep learning? Liệu sử dụng ít công sức trong machine learning ở các phần “thủ công” là có nên hay không? Liệu máy tính lượng tử sẽ thay đổi AI?

Còn về vấn đề liệu AI có thể nhận thức hay không, Bengio đã nói, “Câu hỏi về sự nhận thức cần nhiều thời gian để trả lời hơn là trong khuôn khổ buổi tranh luận này.” Không ai có thể thực sự biết nhận thức là gì, xong theo Bengio, AI của hiện tại còn rất xa với nhận thức. “Các nhà triết học đã đặt ra câu hỏi rằng liệu ta có dần cho máy móc quyền con người hay không, nhưng tôi thì không nghĩ ta đã đủ hiểu câu hỏi này để có thể trả lời nó.”

Ở phần cuối của buổi chia sẻ, cả Marcus và Bengio đã có cơ hội bàn luận về vấn đề đạo đức một cách tổng quát. Một khán giả đã phát biểu rằng: “Thứ làm tôi lo ngại là chẳng có gì thật sự xác định về đạo đức trong xây dựng thuật toán AI; và với tư cách là một con người, tôi có vấn đề với điều này.”

Marcus đã trả lời rằng “theo quan điểm của tôi, lẽ thường là một cách để tạo khung cho máy móc thể hiện các giá trị, và chúng ta luôn muốn rằng, robot sẽ không làm hại con người.”

Còn với Bengio, ông cho rằng câu hỏi trên là vô cùng quan trọng, so với nhiều câu hỏi và kỹ thuật khác, thì nó “tối thiểu cũng quan trọng ngang với các câu hỏi về cách triển khai những yếu tố này, cũng như trách nhiệm của mọi người trong dây chuyền chung.”

“Ta phải đảm bảo rằng, định hướng hành động luôn mang lại những gì tốt nhất cho con người,” Bengio nói.

Và về cuối, Marcus và Bengio vẫn bất đồng về một vấn đề cuối cùng. Trong đó, Marcus khẳng định rằng, deep learning vẫn chưa đạt được các cơ chế về tái kết nối trong não bộ con người. Trong khi đó, Bengio lại khẳng định: “Đó chính là deep learning. Nó chỉ là các cổng mà ta đã có từ năm 1989.” Bengio hẳn đang nói về các cổng logic có thể được hình thành trong một mạng nơ-ron.

Tôi sẽ kết thúc phát biểu của mình với một quan điểm cuối cùng: Cổng chính là giải pháp.”

Xem đầy đủ buổi tranh luận này tại video:

Theo ZDNet

Tin liên quan: