Nếu robot có thể hiểu được quan hệ nguyên nhân – kết quả giữa sự vật, sự việc, chúng sẽ dễ dàng truyền tải được kiến thức của mình tới các môi trường khác.

Ảnh: Viện Max Planck về các hệ thống thông minh/ MILA/ ETH Zurich.

Công trình nghiên cứu sau đây đã sử dụng nền tảng robot mở TriFinger trong một môi trường điều khiển robot mô phỏng.

Quan hệ nhân quả là một yếu tố vô cùng quan trọng để mở ra những phát triển tiếp theo cho lĩnh vực Machine Learning (học máy)” – Yoshua Bengio, nhà khoa học Deep Learning nổi tiếng, từng đạt giải Turing, đã chia sẻ trong một buổi phỏng vấn hồi năm 2019.

Tính tới nay, Deep Learning bao gồm việc học từ các bộ dữ liệu tĩnh – đã khiến AI (Trí tuệ nhân tạo) hoạt động hiệu quả trong việc tìm kiếm các mối liên hệ giữa sự vật, sự việc. Trong khi đó, những mạng nơ-ron lại không thể hiểu được quan hệ nhân quả, cũng như nguyên do tại sao lại tồn tại các mối liên hệ nói trên. Điều này đã khiến AI không thể khái quát các kiến thức đã học, do đó không thể truyền tải những kỹ năng của chúng.

Ossama Ahmed, một nghiên cứu sinh tiến sỹ tại ETH Zurich, người từng làm việc với đội ngũ của Bengio trong dự án phát triển một công cụ đánh giá khả năng phát hiện nhân quả và truyền tải kiến thức trong robot, đã chia sẻ rằng: Sự thiếu tính khái quát là một vấn đề lớn. “Robot thường được huấn luyện qua mô phỏng, song khi được triển khai ở ngoài đời thực thì chúng lại không thành công trong việc truyền tải các kiến thức đã học được. Một lý giải cho hiện tượng này là do sự khác biệt về cơ chế vật lý giữa thế giới mô phỏng và thế giới thực,” Ahmed nói. Theo anh, công cụ đánh giá CausalWorld cũng đã chứng minh rằng: Với các kỹ thuật ở hiện tại, khả năng khái quát của robot là chưa đủ, khó có thể “triển khai được một cách an toàn trong mọi tình huống ngoài đời thực.”

Nghiên cứu về CausalWorld đã mô tả các thang đo hiệu quả của robot trong một môi trường điều khiển robot mô phỏng, thông qua nền tảng robot mở TriFinger. Được biết, mục tiêu chính của thang đo này là để đẩy nhanh quá trình nghiên cứu về cấu trúc nhân quả và truyền đạt kiến thức trong mô trường mô phỏng này. Trong đó, robot sẽ được giao các nhiệm vụ bao gồm đẩy, xếp, đặt… tương tự như cách trẻ em chơi với các khối đồ chơi, qua đó xây dựng được những cấu trúc phức tạp hơn. Có nhiều tham số được sử dụng trong thang đo này, bao gồm khối lượng, hình dạng, bề ngoài của các khối, và cả các tham số về chính robot – mà người dùng có thể tùy chỉnh để đánh giá khả năng khái quát hóa của các robot này.

Trong nghiên cứu, các nhà khoa học đã giao cho những robot nhiều tác vụ khác nhau, từ đơn giản tới phức tạp, và dựa trên ba chương trình học. Cụ thể, chương trình thứ nhất không xuất hiện các thay đổi trong môi trường, chương trình thứ hai có thay đổi một biến duy nhất, còn chương trình thứ ba sẽ có sự thay đổi ngẫu nhiên mọi biến trong môi trường. Kết quả cho thấy rằng, chương trình càng phức tạp thì các robot càng ít có khả năng thích ứng.

Nếu ta cứ tiếp tục mở rộng quy mô huấn luyện và các kiến trúc hệ thống, thì các phương thức hiện tại sẽ có thể giải quyết được nhiều môi trường mà chúng tôi đề xuất với CausalWorld hơn,” Frederik Träuble, một tác giả của nghiên cứu, đã bày tỏ. Ông cũng bổ sung rằng: “Tuy nhiên, điều thú vị là, con người vẫn có khả năng khái quát nhanh hơn mà không cần tới nhiều kinh nghiệm… Chúng ta có thể học được các quy tắc chung giữa nhiều môi trường và sử dụng những quy tắc này trong những môi trường mới, mà chưa từng được trải nghiệm trước đó.”

Trong khi đó, một mạng nơ-ron tiêu chuẩn sẽ cần nhiều kinh nghiệm, ở nhiều môi trường khác nhau để thực hiện được điều tương tự. “Nếu tồn tại một mô hình kiến trúc, hay một phương thức nào đó học được các quy tắc tiềm ẩn, các cơ chế nhân quả và rồi tận dụng được chúng, thì những vấn đề trên sẽ tự động được giải quyết”, Träuble nói.

Ahmed và Träuble cũng khẳng định rằng, các giao thức tiến hóa của CausalWorld linh hoạt hơn rất nhiều so với nhiều công trình trước đó. Điều này có nghĩa là người dùng có thể thoải mái thay đổi các biến trong môi trường, và rút ra các kết luận có hệ thống về các khái quát mà robot đưa ra. Họ cũng cho rằng, thử thách tiếp theo sẽ nằm ở việc có thể tận dụng được các công cụ bên trong CausalWorld để xây dựng những hệ thống khái quát hơn.

Vào năm 2019, Yoshua Bengio đã khẳng định rằng, các mạng nơ-ron của vài năm sau cũng chẳng thể thông minh hơn một đứa bé hai tuổi. Mặc dù khả năng xử lý song song trên quy mô lớn của các mạng nơ-ron này đã đem tới nhiều đột phá trong các lĩnh vực như thị giác máy tính, dịch thuật và ghi nhớ, hướng nghiên cứu của hiện tại đang chuyển sang việc phát triển các kiến trúc sâu mới mẻ hơn, đào tạo các khung hệ thống cho việc lý luận, lên kế hoạch, hiểu nhân quả, và khái quát hóa. “Tôi tin rằng, đây mới chỉ là khởi đầu cho một công nghệ mới dựa trên não bộ, và chúng ta đã có đủ công cụ để bắt đầu”, Bengio bày tỏ.

Theo IEEE Spectrum

Tin liên quan: