Robot với khả năng ứng biến

Tại một phòng thí nghiệm thuộc Đại học California, có một cánh tay robot đang di chuyển: nó nhặt một chiếc bát màu đỏ, sau đó sử dụng chiếc bát này để đẩy một găng tay làm bếp màu xanh sang bên phải, di chuyển nó vài cm. Sau đó, nó lại bỏ chiếc bát đi và nhặt lên một lọ xịt rỗng, rồi lại quay sang sờ và xác định hình dạng của một cuốn sách. Và sau vài ngày liên tục dùng thử những vật này, cánh tay robot đã có thể phần nào hiểu được chúng, và biết nên sử dụng chúng để làm gì.

Trong tình huống trên, cánh tay robot đang sử dụng deep learning để tự học cách sử dụng các công cụ. Khi được đưa một khay gồm nhiều vật, robot này sẽ lần lượt kiểm tra chúng, thử xem điều gì sẽ xảy ra khi di chuyển các vật này và khi cho các vật tiếp xúc với nhau.

Robot sử dụng deep learning để học cách dùng các công cụ 3D. Ảnh: Annie Xie.

Khi các nhà nghiên cứu đặt ra một mục tiêu cho robot – ví dụ như cho nó ảnh của một chiếc khay gần trống và yêu cầu robot phải sắp xếp các vật sau cho giống trên ảnh – thì robot này có thể ứng biến và sử dụng các vật mà trước đó nó chưa từng thấy bao giờ – ví dụ như lấy giẻ đẩy đồ vật ra khỏi bàn. Đồng thời, nó cũng biết được, dùng một chai nước để đẩy mọi thứ ra thì nhanh hơn là nhấc từng thứ ra một. Và trước kết quả này, Chelsea Finn, cựu nghiên cứu tại phòng thí nghiệm Berkeley, hiện đang tiếp tục theo đuổi nghiên cứu này tại Đại học Stanford chia sẻ: “So với các kỹ thuật machine learning khác, thì thành tựu nói chung của cánh tay này là vô cùng ấn tượng với tôi.”

Theo Finn, việc học theo cách này sẽ giúp AI hiểu sâu hơn về sự vật và thế giới. Nếu bạn chỉ thấy một chai nước hay miếng xốp qua ảnh, thì tất nhiên, bạn sẽ nhận dạng được chúng. Tuy nhiên, bạn lại sẽ không hiểu chúng là gì và chúng được dùng để làm gì. “Kiến thức về thế giới của bạn sẽ sâu sắc hơn nếu bạn thực sự tương tác với các vật,” Finn chia sẻ.

Tuy nhiên, cách học này lại có tiến độ vô cùng chậm. Trong môi trường giả lập, AI có thể trải qua vô số ví dụ một cách nhanh chóng. Cụ thể, trước đó, AlphaZero (robot chơi cờ của DeepMinh) đã trở nên thành thạo trong cờ vây, cờ tướng, cũng như cờ vua chỉ trong 1 ngày, sau khi chơi tới hơi 20 triệu ván cờ mỗi môn trong quá trình huấn luyện.

Còn tốc độ của các robot AI thì lại không thể nhanh như vậy. Theo Jeff Mahler, đồng sáng lập của Ambidextrous – một công ty AI và robot có trụ sở tại Berkeley, California, các thành tựu chính của deep learning hầu hết là dựa vào dữ liệu được sử dụng trong huấn luyện. Ông cũng cho biết thêm rằng, “Vài chục triệu điểm dữ liệu đã có thể khiến một robot tốn tới nhiều năm liên tục để xử lý.” Và những dữ liệu này cũng không hoàn toàn đáng tin, bởi lẽ tính nhạy của các bộ cảm ứng và phần cứng đều có thể trở nên tệ hơn theo thời gian.

Chính vì vậy, đa số công trình robot có ứng dụng deep learning đều sử dụng môi trường giả lập để đẩy nhanh quá trình huấn luyện. “Robot có thể học được gì phụ thuộc vào hiệu quả của các bộ giả lập”, David Kent, nghiên cứu sinh về robot, Viện Công nghệ Georgia, Atlanta khẳng định. Và tuy rằng các bộ giả lập cũng như quá trình chuyển hóa tình huống giả lập sang đời thực đang ngày một phát triển, thì chúng vẫn sẽ không bao giờ bì kịp với độ phức tạp của thế giới thật.

Fiin tin tưởng rằng, về cuối cùng, việc sử dụng robot để học sẽ mở ra một cánh cửa lớn hơn so với việc học qua giả lập. Robot của bà đã tốn vài ngày để biết cách dùng các công cụ cơ bản, nhưng nó cũng không cần phải bị theo dõi. Bà nói: “Bạn cứ khởi động robot và thỉnh thoảng thì kiểm tra nó thôi.” Đồng thời, Finn cũng hướng tới một viễn cảnh mà trong đó, các robot có thể tự hoạt động, tự học tập ở mọi lúc – tương tự như cách con người đã từng dùng để khám phá thế giới. “Trẻ em không học thông qua việc tải dữ liệu từ trên mạng xã hội,” Schmidhuber minh họa.

Học nhiều hơn với ít dữ liệu hơn

Một em bé có thể nhận diện các ví dụ mới chỉ với vài điểm dữ liệu. Cụ thể, kể cả khi chưa từng nhìn thấy hươu cao cổ, thì một em bé vẫn có thể phát hiện chúng chỉ sau 1 hay 2 lần nhìn. Điều này là bởi lẽ, các em bé đã từng thấy nhiều sinh vật sống khác, và qua đó đã thân thuộc với các đặc điểm quan trọng của chúng.

“Transfer learning” (học chuyển giao) là phương thức để AI có thể đạt được khả năng này. Cụ thể, các kiến thức được ghi nhận từ quá trình huấn luyện cho một tác vụ khác sẽ được chuyển sang, với một cách là tái sử dụng các mạng được đào tạo trước đó làm nền tảng, thay vì bắt đầu lại từ đầu. Ở ví dụ hươu cao cổ nói trên, ta có thể sử dụng một phần của DNN có thể phân biệt một loại động vật khác để tích hợp vào hệ thống mới, giúp chúng nhận diện hươu cao cổ dễ dàng hơn.

Khắc nghiệt hơn, transfer learning cũng có thể được thực hiện thông qua việc chỉ cho mạng mới một vài, hay thậm chí là chỉ một ví dụ, và vì vậy các hệ DNN chỉ có thể dựa vào năng lực của chính nó. Ví dụ, nếu bạn muốn xây dựng một hệ thống nhận diện gương mặt để định danh tội phạm, thì một giải pháp nhanh chóng là sử dụng một DNN khác đã được huấn luyện qua hàng triệu gương mặt, và vì vậy đã nắm được các đặc điểm quan trọng là gì. Hiện nay, khi các mạng mới nhìn qua một gương mặt, nó đã có thể chỉ ra các đặc điểm có ích, sau đó so sánh các đặc điểm này với hình ảnh những người phạm tội.

Trong giải pháp trên, AI sẽ có thể nhận ra những ví dụ mới mà không phải phân tích nhiều xu hướng, từ đó thúc đẩy nhanh việc học với robot. Tuy nhiên, nếu vấn đề gặp phải nằm ngoài vùng kinh nghiệm của các DNN này, thì độ khả thi của các mạng sử dụng vẫn là một ẩn số.

Kể cả những hệ thống AI thành công nhất thế giới, như AlphaZero cũng chỉ chuyên về một lĩnh vực rất hẹp và cụ thể. Ngoài ra, tuy AI này có thể chơi cả cờ vây và cờ tướng, nhưng nó lại không thể chơi cả hai đồng thời: khi ta tái huấn luyện các kết nối và phản ứng của AI để thắng cờ vua, thì nó lại không thể chơi cờ vây được nữa. Về góc độc của con người, thì điều này khá khó hiểu, bởi lẽ chúng ta không dễ dàng quên đi những gì đã học.

Biết cách học

Sự thành công của AlphaZero không chỉ nằm ở việc học tăng cường có hiệu quả, mà còn nằm ở thuật toán giúp giới hạn số lựa chọn về các bước tiếp theo. Điều này có nghĩa là, AI này được hướng dẫn cách học tốt nhất từ một môi trường cụ thể. Và theo Collet, bước quan trọng tiếp theo trong lĩnh vực AI sẽ là giúp DNN có khả năng tự tạo ra các thuật toán như vậy, thay vì phải dựa vào code được cung cấp bởi con người.

Bổ trợ các AI với khả năng lý luận sẽ giúp chúng vượt ngoài vòng an toàn. Đồng thời, các nhà khoa học máy tính đã dành nhiều năm nghiên cứu các chương trình tổng hợp, trong đó máy tính có thể tự động code. Nếu có thể kết hợp lĩnh vực này với deep learning, thì có lẽ, DNN sẽ tiếp gần hơn tới việc mô hình hóa theo bộ não con người.

Và đã có rất nhiều người đạng thực sự thử nghiệm.

Một ví dụ về điều này trong robotic là nhà khoa học máy tính Kristen Grauman, hiện đang làm tại Facebook AI Research tại Menlo Park, California, đồng thời đang giảng dạy cách robot tự tìm tòi về các môi trường mới tại Đại học Texas. Những tác vụ này bao gồm: chọn hướng đi khi gặp cảnh vật mới và tìm ra cách sử dụng hiệu quả nhất để biết được hình thù và chức năng của sự vật. Ý tưởng nằm sau là: khiến AI đoán được xem hướng nào hoặc góc độ nào có thể giúp nó có được các dữ liệu có ích hơn cho việc học.

Như vậy, các nhà nghiên cứu hiện đang cải thiện những yếu điểm của deep learning, đồng thời cũng đang tìm kiếm các kỹ thuật giúp quá trình này đảm bảo hơn. Theo Song, có rất ít nguyên lý về deep learning, mà thay vào đó: “Nếu thứ gì đó không hoạt động, thì ta khó lòng mà biết nguyên nhân. Toàn bộ lĩnh vực này là vô cùng ngẫu nhiên. Bạn đơn thuần là thử nghiệm mọi thứ.”

Và ở hiện tại, tuy rằng các nhà nghiên cứu đã nhận ra yếu điểm của DNN, cũng như sự lệ thuộc của chúng vào những lượng dữ liệu lớn, hầu hết trong số họ lại tin rằng, công nghệ này vẫn còn tồn tại trong một thời gian dài. Thập kỷ này là thời gian của những mạng nơ-ron – với vô số tài nguyên máy tính, có thể nhận diện xu thế vô cùng tốt – và theo Clune, “là một công nghệ chưa ai biết cách cải tiến.”

AI deep learning: Càng nhiều sức mạnh, càng nhiều yếu điểm – Phần 1

FPT TechInsight
Theo Nature

Tin liên quan: