Nếu bạn đang chung sống với một chú chó hay mèo, hãy thử quan sát chúng, và bạn sẽ biết được sơ qua về mọi thứ mà chúng ta chưa thể làm với AI.

Có thể bạn sẽ nghĩ: “Nhưng mèo của tôi chả làm gì ngoài ăn, ngủ, và liếm cả ngày.” Tuy nhiên, chính chú mèo đó lại có thể đi lại, chạy nhảy (sau đó đáp đất bằng chân), nghe ngóng, nhìn, quan sát, học hỏi, chơi đùa, trốn, cảm thấy vui, buồn, sợ hãi, nằm mơ, săn bắt, ăn uống, đánh nhau…

Những hành động trên không yêu cầu phải có “trí tuệ”, nhưng nó là những kỹ năng cơ bản, thường ngày, liên quan tới nhận thức là trí thông minh của động vật. Mỗi động vật lại có nhận thức riêng, từ những con nhện giăng lưới cho tới những chú chó huấn luyện có thể hỗ trợ người mù. Thậm chí, động vật còn có thể giao tiếp với con người, không phải qua giọng nói, mà qua ngôn ngữ hình thể và âm thanh như tiếng sủa, tiếng kêu, vẫy đuôi… để ta hiểu được ý định hay mong muốn của chúng.

Bây giờ, hãy thử nhìn lại chú mèo của bạn. Khi nó tới bên bạn, dụi vào người bạn, sau đó ngồi chờ đợi trước bát ăn hoặc cửa, thì hiển nhiên bạn sẽ biết nó đang muốn được vuốt ve, được cho ăn, hoặc được cho ra ngoài. Mèo đã học được cách tương tác với bạn để đạt được thứ nó muốn.

Đi bộ, một bài toán phức tạp

Trong số các kỹ năng nhận thức trên, ta chỉ mới có thể thực hiện sinh sản nhân tạo. Riêng việc chuyển động bằng 2 chi – tức đi bộ, có thể là một việc rất đơn giản với chúng ta, song lại vô cùng khó để có thể tái tạo trên robot. Thậm chí, ta có thể sẽ tốn tới vài thập kỷ liên tục nghiên cứu để có thể xây dựng và lập trình ra một robot có thể đi lại bằng 2 chân, mà không vấp ngã chỉ vì một viên sỏi nhỏ hay một ai đó đứng ở khoảng cách hơi gần.

Hãy nhớ rằng, em bé phải mất tới 1 năm tròn để có thể học đi, và tác vụ này hoàn toàn không đơn giản. Và đây mới chỉ là việc đi lại, chứ chưa nhắc tới các chuyển động phức tạp hơn như nhảy lò co hay chơi bóng đá.

Hiện nay, việc tạo ra một robot có thể đi bằng 2 chân, và có thể chơi các môn thể thao đồng đội, là một thử thách lớn nhất trong lĩnh vực robot tự động. Robocup 2020, được tổ chức vào năm tới tại Bordeaux đã thu hút tới khoảng 3.500 nhà nghiên cứu và 3.000 robot đi bằng 2 chân, sẽ là nơi mà khán giả có thể thấy robot vẫn còn khá lúng túng trong khi chơi, chạy, và hiển nhiên không thể xuất sắc như các cầu thủ tại World Cup.

Nhận diện không đồng nghĩa với hiểu biết

Vậy còn khả năng nhận diện đồ vật thì sao? Hiện nay ta đã có thể tạo ra các thuật toán cho tác vụ này mà? Quả nhiên, một số robot đã có thể nhận diện được các sự vật trong một hình ảnh, điều này không chứng minh cho nhận thức hay trí tuệ.

Để hiểu được nguyên nhân, bạn sẽ phải biết về cơ chế hoạt động của các thuật toán. Trong đó, phương thức được sử dụng phổ biến nhất là supervised learning, một kỹ thuật mà máy tính sẽ được cung cấp các hình ảnh và nhãn mô tả nội dung hình ảnh. Thông thường, số lượng hình ảnh sẽ nhiều hơn số lượng nhãn, và mỗi nhãn lại liên quan tới rất nhiều hình ảnh khác nhau của một sự vật trong nhiều bối cảnh, góc nhìn, điều kiện ánh sáng… khác nhau.

Cụ thể, để AI có thể nhận diện mèo, ta sẽ cần tới 1 triệu hình ảnh về mèo. Với các hình ảnh này, AI sẽ xây dựng một đại diện hình ảnh về vật thể cần nhận diện, thông qua việc tìm trung bình xuyên suốt các hình ảnh được cung cấp. Và đại diện này chỉ là một mô tả cơ bản, và không thực sự liên hệ tới thực tế. Trong khi con người có thể nhận ra đâu là mèo thông qua tiếng kêu, độ mềm của lông, mùi… thì tất cả những thông tin này đều là vô nghĩa với AI, cho dù có tân tiến tới đâu.

Để đạt được mức độ nhận thức của con người, AI sẽ cần phải có cơ thể để trải nghiệm thế giới. Tuy nhiên, kể cả vậy, thì làm sao AI có thể hiểu đồ uống là gì nếu nó không bao giờ khát, hiểu lửa là gì nếu nó không bao giờ bị bỏng, hiểu về cái lạnh nếu nó chẳng hề run rẩy? Như vậy, khi AI có thể “nhận diện” được một sự vật, nó không thực sự hiểu bản chất của sự vật đó, mà chỉ đang so sánh với các ví dụ về sự vật được cung cấp từ trước. Điều này cũng lý giải cho số lượng các vụ va chạm của xe tự lái, bởi lẽ, trong đường phố luôn là một nơi phức tạp, với quá nhiều biến đổi về người đi đường, người đi xe, và dễ gây nhầm lẫn về nhiều yếu tố khác nhau trên đường. Thậm chí, đôi lúc sự thiếu hụt trong nhận thức của AI còn đem lại những hậu quả khôn lường.

Trải nghiệm cảm nhận về thế giới

Vậy còn con người thì sao? Một đứa trẻ chỉ cần nhìn thấy chó một lần để có thể phân biệt đâu là chó (trong khi nó có thể còn chưa biết “chó” là gì). Bố mẹ, thông qua việc điểm mặt đặt tên cho từng sự việc, sự vật, sẽ giúp trẻ em có thể phát triển ngôn ngữ dựa trên các khái niệm từ trải nghiệm. Với chúng ta, điều này là hiển nhiên và vô cùng dễ dàng, nhưng thực chất lại không hề như vậy.

Để minh họa, hãy nhìn lại cuộc đời của Helen Keller, một vĩ nhân đã mất đi thính giác, thị giác, và khả năng giao tiếp từ khi mới lên 2. Người hướng dẫn của cô, bà Anne Sullivan, đã phải cố gắng dạy từ ngữ cho Helen bằng cách vẽ ký hiệu lên lòng bàn tay, sau đó cho Helen chạm vào vật tương ứng. Ban đầu, công sức của Anne Sullivan là hoàn toàn vô nghĩa, vì Helen còn không biết cả những thứ cơ bản nhất. Cho tới một này, Anne đưa Helen tới chơi ở giếng, và cho cô bé đưa tay vào dòng nước…

Đột nhiên, tôi có một nhận thức mờ nhạt về một thứ gì đó đã bị lãng quên – một cảm giác về thứ gì đó đang quay lại; và đột nhiên, bức màn bí ẩn về ngôn ngữ đã được vén lên. Lúc đó, tôi hiểu được rằng,“n-ứ-ớ-c” là một thứ lành lạnh đang chảy qua tay tôi. Và từ ngữ đó đã đánh thức tâm hồn tôi, đưa cho nó một ngọn đuốc, mang lại cho nó hy vọng, niềm vui, và sự tự do! … Hóa ra mọi thứ đều có tên, và mỗi cái tên lại hình thành trong tôi một suy nghĩ mới. Khi quay trở lại nhà, mọi thứ mà tôi chạm vào dường như đang sống dậy.”

Chính Helen Keller đã viết ra những câu chữ này, trong cuốn sách Cuộc đời của tôi, được xuất bản năm 1905. Với bà, vào ngày hôm đó, những ký tự đã mãi được ghim sâu vào thực tiễn của bà.

Trong khi lĩnh vực Machine Learning đã liên tục được phát triển, việc ghim sâu các ký hiệu số vào thế giới thật vẫn còn là một bài toán chờ được giải đáp. Và nếu ta không thể giải quyết được bài toán cần mà chưa đủ này, thì ta sẽ mãi không có được trí tuệ nhân tạo tổng quát. Do vậy, chúng ta còn rất nhiều điều phải làm với công nghệ này, và đặc biệt, cần luôn nhớ rằng, ““elephants don’t play chess”.

FPT TechInsight
Source: The Next Web

Tin liên quan: