Hệ thống đột phá này kết hợp một máy tính xách tay được đặt bên trong một balo nhỏ, một chiếc áo vest với một máy ảnh giấu kín và một túi đeo thắt lưng chứa một bộ pin cỡ bỏ túi. Thông báo âm thanh liên quan đến môi trường tức thì của người đeo được chuyển tiếp qua tai nghe Bluetooth.

Thập kỷ vừa qua đã chứng kiến những sáng kiến công nghệ được thiết kế để giúp người khiếm thị định hướng thế giới bên ngoài tốt hơn, từ gậy trắng và dải phản hồi sonar và haptic, đến các ứng dụng điện thoại thông minh cung cấp hỗ trợ định hướng và điều hướng.

Điểm chung của tất cả các giải pháp này là chúng chỉ nhằm mục đích tăng cường trải nghiệm của người dùng khiếm thị khi họ di chuyển qua các không gian công cộng. Chúng chắc chắn không thể thay thế cho chó dẫn đường mà người khiếm thị yêu mến và phụ thuộc vào rất nhiều.

Tất cả những điều này có thể sắp thay đổi nhờ có một giải pháp di động mới sáng tạo được hỗ trợ bởi phần mềm AI và bộ xử lý tiên tiến của Intel.

Hệ thống đột phá này kết hợp một máy tính xách tay được đặt bên trong một balo nhỏ, một chiếc áo vest với một máy ảnh giấu kín và một túi đeo thắt lưng chứa một bộ pin cỡ bỏ túi. Thông báo âm thanh liên quan đến môi trường tức thì của người đeo được chuyển tiếp qua tai nghe Bluetooth.

Thiết bị đột phá này là sản phẩm trí tuệ của Jagadish K. Mahendran, Kỹ sư Thị giác máy tính/Trí tuệ nhân tạo từ Viện Trí tuệ Nhân tạo trường Đại học Georgia.

Sáng chế của Mahendran đã được trao giải thưởng lớn tại cuộc thi OpenCV Spatial AI 2020, cuộc thi lớn nhất về chủ đề này trên thế giới do Intel tài trợ. Sự kiện năm nay cũng sẽ có sự góp mặt của Microsoft với tư cách là nhà tài trợ chính.

Giải thích về lý do bắt đầu nghiên cứu hệ thống mạnh mẽ của mình, Mahendran nói: “Năm ngoái, khi tôi gặp một người bạn khiếm thị, tôi đã thấy một sự trớ trêu, đó là trong khi tôi dạy robot nhìn, có nhiều người không thể nhìn thấy và cần sự giúp đỡ.”

Nâng cao giới hạn của phần cứng

Theo phản ánh ban đầu, ít nhất là đối với thế hệ điện thoại thông minh khi mà mọi thứ nên có kích thước bỏ túi, một giải pháp dưới dạng chiếc balo có vẻ hơi nặng nề, tuy nhiên cần phải có sự thay đổi trong tư duy để hiểu về sự tăng kích thước này.

Nếu một chiếc điện thoại thông minh đang thu nhỏ hình thức của một chiếc máy tính gia đình thông thường thì thiết bị đeo được của Mahendran giống như là đang thay thế một chiếc siêu máy tính hơn.

Như Mahendran giải thích: “Nếu không có mạng thần kinh độc lập Neural Compute Stick của Intel, người đeo sẽ cảm thấy như đang đeo năm thiết bị xử lý đồ họa trong balo. Mỗi chiếc nặng khoảng 113g và đó là chưa kể đến tất cả các quạt và nguồn điện cần thiết”.

“Nó sẽ vượt quá khả năng chi trả và không thực tế cho người dùng”, anh tiếp tục.

“Tuy nhiên, nhờ những mạng thần kinh độc lập này và bộ xử lý Intel Movidius, dung lượng GPU khổng lồ này được nén vào một phần cứng có kích thước bằng thanh USB, vì vậy bạn chỉ cần cắm nó ở bất cứ đâu và có thể chạy các mô hình học sâu phức tạp này. 

“Đây là lý do tại sao giải pháp mà chúng tôi đã phát triển rất đơn giản vì chúng tôi có thể bỏ mọi thứ vào một chiếc balo nhỏ có thể di chuyển, giá rẻ và có kiểu dáng rất đơn giản.”

Sự khéo léo được bổ sung ở thiết bị này nằm ở cách hệ thống được cấu hình, nó thậm chí không hề giống một thiết bị hỗ trợ. 

Tuy nhiên, thay vì chỉ khai thác một sự phát triển duy nhất, Mahendran đã thành công trong việc kết hợp nhiều sáng kiến phần mềm và phần cứng hiện đại, xây dựng nên một bản giao hưởng thực sự của các công nghệ chỉ dẫn và thông báo không gian ứng dụng AI trong cùng một hệ thống. 

Các thành phần này bao gồm một máy ảnh AI không gian, Luxonis OAK-D, được đặt phía sau các khung nhìn bên trong chiếc áo khoác, có khả năng chạy các mạng thần kinh tiên tiến và cung cấp thị giác máy tính được tăng tốc. 

Điều này có thể thực hiện được bằng cách nhúng chip video thông minh của Intel vào chính máy ảnh, cho phép thời gian phản hồi siêu nhanh và loại bỏ độ trễ. 

Physical setup of the MIRA Guidance System for the Blind

Hệ thống này cũng sử dụng bộ công cụ Intel OpenVINO cho việc dự đoán của edge AI trên chip và OpenCV – một thư viện chức năng lập trình hỗ trợ thị giác máy tính trong thời gian thực.

OpenCV có nguồn gốc từ hệ sinh thái Intel và đã đóng vai trò là cộng đồng thị giác máy tính lớn nhất thế giới trong 20 năm qua.

Định hướng môi trường

Khi đi ra ngoài, hệ thống này có thể phát hiện người qua đường, sự thay đổi độ cao ở lề đường, đèn giao thông, biển báo và những người đi bộ khác, cùng với toàn bộ đồ vật trên đường phố như thùng rác, cành cây treo và giỏ hoa.

Sau đó, người đeo sẽ được cảnh báo về sự hiện diện và hướng đi của những nguy cơ tiềm ẩn này thông qua tai nghe Bluetooth. 

Mặc dù số lượng thông tin được truyền qua có thể tùy chỉnh được nhưng hệ thống này cung cấp “các cập nhật quan trọng” không thể thay đổi liên quan đến an toàn, chẳng hạn như người đi xe đạp đang đến gần hoặc sự thay đổi độ cao lề đường.

Điều thú vị là hệ thống của Mahendran, sử dụng một số kỹ thuật và mô hình đặc trưng trong xe tự hành, có tính tương tác và người dùng có thể đặt câu hỏi cho hệ thống này trong suốt hành trình.

Chúng bao gồm lệnh “Mô tả” để xác định các đối tượng trong vùng lân cận của người dùng và hệ thống có thể cung cấp câu trả lời như “người, hướng 10 giờ hay đèn giao thông hướng 2 giờ”.

Hệ thống cũng cho phép người dùng lưu vị trí hiện tại của họ hoặc gửi cho người khác qua tin nhắn SMS.

Trong việc định cấu hình các cài đặt và tùy chọn hệ thống, Mahendran gặp phải một vấn đề chung mà tất cả các kỹ sư AI đang tìm cách cải thiện công nghệ hỗ trợ đều gặp phải, đó là điều gì dẫn đến tình trạng quá tải thông tin cho người dùng?

Mahendran nói: “Nếu có một đợt dội bom thông tin liên tục, người dùng có thể bị quá tải.”

“Đó là lý do tại sao chúng tôi muốn đảm bảo cung cấp các cập nhật quan trọng nhưng những thông tin còn lại thì có thể tùy chỉnh được.”

Hema Chamraj, Giám đốc Ủng hộ Công nghệ và AI4Good tại Intel, cho biết: “Những gì chúng ta đang thấy với kiểu sáng kiến mà Jagadish và đội ngũ của ông mang lại là sự dân chủ hoá thực sự của AI.”

“Trong một khoảng thời gian, AI đã chỉ được dành riêng cho các hệ thống chuyên biệt và bộ kỹ năng chuyên biệt, nhưng giờ đây nó đang được đưa vào cuộc sống hàng ngày”, cô nói tiếp.

“Chúng tôi đang đưa nó xuống cấp độ người tiêu dùng để nói rằng ‘đây là những thứ mà bạn có thể chỉ cần cài vào và chạy’. Công nghệ này đang dân chủ hoá các cơ hội chưa từng xuất hiện trước đây.”

Sự phát triển trong tương lai

Dưới sự bảo trợ của Hệ thống Hướng dẫn cho Người khiếm thị MIRA, bước tiếp theo của sáng kiến này là làm cho các mã, mô hình và bộ dữ liệu trở thành mã nguồn mở, cho phép các nhà đổi mới xây dựng thêm cơ sở hạ tầng hệ thống.

Sự phát triển của một nguyên mẫu hoàn toàn mới hiện đang ở giai đoạn nâng cao và nhóm đang mong muốn thực hiện thử nghiệm sâu rộng hơn nữa với người dùng khiếm thị.

Nguồn vốn trong tương lai là cần thiết để đảm bảo sự phát triển nhanh, nhưng rõ ràng vẫn còn có một câu hỏi cấp bách, quan trọng khác.

Liệu phiên bản tinh chỉnh của hệ thống có thể thay thế người bạn đồng hành của người khiếm thị – những chú chó đã cung cấp sự hỗ trợ sinh hoạt hàng ngày vô giá cho cộng đồng trong hơn một thế kỷ qua không? 

Ít nhất là ở cấp độ kỹ thuật, Mahendran hoàn toàn không nghi ngại gì. Ông cho biết: “Chó dẫn đường cực kỳ giỏi trong việc phát hiện mọi thứ, nhưng rõ ràng là chúng không thể thông báo chướng ngại vật là gì. Vì vậy, người khiếm thị sẽ mất một chút thời gian để nhận ra tình cảnh.”

“Đây là điều được gọi là nhận thức sơ khai và chỉ đạt được một phần nhỏ những gì hệ thống của chúng tôi làm được”.

Tuy nhiên, ông đưa ra lời cảnh báo ghi nhận một điều chỉ có ở người bạn tốt nhất của con người: “Nhưng tất nhiên là những chú chó có thể cung cấp một hệ thống hỗ trợ tinh thần tốt, và chắc chắn là bạn không thể ôm hay chơi đùa với một cỗ máy AI.”

Mặc dù vậy, với tốc độ chóng mặt mà các thành phần phần cứng đang thu nhỏ trong khi vẫn giữ lại và thậm chí nâng cao hiệu suất, có thể không còn lâu nữa cho đến khi chính chiếc balo sẽ không còn được dùng đến.

Yếu tố hình thức ở thế hệ tiếp theo của toàn bộ hệ thống này có thể sẽ trở nên phù hợp nhất với nhu cầu mà nó cần giải quyết.

Theo Mahendran: “Một ngày nào đó, chúng tôi sẽ có thể thực hiện nhiều quá trình xử lý phức tạp hơn cho người dùng trên những phần cứng rất đơn giản. Đó có thể là bên trong chiếc kính thông minh, và kính mắt trở thành một thiết bị đeo mà họ có thể làm được mọi thứ với nó.”

Theo Forbes

Tin liên quan: