Hệ thống mới này sẽ kích hoạt được công nghệ AI cho các thiết bị gia dụng, cải thiện bảo mật dữ liệu, cũng như nâng cao hiệu năng của các thiết bị này.

Ta có thể bắt gặp công nghệ deep learning (học sâu) ở khắp mọi nơi – từ mạng xã hội cho tới các công cụ tìm kiếm. Nhánh nhỏ này của AI thậm chí còn hỗ trợ công cuộc kiểm tra sức khỏe và đo nhiệt độ cơ thể. Các nhà nghiên cứu tại MIT mới đây đã phát triển ra một hệ thống vởi khả năng tích hợp công nghệ deep learning vào trong các thiết bị nhỏ gọn hơn như chip máy tính, thiết bị đeo được, các thiết bị gia dụng, và cả hơn 250 tỷ thiết bị ‘IoT’ (Internet vạn vật) khác.

Hệ thống này được gọi là MCUNet, và có thiết kế bao gồm nhiều mạng nơ ron giúp đảm bảo tốc độ và độ chính xác cao cho công nghệ deep learning trên các thiết bị IoT có bộ nhớ và khả năng xử lý hạn chế. Công nghệ này do đó sẽ giúp mở rộng phạm vi cho các thiết bị IoT, đồng thời vẫn đảm bảo bảo mật dữ liệu.

Internet vạn vật

Internet vạn vật, hay IoT, được ra đời vào đầu thập niên 80, khi một số nghiên cứu sinh tại Đại học Carnegie Mellon, trong đó có Mike Kazar, thử kết nối một máy bán nước Cola với Internet. Hành động này phát sinh từ một nguyên nhân rất đơn giản – sự lười biếng: Họ muốn sử dụng máy tính để biết được liệu máy Cola đã có hàng chưa trước khi đi bộ xuống để mua nước. Đây là thiết bị ngoài máy tính đầu tiên có kết nối Internet, và theo Kazar, hiện là kỹ sư tại Microsoft: “Ai cũng coi nó như một trò đùa. Chẳng ai nghĩ tới một tương lai mà vạn vật đều kết nối với Internet.”

Sau sự kiện chiếc máy Cola, ngày càng có nhiều thiết bị gia dụng được tích hợp vào mạng lưới IoT hơn: từ các máy đo huyết áp tới những chiếc tủ lạnh thông minh có thể thông báo cho bạn khi bạn hết sữa trong tủ. Các thiết bị IoT thì lại sử dụng các bộ vi điều khiển– tức các chip vi tính cơ bản, không có hệ điều hành, có ít năng lực xử lý, và bộ nhớ chỉ bằng một phần nghìn so với smartphone. Chính những đặc điểm này lại khiến chúng không thể duy trì được deep learning, do đó không thể chạy các tác vụ phát hiện bất thường, khiến cho các thiết bị IoT dễ bị tin tặc tấn công.

Vậy thì phải làm sao để có thể triển khai các mạng nơ ron lên những thiết bị này? Đây là một chủ đề nghiên cứu vô cùng nóng ở hiện tại, và những doanh nghiệp như Google và ARM đều đang đào sâu về nó,” Han chia sẻ. Và bản thân anh cũng không phải là một ngoại lệ.

Trong MCUNet, nhóm nghiên cứu của Han đã đồng thiết kế hai thành phần giúp tích hợp được ‘deep learning siêu nhỏ’ – tức khả năng vận hành các mạng nơ ron trên các bộ vi điều khiển. Trong đó, một thành phần là TinyEngine – động cơ suy luận giúp điều phối nguồn lực, hoạt động tương tự như một hệ điều hành. TinyEngine được tối ưu hóa cho một cấu trúc mạng nơ ron cụ thể, được lựa chọn bởi thành phần còn lại: TinyNas – một thuật toán tìm kiếm cấu trúc nơ ron.

Thiết kế hệ thống-thuật toán

Thiết kế mạng sâu cho các bộ vi điều khiển là không hề đơn giản. Thông thường, những kỹ thuật tìm kiếm kiến trúc nơ ron sẽ sử dụng một số cấu trúc mạng khả thi theo khung có sẵn, sau đó tìm kiếm cấu trúc tối ưu nhất với độ chính xác cao và chi phí thấp. Phương thức trên tuy có cho kết quả, song lại không tối ưu, bởi lẽ, nó phù hợp khi sử dụng GPU và smartphone, song lại khó áp dụng lên các bộ vi điều khiển.

Chính vì vậy, Lin đã phát triển ra TinyNAS – một phương thức tìm kiếm kiến trúc nơ ron, giúp tạo ra các mạng với kích thước phù hợp. “Chúng tôi có nhiều bộ vi điều khiển khác nhau, với các công suất và kích thước bộ nhớ khác nhau,” Lin nói. “Do đó, chúng tôi đã phát triển ra TinyNAS để tối ưu việc tìm kiếm cho các bộ vi điều khiển này.” TinyNAS có thể tổng hợp được các mạng nơ ron gọn nhẹ nhất, với hiệu quả cao nhất cho từng bộ vi xử lý cụ thể – mà không cần tới các tham số không cần thiết. Sau đó, đội ngũ của Lin sẽ áp dụng mô hình được tổng hợp cuối cùng này lên bộ vi xử lý.

Và để vận hành mạng nơ ron này, một bộ vi xử lý cũng cần tới một cơ chế suy luận gọn nhẹ, trong khi các cơ chế thông thường luôn phải tích hợp những chỉ dẫn dành cho các tác vụ ít dùng. Các phần code thừa này sẽ không mấy ảnh hưởng tới laptop hay smartphone, song lại khá nghiêm trọng với một bộ vi-xử lý. “Các bộ này không có bộ nhớ ngoài và cũng không có đĩa, mọi thứ được bao hàm trong 1MB dữ liệu duy nhất, và chúng tôi phải tận dụng nó một cách triệt để,” Han nói. Từ đây, TinyEngine đã ra đời.

TinyEngine có khả năng tổng hợp ra các code cần thiết để vận hành mạng nơ ron mà TinyNAS tổng hợp ra. Qua đó, mọi code thừa sẽ được loại bỏ, và chỉ những gì thực sự cần mới được giữ lại. Thử nghiệm TinyEngine cho thấy, tổng kích thước code nhị phân do cơ chế này tổng hợp ra nhỏ hơn từ 1,9 tới 5 lần so với các cơ chế suy luận khác của Google và ARM. Ngoài ra, TinyEngine cũng đem lại nhiều cải tiến khác, giúp giảm thời gian vận hành và nhu cầu sử dụng bộ nhớ xuống chỉ còn một nửa. Như vậy, sau khi có TinyNAS và TinyEngine, đội ngũ của Han đã quyết định thử nghiệm MCUNet.

Thử thách đầu tiên mà hệ thống này phải thực hiện là phân loại hình ảnh. Cụ thể, các nhà nghiên cứu đã huấn luyện MCUNet với các hình ảnh được gắn nhãn thuộc bộ dữ liệu ImageNet, sau đó yêu cầu nó phân loại các hình ảnh khác. Kết quả cho thấy, khi sử dụng bộ vi điều khiển thông thường, tỷ lệ phân loại chính xác rơi vào khoảng 70,7%, cao hơn so với con số 54% trung bình ở các mạng nơ ron và cơ chế suy luận khác. “Chỉ 1% đã là rất đáng kể, do đó đây là cả một bước tiến lớn trong việc cài đặt bộ vi điều khiển,” Lin khẳng định.

Nhóm nghiên cứu cũng thu được kết quả tương tự khi sử dụng 3 loại vi điều khiển khác.

“Tiềm năng lớn”

Kết quả thử nghiệm hứa hẹn rằng, hệ thống này sẽ trở thành một tiêu chuẩn mới cho các bộ vi điều khiển. “Tiềm năng của nó là rất lớn,” Han bày tỏ.

Nghiên cứu này “sẽ mở rộng phạm vi cho các thiết kế mạng nơ ron sâu, tiến gần hơn tới tương lại có những bộ vi điều khiển nhỏ gọn với hiệu năng cao,” Kurt Keutzer, một nhà khoa học máy tính tại Đại học California Berkeley, nhận xét. Anh cũng bổ sung rằng, MCUNet có thể sẽ “đem lại năng lực thị giác máy tính cho những thiết bị gia dụng từ cơ bản nhất, hoặc giúp tạo ra được các thiết bị cảm biến chuyển động thông minh.”

Ngoài ra, với MCUNet, các thiết bị IoT sẽ được đảm bảo bảo mật hơn. Theo Han, sở dĩ có điều này là do chúng sẽ không phải chuyển dữ liệu lên Cloud nữa.

Việc phân tích dữ liệu tại chỗ sẽ giúp giảm khả năng bị đánh cắp thông tin cá nhân – bao gồm các dữ liệu nhạy cảm như thông tin về sức khỏe. Trong tương lai, Han hy vọng sẽ xuất hiện các đồng hồ thông minh sử dụng MCUNet, mà không chỉ có thể đo nhịp tim, huyết áp, lượng oxy, mà còn có thể phân tích và giải thích các dữ liệu này cho người dùng. MCUNet còn có thể mang deep learning tới các thiết bị IoT trên xe, cũng như các vùng sâu, vùng xa không có kết nối Internet.

Theo MIT News

Tin liên quan: