Nhận diện khuôn mặt là một trong những mảng rộng nhất trong lĩnh vực Thị giác máy tính (computer vision). Bên cạnh các ứng dụng để mở khoá điện thoại, xác minh danh tính và thậm chí mua sắm, nhiều công ty đang tập trung đầu tư, nghiên cứu và phát triển công nghệ này để tìm ra nhiều ứng dụng hữu ích hơn cho đời sống. Sau đây, bài viết sẽ điểm lại 5 bài nghiên cứu nổi bật về ứng dụng học máy trong nhận diện khuôn mặt. 

1. Tập dữ liệu và Bộ tiêu chuẩn giúp ngăn chặn giả mạo khuôn mặt

Công nghệ nhận diện khuôn mặt ngày càng trở nên nổi bật với hàng loạt các ứng dụng hữu ích, đặc biệt ứng dụng trong bảo mật, như mở khóa điện thoại hay xác thực thanh toán. Tuy nhiên, công nghệ này cũng có một vài rủi ro, khi có thể bị các công nghệ giả mạo khuôn mặt đánh lừa. Do đó, việc ngăn chặn giả mạo khuôn mặt là cần thiết để ngăn chặn các vụ vi phạm an ninh mạng.

Nhằm hỗ trợ ngăn chặn giả mạo khuôn mặt, tác giả đưa ra một tập dữ liệu có tên là CASIASURF. Đây là tập dữ liệu mở lớn nhất về chống giả mạo khuôn mặt, bao gồm 21.000 video của 1.000 đối tượng ở các chế độ RGB, Depth và IR. Trong bài nghiên cứu, tác giả cũng trình bày một mô hình đa phương thức mới lạ làm cơ sở cho việc chống giả mạo khuôn mặt.

Tác giả và người đóng góp: Shifeng Zhang (NLPR, CASIA, UCAS, Trung Quốc), Xiaobo Wang (JD AI Research), Ajian Liu (MUST, Macao, Trung Quốc), Chenxu Zhao (JD AI Research), Jun Wan (NLPR, CASIA, UCAS, Trung Quốc), Sergio Escalera (Đại học Barcelona), Hailin Shi (JD AI Research), Zezheng Wang (JD Finance), Stan Z. Li (NLPR, CASIA, UCAS, Trung Quốc).

Xem thêm tài liệu tại ĐÂY.

2. Hệ thống nhúng cho nhận dạng và phân cụm khuôn mặt FaceNet

Trong bài nghiên cứu này, tác giả giới thiệu hệ thống nhận diện khuôn mặt mang tên FaceNet. Hệ thống này sử dụng mạng nơron tích chập (convolution neural networks) giúp tối ưu hoá quá trình nhúng. Điểm đặc biệt của hệ thống là khả năng học hỏi tự động (end-to-end learning).

Nhóm nghiên cứu đã đào tạo mạng nơ ron tích chập trên cụm CPU trong 1.000-2.000 giờ, sau đó, đưa ra đánh giá về phương pháp đã dùng trên bốn tập dữ liệu. Ấn tượng là FaceNet đã đạt độ chính xác lên tới 99,63% trên Labeled Faces trong tập Wild (LFW) và 95,12% trên cơ sở dữ liệu Youtube Faces.

Tác giả và người đóng góp: Florian Schroff, Dmitry Kalenichenko, và James Philbin, từ Google Inc.

Xem thêm tài liệu tại ĐÂY.

3. Phương pháp nhúng xác suất (Probabilistic Face Embeddings)

Các phương pháp nhúng để nhận diện khuôn mặt có thể đạt được hiệu quả cao trong phòng thí nghiệm. Các phương pháp này chụp ảnh khuôn mặt và lưu trữ dữ liệu trong một không gian ngầm. Tuy nhiên, tại các môi trường ngoài phòng thí nghiệm, các phương thức này hoàn toàn không thực hiện được, do các đặc điểm trên khuôn mặt không rõ ràng. Ví dụ như khó khăn khi nhận dạng khuôn mặt trong các video từ camera giám sát do chất lượng thấp.

Để giải quyết vấn đề này, tác giả đề xuất các phương pháp nhúng xác suất (Probabilistic Face Embeddings hay PFEs), giúp cải thiện các mô hình nhận dạng khuôn mặt.

Tác giả và người đóng góp: Yichun Shi và Anil K. Jain, Đại học Michigan State.

Xem thêm tài liệu tại ĐÂY.

4. Ảnh hưởng của nhiễu trong nhận diện khuôn mặt

Các nhà nghiên cứu từ SenseTime Research, Đại học California San Diego và Đại học Công nghệ Nanyang đã nghiên cứu ảnh hưởng của nhiễu trong các tập dữ liệu lớn về khuôn mặt. Nhiều tập dữ liệu thường bị label noise (dán nhãn nhiễu), do quy mô và tiết kiệm chi phí. Trong nghiên cứu này, tác giả tập trung vào nguồn gốc và hậu quả của nhãn nhiễu trong các mô hình nhận diện khuôn mặt. Ngoài ra, tác giả cũng xây dựng và đưa ra tập dữ liệu nhận dạng khuôn mặt mang tên IMDb-Face.

Hai trong những mục tiêu chính của nghiên cứu là khám phá ảnh hưởng của nhiễu đỗi với sản phẩm cuối cùng và xác định một phương pháp hiệu quả nhất cho nhận dạng khuôn mặt. Để làm được điều đó, nhóm đã làm sạch hai tập dữ liệu hình ảnh mở phổ biến là MegaFace và MS-Celeb-1M. Sau đó, phát hiện mô hình được đào tạo trên 32% tập dữ liệu MegaFace và 20% MS-Celeb-1M đạt được hiệu suất tương tự như mô hình được đào tạo trên toàn bộ tập dữ liệu chưa được làm sạch ban đầu.

Tác giả và người đóng góp: Fei Wang (SenseTime), Liren Chen (Đại học California San Diego), Cheng Li (SenseTime), Shiyao Huang (SenseTime), Yanjie Chen (SenseTime), Chen Qian (SenseTime), và Chen Change Loy (Đại học Công nghệ Nanyang).

Xem thêm tài liệu tại ĐÂY.

5. Tập dữ liệu nhận dạng khuôn mặt qua điệu bộ và tuổi VGGFace2

Nhiều nghiên cứu đã được thực hiện trên các mạng lưới thần kinh tích chập sâu để nhận dạng khuôn mặt. Đổi lại, nhiều tập dữ liệu lớn về hình ảnh khuôn mặt cũng được tạo ra để đào tạo những mô hình đó. Tuy nhiên, theo tác giả, các tập dữ liệu từ trước đến nay không chứa nhiều dữ liệu về thay đổi về điệu bộ và độ tuổi trên khuôn mặt.

Trong nghiên cứu này, các nhà nghiên cứu từ Đại học Oxford giới thiệu bộ dữ liệu VGGFace2. Bộ dữ liệu này chứa 3,31 triệu hình ảnh, bao gồm các hình ảnh từ các độ tuổi, dân tộc, độ chiếu sáng và điệu bộ khác nhau của 9.131 đối tượng.

Tác giả và người đóng góp: Qiong Cao, Li Shen, Weidi Xie, Omkar M. Parkhi, và Andrew Zisserman, từ Visual Geometry Group, Đại học Oxford.

Xem thêm tài liệu tại ĐÂY.

Hy vọng rằng, các bài nghiên cứu về nhận dạng khuôn mặt trên đã giúp bạn hiểu thêm về lĩnh vực này.

Theo Becominghuman.ai

Tin liên quan: