Bengio, 55 tuổi cùng hai nhân vật chính trong cuộc cách mạng này đã đạt được danh hiệu cao quý nhất trong ngành khoa học máy tính, giải thưởng ACM Turing, được biết tới như giải Nobel của ngành computing (tính toán). Hai người còn lại là ông Geoff Hinton, 71 tuổi, nhà nghiên cứu của Google và Yann LeCun – Giáo sư NYU, 48 tuổi, giám đốc khoa học AI tại Facebook. Chúng ta sẽ cùng tìm hiểu về lí lịch ‘khủng’ của các bố già AI này.

Yoshuo Bengio

Yoshuo Bengio là nhà khoa học máy tính nổi tiếng người Canada, ông được biết tới nhiều với công trình về mạng nơ-ron nhân tạo và học sâu. Yoshuo Bengio, Hinton, LeCun được coi là bộ ba tạo ra những tiến bộ trong học sâu của thập niên 1990, 2000. Trong khi hai người còn lại làm việc cho Google, Facebook thì Bengio ở lại với con đường học thuật. Vào tháng 10/2016, Bengio tham gia sáng lập Element AI, một tổ chức ươm tạo (incubator) tại Montreal, Canada, giúp đưa các nghiên cứu AI vào ứng dụng đời thường. Vào tháng 5/2017, Bengio gia nhập startup công nghệ về luật với vai trò là tư vấn chiến lược. Ông cũng là biên tập cho các tạp chí về công nghệ học máy hàng đầu.

Trước đó, vào cuối năm 1980, sinh viên cao học người Canada Yoshuo Bengio đã say đắm với một ý tưởng mà nhiều người không nghĩ là thú vị: xây phần mềm bắt chước cách nơ-ron xử lý dữ liệu trong não bộ. “Tôi rất tâm huyết với ý tưởng rằng chúng ta có thể hiểu được các nguyên lý làm thế nào não bộ hoạt động và từ đó xây dựng trí tuệ nhân tạo”. Bengio chia sẻ.

Hơn 20 năm sau, tới lượt ngành công nghệ say đắm ý tưởng đó. Mạng nơ-ron đứng đằng sau sự bùng nổ và phát triển gần đây của AI và hỗ trợ cho các dự án như xe tự hành và các bot gọi điện thoại gần như không thể phân biệt được với người thật.

Yann Lecun

Sinh ra ở gần Paris, Pháp, năm 1960, Yann LeCun hiện là phó chủ tịch và phụ trách nhà khoa học tại Facebook. Ông nhận bằng Diplôme d’Ingénieur từ ESIEE- Ecole Superieure d’Ingénieur en Electrotechnique et Electronique, Paris năm 1983, và bằng tiến sĩ về Khoa học máy tính từ Đại học Pierre & Marie Curie. Năm 1987, ông đã đề xuất một hình thức ban đầu của thuật toán học lan truyền ngược cho các mạng thần kinh. Từ 1987 đến 1988, ông là cộng tác viên nghiên cứu sau tiến sĩ tại phòng thí nghiệm của Geoffrey Hinton tại Đại học Toronto. Năm 1988, ông gia nhập Phòng nghiên cứu tại Phòng thí nghiệm AT&T Bell ở Holmdel, New Jersey, Hoa Kỳ, đứng đầu là Lawrence D. Jackel. Đây là nơi ông đã phát triển một số phương pháp học máy mới.

Yann LeCun đã dành phần lớn thời gian trong thập kỉ 80, 90 làm việc cùng AT&T trong vai trò là nhà nghiên cứu và cuối cùng là trưởng ban nghiên cứu xử lý hình ảnh, một trong những đơn vị xây dựng chính của công nghệ nén ảnh DjVu. Ông gia nhập NYU trong vai trò là Giáo sư khoa học máy tính khoa học Nơ-ron vào năm 2003 và trở thành trưởng phòng thí nghiệm AI Facebook trong năm 2013.

Ông đã đóng góp vô cùng to lớn trong việc phát triển mạng tích chập, đặc biệt là trong ngành nhận dạng ảnh. Tiêu biểu có thể kể đến convnets, một mạng nơ-ron được thiết kế sao cho phù hợp với các bức ảnh; ông đã chứng minh khái niệm này bằng cách xây dựng một phần mềm kiểm tra việc đọc cho các cây ATM tại Bell Labs.

Geoffrey Hinton

Geoffrey Hinton nhận bằng tiến sĩ ngành trí tuệ nhân tạo tại đại học Edinburgh vào năm 1978 và có năm năm là thành viên của khoa Khoa học máy tính tại Đại học Carnegie-Mellon. Hinton chỉ ra giải pháp huấn luyện deep network. Năm 1983, ông đồng phát minh ra máy Boltzmann, một trong những thiết bị mạng lưới thần kinh đầu tiên sử dụng xác suất thống kê. Ngày nay, công nghệ ngày đã được cải tiến và sử dụng bởi các công ty công nghệ lớn như Facebook, Amazon.

Hinton là một trong những nhà nghiên cứu đầu tiên trong lĩnh vực mạng nơ-ron. Trong quãng thời gian tại Carnegie Mellon University, ông là một trong những nhà nghiên cứu đầu tiên chứng minh thuật toán khái quát hóa lan truyền ngược (generalized back-propagation), được thực hiện năm 1985. Do thiếu năng lực tính toán tại thời điểm lúc bấy giờ, Kết quả đạt được không được khả quan khi sử dụng thuật toán mới. Sau này vào năm 2012, ông đã dùng thuật toán tương tự để huấn luyện mạng nơ-ron sâu và tạo nên một cột mốc lớn trong nhận dạng hình ảnh.

Trong thời gian công tác tại đại học Toronto, khoảnh khắc quan trọng đã đến với ông vào năm 2012, khi Hinton và hai sinh viên cao học khác giành chiến thắng một cách bất ngờ trong cuộc thi thường niên về phần mềm xác định vật thể trong ảnh. Chiến thắng của họ đã làm lu mờ các phương pháp được ưa chuộng trước kia khi phân loại chính xác hơn 100,000 ảnh thành 1000 nhóm trong 5 bước phỏng đoán với độ chính xác 85%, cao hơn 10% so với người thứ hai. Đầu năm 2013, Google đã mua lại một startup được sáng lập bởi bộ ba này. Từ đó, Hinton chuyển sang làm việc cho Google.

“Mọi người vẫn sẽ hoài nghi cho tới khi chúng tôi tạo ra các kết quả tốt hơn hẳn so với những kết quả tốt nhất ở hiện tại.” Hinton chia sẻ.

Mặc dù học sâu có rất nhiều ứng dụng thành công trong thực tế, nhưng vẫn còn nhiều điều công nghệ này chưa làm được. Mạng lưới thần kinh được lấy cảm hứng từ não bộ nhưng chưa thể đạt tới mức vận hành như não bộ. Trí thông minh mà học sâu mang lại cho máy tính có tác dụng tuyệt vời trong các tác vụ hẹp, ví dụ như chơi một trò chơi nào đó, nhận ra những âm thanh cụ thể nhưng không thể thích ứng và linh hoạt như trí thông minh của con người.

Hinton và LeCun chia sẻ rằng họ muốn chấm dứt sự phụ thuộc của các hệ thống ngày nay vào việc huấn luyện trên diện rộng bởi mọi người. Các dự án học sâu phụ thuộc vào nguồn cung cấp dữ liệu dồi dào được dán nhãn để giải thích tác vụ, đây là một hạn chế lớn, đặc biệt là trong các lĩnh vực như y học. Bengio nhấn mạnh rằng công nghệ hiện tại thành công trong vai trò là một công cụ dịch thuật nhưng chưa thể thực sự hiểu ngôn ngữ.

Không ai trong bộ ba tuyên bố biết cách giải quyết những thách thức đó. Họ khuyên bất cứ ai hi vọng tạo ra bước đột phá và được giải Turing tiếp theo trong AI sẽ vượt ra khỏi các ý tưởng chính thống, thậm chí là nghi ngờ chính những công nghệ hiện tại. Giáo sư Bengio chia sẻ: “Họ không nên theo xu hướng, ngay bây giờ xu hướng đó là học sâu”

Dù lạc quan về tương lai của công nghệ máy học và mạng lưới thần kinh, các nhà khoa học vẫn bày tỏ thái độ cảnh giác về những ứng dụng thực tế chúng có thể mang lại, đặc biệt là việc lạm dụng trong phát triển các hệ thống vũ khí.

Lê Hoàng

Phần 1: Chân dung bộ 3 ‘bố già’ AI trên thế giới

Tin liên quan:
  • 107
    Shares