Trung Quốc đã vượt qua Mỹ trong tổng số các trích dẫn nghiên cứu về AI, có ít công ty khởi nghiệp AI được rót vốn đầu tư hơn và Quốc hội đang nhắc đến AI nhiều hơn bao giờ hết. Đó là ba xu hướng chủ yếu được nhấn mạnh trong 2021 AI Index, một báo cáo hàng năm của Đại học Stanford. Trong năm thứ tư này, AI Index ghi lại những tiến bộ trong trí tuệ nhân tạo, cũng như ảnh hưởng của công nghệ tới giáo dục, các công ty khởi nghiệp và chính sách của chính phủ. Báo cáo nêu chi tiết sự phát triển của các nhánh chủ yếu trong AI, như học sâu, nhận diện hình ảnh và phát hiện đối tượng, cũng như trong các lĩnh vực như cuộn gấp protein. 

AI Index được biên soạn bởi Stanford Institute for Human-Centered Artificial Intelligence và một uỷ ban chỉ đạo gồm 11 thành viên, cùng với những người đóng góp đến từ Đại học Harvard, OECD, Partnership on AI và SRI International. AI Index sử dụng bộ dữ liệu từ nhiều nguồn, như dữ liệu nghiên cứu AI từ arXiv, dữ liệu đầu tư từ Crunchbase và các cuộc khảo sát nhóm như Black in AI và Queer in AI. Jack Clark, người đứng đầu một nhóm OECD về đánh giá tác động của thuật toán và là cựu giám đốc chính sách của OpenAI, cho biết sự công nghiệp hoá AI cũng là một xu hướng chính được xác định trong báo cáo.

Ông nói: “Về câu chuyện này, cá nhân tôi nghĩ rằng AI đang công nghiệp hoá và chúng ta không biết làm thế nào để đánh giá tổng thể quá trình công nghiệp hoá của nó vì chúng ta thiếu rất nhiều dữ liệu mà bạn cho rằng chúng tồn tại. Và tôi nghĩ rằng đó là bởi vì AI vừa chuyển từ trạng thái “không hoạt động” sang “hoạt động đủ tốt để triển khai một cách thương mại” nhanh hơn bạn mong đợi. Điều đó có nghĩa là, mọi người đang chạy đua, bao gồm cả cộng đồng nghiên cứu, để theo kịp tốc độ triển khai thương mại”.

Các điểm quan trọng khác rút ra được từ báo cáo này là: 

  • Brazil, Ấn Độ, Canada, Singapore và Nam Phi có mức độ tuyển dụng AI cao nhất từ năm 2016 đến năm 2020, theo dữ liệu do LinkedIn cung cấp.
  • Tổng đầu tư toàn cầu, chẳng hạn như đầu tư tư nhân và mua bán, sáp nhập, đã tăng 40% trong năm 2020. Nhưng trong năm thứ 3 liên tiếp, nguồn vốn hỗ trợ khởi nghiệp AI được rót cho ít công ty khởi nghiệp hơn. 
  • Năm 2019, khoảng 2 trong số 3 sinh viên tốt nghiệp với bằng Tiến sĩ AI ở Bắc Mỹ làm việc trong ngành công nghiệp này, tăng từ 44% vào năm 2010. 
  • Phần lớn các Tiến sĩ AI tốt nghiệp đến từ bên ngoài Hoa Kỳ, và ⅘ ở lại trong nước sau khi tốt nghiệp.
  • Một phân tích tin tức trên 500.000 blog và 60.000 tin bài bằng tiếng Anh cho thấy những câu chuyện về đạo đức AI là một trong những câu chuyện liên quan đến AI phổ biến nhất trong năm 2020, bao gồm các chủ đề như Google sa thải Timnit Gebru và các sáng kiến đạo đức do Uỷ ban châu Âu, Liên hợp quốc và Vatican đưa ra.
  • Số lượng người tham dự các cuộc hội thảo lớn về nghiên cứu AI đã tăng gấp đôi trong năm 2020 khi hầu hết các nhóm đã chọn tổ chức hội thảo trực tuyến.
  • Phụ nữ chiếm 18% trong số các Tiến sĩ AI tốt nghiệp, theo khảo sát năm 2020 của Computing Research Association. 
  • Trung Quốc đã vượt qua Mỹ về tổng số trích dẫn nghiên cứu, nhưng Mỹ tiếp tục dẫn đầu trong hai thập kỷ về các trích dẫn tại các hội nghị nghiên cứu AI.
  • Dựa trên tổng số GitHub Stars, TensorFlow là thư viện phần mềm AI phổ biến nhất, sau đó là Keras và Pytorch.
  • Các bài báo liên quan đến AI trên arXiv tăng từ khoảng 5.500 vào năm 2015 đến gần 35.000 trong năm 2020.
  • Một cuộc khảo sát Queer in AI năm 2020 đã tìm ra rằng khoảng một nửa số người được hỏi đã từng bị quấy rối và phân biệt đối xử và gặp phải các vấn đề xung quanh khả năng hòa nhập.
  • Các nhà nghiên cứu học thuật dẫn đầu trong tổng số nghiên cứu được công bố thế giới. Tuy nhiên tại Mỹ, nghiên cứu của các doanh nghiệp đứng thứ hai trong khi nghiên cứu của chính phủ đứng thứ hai tại châu Âu và Trung Quốc.
  • Từ năm 2004 đến năm 2019, Đại học Carnegie Mellon (16), Học viện Công nghệ Georgia (14) và Đại học Washington (12) đã mất nhiều giảng viên chuyển sang làm việc cho ngành công nghiệp này nhất.

Phần báo cáo dành riêng cho tiến trình vượt qua các thách thức kỹ thuật nêu bật những tiến bộ trong hệ thống thị giác máy tính và mô hình ngôn ngữ, cũng như AI cho các nhiệm vụ như khám phá thuốc hay tổng hợp hoá học và phần tử hiệu quả.

Báo cáo AI Index cho thấy sự tiến bộ của các hệ thống AI có thể được sử dụng để giám sát, như hệ thống phát hiện đối tượng YOLO. Những tiến bộ đáng kể cũng đã được thực hiện với VoxCeleb, công nghệ đo khả năng nhận dạng giọng nói từ một tập dữ liệu chứa giọng nói của 6.000 người. AI Index cho thấy tỷ lệ lỗi cân bằng giảm từ khoảng 8% trong năm 2017 đến dưới 1% trong năm 2020.

Clark cho biết: “Số liệu này nói lên rằng các hệ thống AI đã có tỷ lệ lỗi cân bằng giảm từ 8% xuống khoảng 0.5%, điều đó cho bạn biết rằng khả năng này sẽ được triển khai một cách lặng lẽ trên toàn thế giới.”

Một nhóm các chuyên gia về tiến bộ kỹ thuật đã nhắc đến khả năng của AlphaFold trong việc dự đoán các protein cuộn gấp và GPT-3 như là hai trong số các hệ thống AI được bàn luận nhiều nhất của năm 2020. Mặc dù AI Index thừa nhận các kết quả mà few-shot và zero-shot learning đạt được nhờ GPT-3, báo cáo này trích dẫn một bài nghiên cứu của cựu đồng trưởng nhóm AI Đạo Đức Timnit Gebru và những tác giả khác. Bài nghiên cứu này cung cấp một cái nhìn quan trọng về các mô hình ngôn ngữ lớn và khả năng duy trì sự thiên vị của chúng. Báo cáo cũng nhắc đến một nghiên cứu được công bố tháng trước bởi OpenAI và Stanford về sự cần thiết của việc giải quyết các tác động xã hội của các mô hình ngôn ngữ lớn trước khi quá muộn. Trong một cuộc phỏng vấn với VentureBeat năm 2019, giám đốc sáng lập AI Index Yoav Shoham bày tỏ những nghi ngờ về giá trị của việc đánh giá các mô hình ngôn ngữ dựa trên hiệu suất giải quyết các nhiệm vụ hạn chế.

VentureBeat đã cập nhật nhiều thông tin từ cả hai bài báo nghiên cứu được nhắc đến ở trên. Các báo cáo khác mà VentureBeat đề cập và được trích dẫn, bao gồm State of AI của McKinsey, cho thấy rất ít tiến bộ của các nhà lãnh đạo doanh nghiệp xét về mặt giải quyết các rủi ro liên quan đến triển khai AI. Một cảnh báo khác là về sự phi dân chủ hoá của AI trong thời đại học sâu, điều mà các tác giả cho rằng có thể kéo dài sự bất bình đẳng.

Báo cáo AI Index bao gồm lời kêu gọi về việc có nhiều benchmark và thử nghiệm hơn trong các lĩnh vực thị giác máy tính, đạo đức và NLP. Như đã được chứng minh qua các benchmark, ví dụ như GLUE và SuperGLUE, Clark cho biết: “Chúng ta đang hết các thử nghiệm một cách nhanh chóng như tốc độ chúng ta xây dựng chúng.” Việc tạo ra các benchmark và thử nghiệm mới cũng là một cơ hội để tạo ra các chỉ số phản ánh giá trị con người và đo lường tiến trình giải quyết các thách thức lớn, chẳng hạn như nạn phá rừng.

Ông nói: “Tôi nghĩ rằng một trong những cách để có được trách nhiệm toàn diện cùng với nhau là có cùng một thử nghiệm để chạy cho mọi thứ, hoặc cùng một bộ thử nghiệm. Và cho đến khi chúng ta có được điều đó, việc nói về thiên vị và các vấn đề đạo đức khác của những hệ thống này sẽ thực sự mờ mịt, điều mà tôi nghĩ sẽ chỉ giữ chúng ta lại với tư cách một cộng đồng và cũng giúp những người muốn giả vờ rằng những vấn đề này không tồn tại tiếp tục giả vờ hoặc không nhắc đến chúng dễ dàng hơn. 

Trong những năm trước, AI Index đã mở rộng để nghiên cứu các công cụ như màn hình arXiv nhằm tìm kiếm các giấy tờ in trước. Global Vibrancy Tool của AI Index, công cụ phục vụ việc so sánh giữa các sáng kiến AI quốc gia, hiện đang hoạt động cho 26 quốc gia trên 23 danh mục. 

Có lẽ những gì còn thiếu trong báo cáo cũng thú vị như những gì được đưa vào. Năm nay, báo cáo đã loại bỏ dữ liệu liên quan đến tiến độ phát triển ô tô tự lái, trong khi Clark cho biết báo cáo không bao gồm thông tin về vũ khí hoàn toàn tự hành do thiếu dữ liệu. 

Theo VentureBeat

Tin liên quan: