Machine Learning: Từ lý thuyết tới các thuật toán

6928

Trong khoa học máy tính, học máy là một lĩnh vực luôn không ngừng phát triển với các ứng dụng ngày một mở rộng. Cuốn sách “Understanding Machine Learning: From Theory to Algorithms”, sẽ cung cấp những kiến thức cần thiết cho các độc giả muốn làm việc trong lĩnh vực này.

“Understanding Machine Learning: From Theory to Algorithms” là một cuốn sách có độ bao hàm cao, với mọi mảng kiến thức cần thiết cho một kỹ sư trong lĩnh vực này.

Mục tiêu của cuốn sách, như được nêu trên tiêu đề, là để giúp người đọc hiểu rõ, học máy là gì. Sau khi đọc sách, độc giả sẽ có thể hiểu được cả những khái niệm, kiến thức và ứng dụng khó nhằn của học máy, cũng như nền tảng toán học phía sau nó, đồng thời đi sâu vào các thuật toán trong học máy.

Cuốn sách tuân theo một cấu trúc chuẩn mực: từng khái niệm được chia ra thành các chương riêng với những ví dụ minh họa thực tế, giúp người đọc có thể hiểu chung về học máy cũng như các mô hình toán trong nó.

Nhìn chung, cuốn sách cung cấp một nền tảng lý thuyết cơ bản nhất về học máy, cũng như tiền đề toán học để chuyển hóa những khái niệm này sang các thuật toán khả dụng.

Cuốn sách cũng bao hàm các mảng kiến thức chưa từng xuất hiện trong những cuốn sách khác, bao gồm sự phức tạp trong quá trình học, khái niệm về tính lồi (convexity) và sự ổn định, cũng như những mô hình thuật toán quan trọng như giảm gradient ngẫu nhiên (stochastic gradient descent), các mạng nơ-ron, và dự đoán đầu ra có cấu trúc (structured output learning).

Những lý thuyết mới như phương thức PAC-Bayes và compression-based bounds cũng sẽ được nhắc tới.

Được thiết kế dành cho các sinh viên bậc đại học và cao học cơ bản, cuốn sách đã làm đơn giản hóa các thuật toán và khái niệm học máy, giúp cho người đọc không có chuyên môn về thông kê, khoa học máy tính, toán học hay kỹ sư đều có thể hiểu được.

Lời mở đầu của cuốn sách khá đơn giản và ngắn gọn, kết nối với những thuật toán chính và cách ứng dụng chúng.

Nếu không sử dụng với mục đích nghiên cứu, độc giả có thể bỏ quan những lý thuyết toán học và đi thẳng vào các khái niệm, được nêu ngắn gọn và dễ hiểu trong các chương với độ dài khoảng 10 trang.

Mở đầu mỗi chương là tóm tắt mục đích của những chương này. Ngoài ra, những khái niệm toán học được chú thích vô cùng rõ ràng và chi tiết, giúp người đọc cảm thấy dễ dàng hơn trong việc hiểu chúng.

Cần lưu ý, “Understanding Machine Learning: From Theory to Algorithms” không nói cho người đọc cách để ứng dụng học máy, mà đi sâu vào cung cấp thông tin về nó. Sau khi đọc cuốn sách, người đọc có thể hiểu một cách cơ bản về học máy là gì, cũng như những khái niệm liên quan đến nó.

Đây cũng là một cuốn sách thú vị với lối viết thu hút, đi sâu vào chi tiết những không hề quá nhàm chán. Cuốn sách có tổng cộng 360 trang được chia thành 31 chương, với các bài tập thực hành không đáp án, cụ thể như mục lục dưới đây:

Mục lục

  • Giới thiệu chung

Phần I: Nền tảng

  • Khởi đầu
  • Mô hình học máy cơ bản
  • “Học” qua uniform convergence
  • Mối quan hệ đánh đổi giữa bias và complexity
  • Chiều VC (VC dimension)
  • Khả năng học không đồng đều
  • Thời gian học

Phần II: Từ lý thuyết đến thuật toán

  • Nhân tố dự đoán tuyến tính
  • Kỹ thuật Boosting
  • Chọn và xác nhận mô hình
  • Các vấn đề trong Convex learning
  • Tính chính quy và ổn định
  • Giảm gradient ngẫu nhiên (Stochastic gradient descent)
  • Máy hỗ trợ véc-tơ
  • Phương thức Kernel
  • Các vấn đề trong phân loại đa lớp (multiclass), xếp hạng (ranking), và dự đoán phức tạp (complex prediction)
  • Cây quyết định (decision tree)
  • Nhận dạng mẫu: Hàng xóm gần nhất (nearest neighbor)
  • Mạng nơ-ron thần kinh

Phần III: Các mô hình khác

  • Học trực tuyến
  • Cụm máy tính (clustering)
  • Giảm chiều dữ liệu (dimensionality reduction)
  • Các mô hình tổng hợp
  • Chọn lựa và tổng hợp đặc trưng

Phần IV: Lý thuyết nâng cao

  • Rademacher complexities (Độ phức tạp Rademacher)
  • Covering numbers
  • Chứng thực lý thuyết cơ bản về học máy
  • Multiclass learnability (Khả năng học đa lớp)
  • Compression bounds
  • PAC-Bayes

Phụ lục

  • Thuật ngữ kỹ thuật
  • Phương thức đo lường
  • Đại số tuyến tính

Xem thêm tài liệu tại ĐÂY hoặc ĐÂY

Theo TechGrabyte

Tin liên quan: