Bài viết này chỉ dành cho những độc giả không có một khái niệm nào về học máy (Machine Learning) hay những người cảm thấy lạc lõng khi mọi người đều về chủ đề này.

Bạn không cần phải có một nền tảng vững chắc về công nghệ, sau khi đọc bài viết này, bạn sẽ có đủ thông tin để tham gia vào các cuộc nói chuyện ngẫu nhiên về học máy sau này.

1. Vậy học máy là gì?

Hãy bắt đầu với định nghĩa rộng, học máy là…

Chiếc máy bắt chước và thực hiện các hành vi như con người.

Chính xác là như thế nào?

Ví dụ, có một câu đố:

  • 3 – 9
  • 4 – 16
  • 8 – 64
  • 9 – ?

Bằng cách nào bạn có được đáp số là 81 vậy ???

Đó chính xác là loại hành vi mà chúng ta đang cố gắng dạy cho máy móc. Chúng ta đang cố gắng dạy cho máy móc cách “học từ kinh nghiệm”.

Các thuật toán học máy sử dụng các phương pháp tính toán để tìm hiểu thông tin trực tiếp từ dữ liệu mà không cần dựa vào phương trình định trước như một mô hình.

Các thuật toán có thể dần dần cải thiện hiệu suất của chúng khi số lượng mẫu có sẵn cho việc học ngày càng nhiều.

Các thuật toán học máy có thể tự tìm thấy các mẫu tự nhiên trong dữ liệu, tự suy ra những insight và dự đoán cả những điều chưa biết để đưa ra quyết định tốt hơn.

2. Vậy có những kỹ thuật máy học nào?

Có hai loại Kỹ thuật học máy:

  1. Học có giám sát.
  2. Học không giám sát.

Học có giám sát

Tìm các mẫu (và phát triển các mô hình dự đoán) bằng cách sử dụng cả dữ liệu đầu vào và dữ liệu đầu ra. Tất cả các kỹ thuật học tập được giám sát đều thuộc hình thức Phân loại hoặc Hồi quy.

Phân loại

Phân loại được sử dụng để dự đoán các phản ứng rời rạc.

Ví dụ: Liệu Ấn Độ sẽ THẮNG hay THUA trận đấu Cricket? Liệu một email này là SPAM hay là XÁC THỰC?

THẮNG, THUA, SPAM, XÁC THỰC là các lớp được xác định trước. Và đầu ra phải nằm trong số những lựa chọn này, tùy thuộc vào đầu vào.

Hồi quy

Hồi quy được sử dụng để dự đoán các phản ứng liên tục.

Ví dụ: Xu hướng giá thị trường chứng khoán, dự báo thời tiết,…

Học tập không giám sát

Tìm các mẫu chỉ dựa trên dữ liệu đầu vào. Kỹ thuật này rất hữu ích khi bạn không chắc chắn những gì cần tìm. Thường được sử dụng để phân tích thăm dò dữ liệu thô.

Hầu hết các kỹ thuật học tập không giám sát đều ở dạng của Cụm phân tích.

Trong Phân tích cụm, bạn nhóm các mục dữ liệu tương tự nhau ở một số giá trị đặc trưng.

Cuối cùng, những gì bạn sẽ có là nhiều nhóm khác nhau (Giả sử có A-Z các nhóm như vậy). Một mục dữ liệu (d1) trong một nhóm (A) sẽ hơi giống với các mục dữ liệu khác (d2 – dx) trong cùng một nhóm (A), nhưng d1 sẽ có những khác biệt đáng kể so với các mục dữ liệu thuộc các nhóm khác nhau (B-Z) .

Quay lại ví dụ. Câu đố ở trên là một ví dụ về kỹ thuật học tập có giám sát – kỹ thuật hồi quy.

Một số ứng dụng phổ biến của học máy mà bạn có thể biết đến:

  1. Trợ lý cá nhân Siri hoặc Google cũng ứng dụng học máy.
  2. Dự báo thời tiết ứng dụng học máy.
  3. Dự đoán chính xác kết quả một giải đấu thể thao cũng ứng dụng học máy.
  4. Chẩn đoán y tế chủ yếu ứng dụng học máy.
  5. Và một điều nữa bạn cũng sẽ thấy quen thuộc, có bao giờ bạn tự hỏi làm thế nào mà các trang web truyền thông hiển thị cho bạn các đề xuất và quảng cáo phù hợp với sở thích của bạn không? Họ cũng sử dụng học máy đó.

Hy vọng bạn thích bài viết này. Chia sẻ quan điểm của bạn ở phần bình luận bên dưới nhé!

FPT TechInsight
Theo Becoming Human

Tin liên quan: