Deep learning – với các ứng dụng trong phân loại hình ảnh, nhận diện giọng nói, và phân tích hình ảnh video, đang dần trở thành làn sóng công nghệ trí tuệ nhân tạo (AI) tiếp theo.

Với deep learning, chúng ta đã mở ra rất nhiều cánh cửa năng lực mới bên trong lĩnh vực trí tuệ nhân tạo, tuy nhiên, trước đây, công nghệ này mới chỉ được giới hạn cho các nhà khoa học dữ liệu. Còn ở hiện tại, nó đã sẵn sàng để được “dân chủ hóa” – tức đã có đủ ứng dụng công nghệ cho tất cả mọi người, với rất nhiều tính năng phù hợp cho doanh nghiệp.

Ảnh: Joe McKendrick.

Deep learning – công nghệ mô phỏng logic trong não bộ con người, qua đó phân tích được các xu thế, đang dần trở thành một ứng dụng AI phổ biến trong giới doanh nghiệp. Cụ thể, có tới 53% công ty ứng dụng AI đang lên kế hoạch tích hợp deep learning vào môi trường làm việc của họ trong vòng 1 năm tới, theo một khảo sát được thực hiện trên 154 chuyên viên IT và doanh nghiệp, được thực hiện bởi ITPro Today, InformationWeek, và Interop.

Theo một báo cáo mới đây của Databricks, deep learning cũng đang thúc đẩy rất nhiều cải tiến AI mới, gây ảnh hưởng mạnh mẽ tới mọi thị trường. Báo cáo viết: “Các mô hình deep learning có thể được huấn luyện, qua đó thực hiện được các tác vụ phức tạp như nhận diện hình ảnh và giọng nói, cũng như xác định được ý nghĩa từ các dữ liệu đầu vào. Ngoài ra, những mô hình này cũng dễ được thực hiện ở quy mô lớn nếu có đủ dữ liệu, và càng nhiều dữ liệu, thì hiệu quả của chúng lại càng tốt hơn.”

Báo cáo của Databricks cũng định nghĩa deep learning là “một định dạng chuyên biệt và tiên tiến hơn của machine learning, với khả năng học end-to-end. Một thuật toán deep learning có thể xử lý lượng vô cùng lớn dữ liệu, thường là các dữ liệu riêng biệt và phi cấu trúc, sau đó thực hiện các tác vụ như phân loại. Kết quả thu được sẽ là một mô hình với khả năng thực hiện công việc phức tạp như nhận diện vật thể trong một hình ảnh, hay dịch nói trên thời gian thực.”

Sau đây là một số ứng dụng của deep learning:

  • Phân loại hình ảnh: “Đây là quá trình nhận diện và phát hiện một vật thể hoặc một đặc điểm trong một hình ảnh hoặc video định dạng số,” báo cáo cho biết. Trong bán lẻ, các mô hình deep learning cũng có thể “nhanh chóng scan và phân tích các hình ảnh bên trong cửa hàng, qua đó xác định được các thay đổi trong hàng tồn kho.”
  • Nhận diện giọng nói: “Đây là khả năng tiếp nhận và diễn giải các phát biểu, hoặc hiểu và thực hiện các lệnh giọng nói. Các mô hình deep learning có thể chuyển hóa các lệnh nói thành văn bản, sau đó sử dụng công nghệ xử lý ngôn ngữ tự nhiên (NLP) để hiểu được các lệnh này, cũng như bối cảnh của các lệnh đó.” Trong giao thông vận tải, deep learning “có thể nhận lệnh nói, giúp tài xế gọi điện và điều khiển phương tiện được bằng giọng nói – hoàn toàn không cần tới thao tác tay.”
  • Phát hiện bất thường: “Mục tiêu của kỹ thuật deep learning là nhận diện được các xu thế bất thường, không tuân theo các khuôn khổ hành vi của một hệ thống cụ thể, được tổng hợp qua hàng triệu giao dịch khác nhau. Các ứng dụng của deep learning, do đó, có thể giúp phát hiện các vụ tấn công nhằm vào những hệ thống tài chính, phát hiện lừa đảo trong giao dịch mua sắm thẻ tín dụng và đăng ký bảo hiểm, hay thậm chí là cô lập các tín hiệu cảm ứng trong những cơ sở công nghiệp, có thể là tín hiệu cảnh báo nguy hiểm.”
  • Cơ chế gợi ý: “Phân tích các hành động của người dùng, qua đó cung cấp gợi ý dựa trên hành vi của họ.”
  • Phân tích cảm xúc: “Vận dụng một số kỹ thuật phụ thuộc deep learning như xử lý ngôn ngữ tự nhiên (NLP), phân tích văn bản, và ngữ nghĩa học máy tính, để hiểu được ý kiến khách hàng, cảm xúc của người tiêu dùng, cũng như đánh giá ảnh hưởng của các chiến lược marketing.”
  • Phân tích video: “Xử lý và đánh giá nhiều luồng dữ liệu video khác nhau cho nhiều tác vụ, ví dụ như phát hiện mối đe dọa tại sân bay, ngân hàng, và sự kiện thể thao.”

Để bắt đầu với công nghệ deep learning, bạn có thể khởi đầu với các framework phổ biến như: TensorFlow, Caffe, MXNet, Keras, và PyTorch.

Theo ZDNet

Tin liên quan: