Hiện tại các ứng dụng của doanh nghiệp đang chuyển dần từ chạy trên môi trường on-premise sang môi trường cloud để tận dụng các ưu điểm của công nghệ cloud. Đồng thời, công nghệ machine learning cũng đang được phát triển và triển khai để cải tiến, đem lại những đột phá mới cho các ứng dụng trong doanh nghiệp. Trong đó, dịch vụ quản trị ứng dụng cũng tận dụng được một số công nghệ machine learning để nâng cao khả năng hoạt động.

Hàng ngày các hệ thống quản trị ứng dụng thu thập được rất nhiều thông tin log từ hạ tầng mạng, máy ảo, hệ thống lưu trữ, các ứng dụng và các thông tin về người dùng. Với lượng lớn dữ liệu như vậy, các công cụ kiểm tra truyền thống sẽ không thể xác định được các vấn đề xảy ra không theo mẫu đã được xây dựng trước và những người quản trị hệ thống sẽ không thể phản ứng kịp trong thời gian thực. Các công cụ sử dụng machine learning sẽ có thể đáp ứng các nhu cầu đó trong việc cảnh báo các vấn đề bất qui tắc (anomaly), chuẩn bị kế hoạch đối phó với các vấn đề được dự đoán trước khi chúng làm ảnh hưởng đến toàn bộ hệ thống. Các khả năng này có thể chia ra các dạng như sau:

Xác định các vấn đề bất qui tắc (Anomaly Detection)

Thông thường, các số liệu về số lượng yêu cầu người dùng, lưu lượng ứng dụng được giám sát và phát hiện bất thường khi chúng vượt qua các giới hạn đã được xác định trước. Đối với các thông số thay đổi theo lịch (ví dụ thay đổi động theo giờ, ngày, hoặc tuần), các thay đổi này sẽ rất khó để xác định giới hạn bằng các quy tắc có trước.

Vì vậy việc ứng dụng machine learning để phân tích các số liệu trong quá khứ sẽ có thể xác định được các giới hạn này. Các thuật toán học có giám sát, mạng nơ-ron sẽ dựa trên các số liệu quá khứ này để xác định được các giới hạn min, max, xu hướng, sự tương quan và sẽ ngày càng chính xác hơn do lượng dữ liệu học hỏi ngày càng nhiều.

Bằng cách đó, công cụ có thể xác định chính xác khi nào hệ thống xảy ra bất thường. Kỹ thuật này có thể áp dụng để theo dõi thông số của 1 đối tượng cụ thể hay là so sánh thông số của các đối tượng tương tự nhau. Ví dụ 1 máy chủ web mà có lưu lượng cao hơn hẳn các máy chủ web khác trong cùng nhóm thì có thể coi là bất thường và sẽ bị gửi cảnh báo đến nhà quản trị hệ thống. Do đó việc xác định bất qui tắc sẽ giúp người quản trị nhận được các cảnh báo chính xác và kịp thời để có thể xử lý nhanh chóng.

Dự báo (Forecast)

Khi sử dụng các công cụ giám sát truyền thống, người quản trị chỉ nhận được cảnh báo sau khi vấn đề xảy ra làm ảnh hưởng đến người dùng và hoạt động của hệ thống. Trong khi đó tính năng dự báo sử dụng machine learning có thể cảnh báo nhiều vấn đề trước khi nó xảy ra hàng tuần hay hàng tháng.

Với các dữ liệu lịch sử, machine learning có thể cung cấp cho người quản trị cái nhìn chi tiết về xu hướng sử dụng và dự đoán được các giá trị này trong tương lai. Thông qua công cụ, người quản trị có thể biết bao lâu nữa thì hệ thống sẽ đạt tới giới hạn hoạt động và sẽ cần nâng cấp. Các giá trị này có thể là các thông số hê thống đồng thời cũng có thể là các thông số liên quan đến ứng dụng như số lượng người dùng, số lượng giao dịch,… giúp những người hoạch định chiến lược đưa ra những kế hoạch phù hợp cho việc phát triển trong tương lai.

Tương quan (Correlation)

Người quản trị thông thường phải phân tích các sự kiện, log để tìm ra nguyên nhân của vấn đề vì các file đó chứa nhiều thông tin hữu ích. Tuy nhiên, đối với các hệ thống phức tạp, việc dò tìm dấu vết  liên quan đến nhiều thành phần của hệ thống sẽ rất khó khăn với lượng thông tin lớn. Do vậy việc áp dụng machine learning sẽ tìm ra được sự tương quan giữa các sự kiện này, biết được luồng dữ liệu hoạt động như thế nào, giúp cho việc xác định nguyên nhân nhanh hơn rất nhiều. Các sự kiện được xác định liên quan đến nhau sẽ dựa trên một số đặc điểm như thời gian, địa chỉ IP, người dùng… Thông qua việc xác định này, một số nguy cơ tấn công có thể được phát hiện sớm ngay từ khâu chuẩn bị giúp người quản trị có thể đối phó nhanh chóng các nguy cơ này.

Hiện tại rất nhiều công cụ quản trị cho môi trường AWS đã ứng dụng những kĩ thuật này như Dynatrace, NewRelic, Splunk, Datadog… Do vậy các đối tác quản trị dịch vụ AWS (AWS Managed Service Partner) có thể tận dụng các công cụ đó để mang lại nhiều lợi ích hơn cho khách hàng trong việc giảm thiểu downtime của hệ thống, tăng cường hiệu năng và hoạch định hệ thống cho tương lai.

Nguyễn Xuân An
POTATO Tech Mag

Tin liên quan: