Google đã công bố phát hành Model Search, một nền tảng mã nguồn mở được thiết kế để giúp các nhà nghiên cứu phát triển các mô hình học máy một cách hiệu quả và tự động. Thay vì tập trung vào một domain cụ thể, Google cho biết Model Search không phụ thuộc vào domain, khiến nó có khả năng tìm ra một kiến trúc mô hình phù hợp với một bộ dữ liệu và vấn đề trong khi giảm tối đa thời gian mã hoá và tài nguyên tính toán. 

Sự thành công của một mô hình AI phụ thuộc vào việc nó hoạt động tốt đến đâu với các khối lượng công việc khác nhau. Nhưng thiết kế một mô hình có thể khái quát tốt có thể là một thách thức cực kỳ lớn. Trong những năm gần đây, thuật toán AutoML đã xuất hiện để giúp các nhà nghiên cứu tìm ra mô hình phù hợp mà không cần thử nghiệm thủ công. Tuy nhiên, thường thì những thuật toán này nặng về tính toán và cần hàng nghìn mô hình để đào tạo.

Model Search – được xây dựng trên khung học máy TensorFlow của Google và có thể chạy trên một hoặc một số máy – bao gồm nhiều trainer, một thuật toán tìm kiếm, một thuật toán transfer learning và một cơ sở dữ liệu để lưu trữ các mô hình đã được đánh giá. Model Search chạy các thử nghiệm đào tạo và đánh giá các mô hình AI theo cách thích ứng và không đồng bộ, sao cho tất cả các trainer chia sẻ kiến thức thu được từ các thực nghiệm của chúng trong khi thực hiện từng thực nghiệm một cách độc lập. Vào đầu mỗi chu kỳ, thuật toán tìm kiếm này tra cứu tất cả các thử nghiệm đã hoàn thành và quyết định sẽ thử gì tiếp theo, sau đó nó sẽ “biến đổi” trên một trong những kiến trúc tốt nhất được tìm thấy cho đến thời điểm đó và giao lại mô hình kết quả cho trainer. 

Để cải thiện hơn nữa hiệu quả và độ chính xác, Model Search sử dụng transfer learning trong quá trình thử nghiệm. Ví dụ, nó sử dụng chắt lọc kiến thức và chia sẻ trọng số, khởi động một số biến trong mô hình từ các mô hình đã được đào tạo trước đó. Điều này cho phép đào tạo nhanh hơn, khám phá nhiều hơn qua các cơ hội mở rộng và có lẽ cho ra kiến trúc tốt hơn. 

Sau khi chạy Model Search, người dùng có thể so sánh nhiều mô hình được tìm ra trong quá trình tìm kiếm. Thêm vào đó, họ có thể tạo ra không gian tìm kiếm của riêng mình để tuỳ chỉnh các yếu tố kiến trúc trong mô hình của mình.

Google Model Search
Một ví dụ về đánh giá mô hình qua nhiều thử nghiệm. Mỗi màu đại diện cho một loại thành phần kiến trúc khác nhau.

Google cho biết rằng trong thử nghiệm nội bộ, Model Search đã cải tiến dựa trên các mô hình sản xuất với số lần lặp lại tối thiểu, đặc biệt trong các lĩnh vực phát hiện từ khoá và nhận dạng ngôn ngữ. Nó cũng thành công tìm ra một kiến trúc phù hợp cho việc phân loại hình ảnh trên bộ dữ liệu hình ảnh mã nguồn mở được khám phá nhiều CIFAR-10. 

“Chúng tôi hy vọng Model Search sẽ cung cấp cho các nhà nghiên cứu một khung linh hoạt, không phụ thuộc domain để khám phá mô hình học máy”, kỹ sư nghiên cứu của Hoogle Hanna Mazzawi và nhà khoa học nghiên cứu Xavi Gonzalvo viết trong một bài blog. “Bằng cách xây dựng dựa trên kiến thức đã có trước đó cho một domain nhất định, chúng tôi tin rằng khung này sẽ đủ mạnh mẽ để xây dựng các mô hình với hiệu suất tiên tiến về các vấn đề đã được nghiên cứu kỹ khi được cung cấp không gian tìm kiếm bao gồm các thành phần tiêu chuẩn.”

Theo VentureBeat

Tin liên quan: