Vào hồi tháng 2, một phòng nghiên cứu AI được thành lập bởi Elon Musk đã tuyên bố với toàn thế giới rằng: bước tiến mới nhất quá nguy hiểm để được công khai. Theo OpenAI, đây là một phần mềm ngôn ngữ có thể tạo ra những văn bản trôi chảy và tự nhiên khó có thể phát hiện, và có thể bị sử dụng để phát tán tin tức giả và spam.

Casey Chin | Getty Images

Nguy hiểm là vậy, song mới đây, 2 thạc sỹ về khoa học máy tính đã công bố một phiên bản tái tạo của phần mềm từ OpenAI này trên Internet, đồng thời cho phép download và sử dụng miễn phí.

2 người này là Aaron Gokaslan, 23 tuổi và Vanya Cohen, 24 tuổi. Họ khẳng định rằng, bản thân không hề có mong muốn gây ra nguy hiểm, và phần mềm này cũng chưa hề quá nguy hại với xã hội. Quyết định công bố phần mềm này cũng là một tuyên bố của cặp đôi với thế giới: rằng bạn không cần phải làm tại một phòng nghiên cứu được đầu tư xa xỉ, hay cầm trên tay tấm bằng tiến sỹ để tạo ra những phần mềm công nghệ cao. Cụ thể, cặp đôi đã sử dụng điện toán đám mây miễn phí của Google – một tổ chức hay đầu tư vào những viện nghiên cứu. Ngoài ra, họ cũng tin tưởng rằng, công bố phần mềm miễn phí sẽ tạo điều kiện cho khám phá, đồng thời giúp chuẩn bị trước cho những bước tiến của tương lai – cho dù ảnh hưởng đem lại là tiêu cực hay tích cực.

Theo Colen, những phần mềm ngôn ngữ như vậy thậm chí còn mang lại nhiều lợi ích, cụ thể là: “Điều này sẽ giúp mọi người tự suy ngẫm lại về vấn đề bảo mật, và cũng giúp các nhà nghiên cứu có thể chuẩn bị trước cho những vấn đề bảo mật trong tương lai”

Thí nghiệm của bộ đôi tương tự như OpenAI ở chỗ, cả hai đều huấn luyện chương trình học máy với dữ liệu văn bản được thu thập trên hàng triệu website. Qua đó, phần mềm sẽ phát hiện các xu hướng ngôn ngữ, từ đó ứng dụng những xu hướng này vào các tác vụ như dịch, điều khiển chatbot, hay tổng hợp ra văn bản theo một yêu cầu cho sẵn.

Hiện nay, phần mềm của Goksaslan và Cohen đã có thể cho ra những đoạn văn vô cùng trôi chảy. Cụ thế, khi ta mở đầu bằng “Vấn đề của Hoa Kỳ là”, phần mềm sẽ thêm vào “ở quốc gia này, mọi thứ đều được xem xét theo điểm nhìn cá nhân, và mọi người đều sống bên trong bong bóng những lời nói dối được tạo ra bởi chính họ.”

Đáng lưu ý là, đoạn văn trên khá tương tự như thử nghiệm với GPT-2 – phần mềm đã bị OpenAI ngừng công bố vì lý do nguy hiểm. Trong đó, cả hai đoạn văn đều có dấu hiệu ngôn ngữ giống những nội dung trên trang diễn đàn đa chủ đề Reddit.

Tuy nhiên, cả hai phần mềm đều chẳng thể trôi chảy hoàn toàn: Học máy có thể tìm ra những xu hướng ngôn ngữ, chứ không thật sự hiểu được về những vấn đề. Cụ thể, những đoạn văn đôi khi sẽ hơi vô lý và thiếu liên quan, và cũng không thể đưa ra những ví dụ thực tế hay điểm nhìn cá nhân.

Cũng chính vì lý do này mà nhiều nhà nghiên cứu AI đã bỏ ngoài tai cảnh báo nguy hiểm của OpenAI về mặt xã hội. Bởi lẽ, trên thực tế, con người còn có thể viết ra những thông tin sai lệch đáng tin hơn.

Trước đó, OpenAI đã từng ra thông cáo rằng, công ty biết hiện có hơn 5 nhóm đã tái tạo phần mềm GPT-2, nhưng chưa có ai công bố phiên bản hoàn toàn đầy đủ của những phần mềm này. Ngoài ra, một phiên bản “nhẹ” hơn của GPT-2 cũng đã được OpenAI công bố, sau khi loại bỏ đi các tính năng cho phép viết ra các tin tức giả. (Phiên bản này hiện có thể thử online trên OpenAI.)

Dõi theo thông cáo của OpenAI, Gokaslan và Cohen cũng đã đảm bảo rằng phần mềm của họ cũng không hề nguy hiểm. Trái lại, với phần mềm đó, họ muốn chứng minh rằng những dự án tương tự hiện đã có thể được thực hiện bởi bất kỳ ai có động lực và một ít kỹ năng lập trình. “Một học sinh cấp 3 cũng có thể làm được nếu bạn chỉ dẫn cho chúng,” Gokaslan nói.

Về phía OpenAI, ông Miles Brundage – nhân viên điều khoản, lại từ chối đánh giá độ nguy hiểm của phần mềm được tạo ra bởi cặp đôi trên. Theo ông, chưa có ai có thời gian để thực sự thử nghiệm nó, nhưng thông số được công bố cho thấy rằng phần mềm này chưa đạt hiệu quả cao như GPT-2 phiên bản đầy đủ. Ngoài ra, Brundage cũng bày tỏ rằng OpenAI rất muốn được công bố một GPT-2 đầy đủ trong tương lai, khi những rủi ro đã được hạn chế.

Brundage cũng công nhận quan điểm của bộ đôi: ngày càng có nhiều người làm ra được những phần mềm công nghệ cao, nhất là trong thời điểm dễ dàng tiếp cận tới các máy tính mạnh và AI của hiện tại. Tuy nhiên, ông cho rằng, trước khi cho ra đời một phần mềm tương tự như GPT-2, các nhà phát triển nên dè chừng, đồng thời thỏa luận trước với OpenAI về việc phát hành. Cụ thể, theo ông, OpenAI “khuyến khích các nhà lập trình liên lạc với hãng”.

Nhưng có lẽ, OpenAI nên kiểm tra hộp thư email. Theo Gokaslan và Cohen, họ đã cố liên lạc với OpenAI về phần mềm của họ thông qua tác giả chính của bài nghiên cứu kỹ thuật về GPT-2, song lại không nhận được phản hồi. OpenAI như vậy, đã không thể đưa ra các lời khuyên về bảo mật cho bộ đôi này.

Phản hồi về vấn đề này, đại diện của OpenAI giải thích rằng, nhà nghiên cứu mà bộ đôi liên lạc luôn nhận được rất nhiều email. Đồng thời, phòng nghiên cứu này của hãng sử dụng một email khác để tập trung thảo luận về các thông tin công khai liên quan tới GPT-2.

Mới đây, Gokaslan và Cohen cuối cùng cũng đã liên lạc được với OpenAI, sau khi tweet về phần mềm của họ thu hút sự chú ý của các nhà nghiên cứu AI. Bộ đôi bày tỏ sự quan tâm và ý muốn thảo luận về công trình của họ, và đồng thời cũng chia sẻ rằng, họ dự định sẽ tự viết nghiên cứu về công trình này.

Theo Wired

Tin liên quan: