Google bổ sung kỹ năng ngôn ngữ AI cho “robot giúp việc”
Một thuật toán mới của Google có thể hỗ trợ những robot tiếp nhận các hiệu lệnh phức tạp hơn từ con người…

Alphabet- Công ty mẹ của Google đang kết hợp hai dự án nghiên cứu đầy tham vọng của mình là robotics và AI xử lý ngôn ngữ trong một nỗ lực tạo ra “robot trợ giúp” có thể hiểu các lệnh bằng lời nói thay vì ngôn ngữ lập trình.
Kể từ năm 2019, Alphabet đã phát triển các robot có thể thực hiện những nhiệm vụ đơn giản như lấy đồ uống hay lau chùi các bề mặt. Lúc này, dự án vẫn trong giai đoạn “sơ khai” nên các robot vẫn còn chậm chạp. Tuy nhiên hiện tại, những robot của hãng đã được nâng cấp với khả năng xử lý ngôn ngữ được cải thiện nhờ mô hình ngôn ngữ Pathways (PaLM) của Google - một thuật toán xây dựng AI có khả năng xử lý hàng triệu tác vụ.
Sự thay đổi này đã diễn ra khi Alphabet kết hợp với một công ty mang tên Everyday Robots. Đúng như tên gọi của mình, mục tiêu của công ty này là chế tạo các robot có thể tự học hỏi từ xung quanh và đảm nhận các công việc hàng ngày tốn nhiều thời gian. Kết hợp với PaLM, robot SayCan của Everyday Robots trở thành PaLM-SayCan - một chú robot có khả năng đánh giá môi trường, nhiệm vụ hiện tại và khả năng của chính nó, sau đó chia nhiệm vụ đó thành các bước nhỏ hơn để đạt được mục tiêu mong muốn.
Mặc dù hầu hết các robot này mới được thử nghiệm trong phạm vi phòng thí nghiệm nhưng ưu điểm của PaLM-SayCan là hỗ trợ các vấn đề và nhiệm vụ đa dạng, đặc biệt là những tình huống không có kế hoạch. Điều này đã thúc đẩy nhóm Google và Everyday Robots đưa PaLM-SayCan vào nhà bếp văn phòng. Tại đây, robot này có thể được yêu cầu lấy một túi khoai tây chiên từ ngăn kéo, chọn giữa Coca và Pepsi, và thậm chí giúp con người giải quyết vấn đề nước giải khát bị đổ.

Ví dụ như khi nghe được rằng: "Tôi đã làm đổ Coca của mình, bạn có thể mang cho tôi thứ gì đó để lau nó không?". PaLM-SayCan sẽ lên kế hoạch và thực hiện các bước cần thiết để tìm một miếng bọt biển, nhặt nó lên và mang miếng bọt biển đến cho người đã làm đổ đồ uống, theo một bài đăng trên GitHub. Kết quả cũng thành công tương tự khi có người nói với PaLM-SayCan rằng họ vừa hoàn thành một buổi tập thể dục và muốn một chút thức uống và đồ ăn nhẹ để phục hồi sức khỏe hoặc họ muốn robot dọn dẹp một số vật dụng còn sót lại trên quầy bếp. PaLM-SayCan thậm chí có thể giải quyết những vấn đề này khi chúng được yêu cầu bằng tiếng Tây Ban Nha, tiếng Pháp và tiếng Trung.

Nguồn ảnh: Everyday Robots
"Lần triển khai đầu tiên này là một nỗ lực trong việc sử dụng mô hình ngôn ngữ quy mô lớn để lập kế hoạch cho một robot. Điều này không chỉ giúp mọi người có thể giao tiếp với robot thông qua văn bản hoặc giọng nói mà còn cải thiện hiệu suất tổng thể của chúng", gã khổng lồ công nghệ cho biết trong một bài đăng trên blog. “Cuộc sống có quá nhiều lệnh phức tạp mà chúng tôi muốn yêu cầu một robot gia đình có thể làm được, từ “dọn sạch ngũ cốc tôi vừa làm rơi vãi dưới ghế” đến “xào hành cho sốt mì ống” (cả hai lệnh đều chứa rất nhiều hàm ý, từ cách làm sạch ngũ cốc, vị trí của hành trong tủ lạnh và cách chế biến chúng, v.v.).
Vì AI mang lại những cải tiến về các kỹ năng như xử lý ngôn ngữ và điều hướng hoạt động, các loại robot mới gia nhập vào thị trường công nghệ, tuy nhiên, khả năng nhận lệnh của những robot này vẫn còn một vài hạn chế nhất định. Dù vậy, chúng ta hoàn toàn có thể hy vọng trong một tương lai không xa, những “quản gia robot” có thể làm được mọi thứ như trong tưởng tượng.