Google bổ sung kỹ năng ngôn ngữ AI cho “robot giúp việc”
Đức Mạnh
22/08/2022
Một thuật toán mới của Google có thể hỗ trợ những robot tiếp nhận các hiệu lệnh phức tạp hơn từ con người…
Alphabet- Công ty mẹ của Google đang kết hợp hai dự án nghiên cứu đầy tham vọng của mình là robotics và AI xử lý ngôn ngữ trong một nỗ lực tạo ra “robot trợ giúp” có thể hiểu các lệnh bằng lời nói thay vì ngôn ngữ lập trình.
Kể từ năm 2019, Alphabet đã phát triển các robot có thể thực hiện những nhiệm vụ đơn giản như lấy đồ uống hay lau chùi các bề mặt. Lúc này, dự án vẫn trong giai đoạn “sơ khai” nên các robot vẫn còn chậm chạp. Tuy nhiên hiện tại, những robot của hãng đã được nâng cấp với khả năng xử lý ngôn ngữ được cải thiện nhờ mô hình ngôn ngữ Pathways (PaLM) của Google - một thuật toán xây dựng AI có khả năng xử lý hàng triệu tác vụ.
Sự thay đổi này đã diễn ra khi Alphabet kết hợp với một công ty mang tên Everyday Robots. Đúng như tên gọi của mình, mục tiêu của công ty này là chế tạo các robot có thể tự học hỏi từ xung quanh và đảm nhận các công việc hàng ngày tốn nhiều thời gian. Kết hợp với PaLM, robot SayCan của Everyday Robots trở thành PaLM-SayCan - một chú robot có khả năng đánh giá môi trường, nhiệm vụ hiện tại và khả năng của chính nó, sau đó chia nhiệm vụ đó thành các bước nhỏ hơn để đạt được mục tiêu mong muốn.
Mặc dù hầu hết các robot này mới được thử nghiệm trong phạm vi phòng thí nghiệm nhưng ưu điểm của PaLM-SayCan là hỗ trợ các vấn đề và nhiệm vụ đa dạng, đặc biệt là những tình huống không có kế hoạch. Điều này đã thúc đẩy nhóm Google và Everyday Robots đưa PaLM-SayCan vào nhà bếp văn phòng. Tại đây, robot này có thể được yêu cầu lấy một túi khoai tây chiên từ ngăn kéo, chọn giữa Coca và Pepsi, và thậm chí giúp con người giải quyết vấn đề nước giải khát bị đổ.
Ví dụ như khi nghe được rằng: "Tôi đã làm đổ Coca của mình, bạn có thể mang cho tôi thứ gì đó để lau nó không?". PaLM-SayCan sẽ lên kế hoạch và thực hiện các bước cần thiết để tìm một miếng bọt biển, nhặt nó lên và mang miếng bọt biển đến cho người đã làm đổ đồ uống, theo một bài đăng trên GitHub. Kết quả cũng thành công tương tự khi có người nói với PaLM-SayCan rằng họ vừa hoàn thành một buổi tập thể dục và muốn một chút thức uống và đồ ăn nhẹ để phục hồi sức khỏe hoặc họ muốn robot dọn dẹp một số vật dụng còn sót lại trên quầy bếp. PaLM-SayCan thậm chí có thể giải quyết những vấn đề này khi chúng được yêu cầu bằng tiếng Tây Ban Nha, tiếng Pháp và tiếng Trung.
"Lần triển khai đầu tiên này là một nỗ lực trong việc sử dụng mô hình ngôn ngữ quy mô lớn để lập kế hoạch cho một robot. Điều này không chỉ giúp mọi người có thể giao tiếp với robot thông qua văn bản hoặc giọng nói mà còn cải thiện hiệu suất tổng thể của chúng", gã khổng lồ công nghệ cho biết trong một bài đăng trên blog. “Cuộc sống có quá nhiều lệnh phức tạp mà chúng tôi muốn yêu cầu một robot gia đình có thể làm được, từ “dọn sạch ngũ cốc tôi vừa làm rơi vãi dưới ghế” đến “xào hành cho sốt mì ống” (cả hai lệnh đều chứa rất nhiều hàm ý, từ cách làm sạch ngũ cốc, vị trí của hành trong tủ lạnh và cách chế biến chúng, v.v.).
Vì AI mang lại những cải tiến về các kỹ năng như xử lý ngôn ngữ và điều hướng hoạt động, các loại robot mới gia nhập vào thị trường công nghệ, tuy nhiên, khả năng nhận lệnh của những robot này vẫn còn một vài hạn chế nhất định. Dù vậy, chúng ta hoàn toàn có thể hy vọng trong một tương lai không xa, những “quản gia robot” có thể làm được mọi thứ như trong tưởng tượng.
OpenAI lần đầu tiên mở rộng sự tham gia cho nhà đầu tư thông qua các kênh ngân hàng trong vòng gọi vốn kỷ lục mới đây…
Dù robot hình người vẫn còn cách khá xa việc phổ cập đại trà, nhưng doanh nghiệp dẫn đầu trong lĩnh vực này đã sẵn sàng bước lên sàn chứng khoán...
Với định vị là công ty số toàn cầu, tập đoàn công nghệ này phát triển trên ba trụ cột công nghệ chiến lược gồm hạ tầng AI, an ninh bảo mật và giải pháp AI...
Các nhà nghiên cứu của Google vừa đưa ra cảnh báo đáng chú ý: trong tương lai, máy tính lượng tử có thể phá vỡ các lớp mã hóa đang bảo vệ Bitcoin và nhiều tài sản số khác...
Cuộc thi robot FIRST® LEGO® League Vietnam Championship 2026 đang phản ánh rõ nét sự chuyển động của giáo dục STEM tại Việt Nam – nơi học sinh ngày càng tiếp cận sớm với công nghệ, tư duy kỹ thuật và các chuẩn mực đổi mới sáng tạo toàn cầu...
Siri có thể hoạt động như một tác nhân AI xử lý tác vụ xuyên suốt nhiều ứng dụng thông qua ngữ cảnh cá nhân…
Đầu tháng này, công ty Neuracle Medical Technology đã chính thức nhận được phê duyệt thương mại cho một thiết bị BCI. Trong khi đó, tại Mỹ, các thiết bị BCI xâm lấn vẫn chưa được phê duyệt thương mại...
Học sinh khiếm thị tại Việt Nam đang có nhiều cơ hội học tập độc lập hơn và tham gia tích cực hơn trong lớp học nhờ việc tiếp cận sách giáo khoa điện tử...
Bất chấp việc ký thỏa thuận kéo dài ba năm với The Walt Disney Company cho phép người dùng tạo video với hơn 200 nhân vật Disney, OpenAI vẫn đóng cửa ứng dụng từng làm mưa làm gió Sora…
Trung Quốc đang đẩy mạnh phổ cập trí tuệ nhân tạo trên quy mô lớn, và các “big tech” công nghệ nước này đang trực tiếp tổ chức nhiều sự kiện công khai để giúp người dân tiếp cận OpenClaw – trợ lý số cá nhân đang gây sốt…