Google bổ sung kỹ năng ngôn ngữ AI cho “robot giúp việc”
Đức Mạnh
22/08/2022
Một thuật toán mới của Google có thể hỗ trợ những robot tiếp nhận các hiệu lệnh phức tạp hơn từ con người…
Alphabet- Công ty mẹ của Google đang kết hợp hai dự án nghiên cứu đầy tham vọng của mình là robotics và AI xử lý ngôn ngữ trong một nỗ lực tạo ra “robot trợ giúp” có thể hiểu các lệnh bằng lời nói thay vì ngôn ngữ lập trình.
Kể từ năm 2019, Alphabet đã phát triển các robot có thể thực hiện những nhiệm vụ đơn giản như lấy đồ uống hay lau chùi các bề mặt. Lúc này, dự án vẫn trong giai đoạn “sơ khai” nên các robot vẫn còn chậm chạp. Tuy nhiên hiện tại, những robot của hãng đã được nâng cấp với khả năng xử lý ngôn ngữ được cải thiện nhờ mô hình ngôn ngữ Pathways (PaLM) của Google - một thuật toán xây dựng AI có khả năng xử lý hàng triệu tác vụ.
Sự thay đổi này đã diễn ra khi Alphabet kết hợp với một công ty mang tên Everyday Robots. Đúng như tên gọi của mình, mục tiêu của công ty này là chế tạo các robot có thể tự học hỏi từ xung quanh và đảm nhận các công việc hàng ngày tốn nhiều thời gian. Kết hợp với PaLM, robot SayCan của Everyday Robots trở thành PaLM-SayCan - một chú robot có khả năng đánh giá môi trường, nhiệm vụ hiện tại và khả năng của chính nó, sau đó chia nhiệm vụ đó thành các bước nhỏ hơn để đạt được mục tiêu mong muốn.
Mặc dù hầu hết các robot này mới được thử nghiệm trong phạm vi phòng thí nghiệm nhưng ưu điểm của PaLM-SayCan là hỗ trợ các vấn đề và nhiệm vụ đa dạng, đặc biệt là những tình huống không có kế hoạch. Điều này đã thúc đẩy nhóm Google và Everyday Robots đưa PaLM-SayCan vào nhà bếp văn phòng. Tại đây, robot này có thể được yêu cầu lấy một túi khoai tây chiên từ ngăn kéo, chọn giữa Coca và Pepsi, và thậm chí giúp con người giải quyết vấn đề nước giải khát bị đổ.
Ví dụ như khi nghe được rằng: "Tôi đã làm đổ Coca của mình, bạn có thể mang cho tôi thứ gì đó để lau nó không?". PaLM-SayCan sẽ lên kế hoạch và thực hiện các bước cần thiết để tìm một miếng bọt biển, nhặt nó lên và mang miếng bọt biển đến cho người đã làm đổ đồ uống, theo một bài đăng trên GitHub. Kết quả cũng thành công tương tự khi có người nói với PaLM-SayCan rằng họ vừa hoàn thành một buổi tập thể dục và muốn một chút thức uống và đồ ăn nhẹ để phục hồi sức khỏe hoặc họ muốn robot dọn dẹp một số vật dụng còn sót lại trên quầy bếp. PaLM-SayCan thậm chí có thể giải quyết những vấn đề này khi chúng được yêu cầu bằng tiếng Tây Ban Nha, tiếng Pháp và tiếng Trung.
"Lần triển khai đầu tiên này là một nỗ lực trong việc sử dụng mô hình ngôn ngữ quy mô lớn để lập kế hoạch cho một robot. Điều này không chỉ giúp mọi người có thể giao tiếp với robot thông qua văn bản hoặc giọng nói mà còn cải thiện hiệu suất tổng thể của chúng", gã khổng lồ công nghệ cho biết trong một bài đăng trên blog. “Cuộc sống có quá nhiều lệnh phức tạp mà chúng tôi muốn yêu cầu một robot gia đình có thể làm được, từ “dọn sạch ngũ cốc tôi vừa làm rơi vãi dưới ghế” đến “xào hành cho sốt mì ống” (cả hai lệnh đều chứa rất nhiều hàm ý, từ cách làm sạch ngũ cốc, vị trí của hành trong tủ lạnh và cách chế biến chúng, v.v.).
Vì AI mang lại những cải tiến về các kỹ năng như xử lý ngôn ngữ và điều hướng hoạt động, các loại robot mới gia nhập vào thị trường công nghệ, tuy nhiên, khả năng nhận lệnh của những robot này vẫn còn một vài hạn chế nhất định. Dù vậy, chúng ta hoàn toàn có thể hy vọng trong một tương lai không xa, những “quản gia robot” có thể làm được mọi thứ như trong tưởng tượng.
Tại Tuần lễ Khoa học VinFuture 2025, các nhà khoa học giới thiệu bốn đột phá trong robot, y học và nông nghiệp thông minh, mở ra tương lai mới cho nhân loại.
Baidu đang nổi lên như đối thủ chính trong ngành chip AI tại Trung Quốc, với mảng chip Kunlunxin dự kiến tăng trưởng mạnh mẽ trong bối cảnh thiếu hụt nguồn cung.
Startup Holocare phát triển công nghệ VR giúp bác sĩ phẫu thuật mô phỏng cơ quan 3D, nâng cao hiệu quả và an toàn trong ca mổ.
Nhóm sinh viên Texas phát triển robot FireBot giúp lính cứu hỏa thu thập thông tin trong đám cháy, chịu nhiệt lên đến 650°C, nâng cao an toàn cứu hộ.
NTT và Toshiba đã chứng minh khả năng điều khiển nhà máy từ 300km, mở ra giải pháp mới cho ngành sản xuất Nhật Bản giữa tình trạng thiếu lao động.
Dự báo tác động của AI đến việc làm qua lăng kính kinh nghiệm từ Internet, từ chuyển đổi nghề nghiệp đến sự xuất hiện công việc mới.
Trung Quốc lần đầu tiên vượt Mỹ về lượt tải mô hình AI mở, cho thấy sự thay đổi trong cách sử dụng và phát triển công nghệ trí tuệ nhân tạo toàn cầu.
Mô hình trí tuệ nhân tạo PopEVE giúp xác định biến thể di truyền gây bệnh hiếm, nâng cao khả năng chẩn đoán và điều trị cho bệnh nhân.
Viện Allen công bố mô hình AI Olmo 3 với dữ liệu huấn luyện công khai, cạnh tranh trực diện với mô hình mở của Trung Quốc.
Chuỗi cung ứng thông minh, AI đa tác tử và thiết bị biên thông minh sẽ là những xu hướng công nghệ nổi bật tại Đông Nam Á trong năm 2026.