Cuộc chiến trợ lý giọng nói AI giữa các Big Tech ngày càng nóng lên
Thị trường trợ lý giọng nói AI (AI Voice Assistant) ngày càng phát triển, đòi hỏi ngay cả những ông lớn cũng phải chạy đua về công nghệ và kỹ thuật…
Hiểu đơn giản, trợ lý giọng nói AI (AI Voice Assistant) là chương trình phần mềm ảo sử dụng trí tuệ nhân tạo (AI), xử lý ngôn ngữ tự nhiên (NLP) và giọng nói để thực hiện tác vụ nhận dạng cũng như phản hồi lệnh thoại.
Mặc dù trợ lý giọng nói là một trong những tính năng trí tuệ nhân tạo quan trọng nhất trên đa số thiết bị hướng đến người tiêu dùng, nhưng chưa có gã khổng lồ công nghệ nào tự tin khẳng định đang sở hữu trợ lý giọng nói AI thống lĩnh thị trường, EMARKETER cho biết.
Theo đó, kế hoạch cải thiện và nâng cấp trợ lý ảo Alexa của Amazon đã bị đẩy lùi đến năm 2025, hơn một năm sau khi Alexa hỗ trợ AI được công bố lần đầu tiên. Tương tự, Apple cũng bổ sung tính năng ChatGPT vào Siri, nhưng quá trình cải tiến bộ công cụ AI tạo sinh (genAI) diễn ra chậm trễ đã làm giảm sự hứng thú của người dùng. Google đã đặt Nano làm AI mặc định cho các dòng điện thoại Pixel, với nhiều tính năng thiết thực chẳng hạn như phát hiện cuộc gọi lừa đảo, nhưng điều này có thể vấp phải sự phản đối từ nhóm người dùng coi trọng quyền riêng tư.
Một số ý tưởng độc đáo như thiết bị đeo sở hữu trợ lý giọng nói chuyên dụng dường như đã thất bại, ví dụ như công ty khởi nghiệp AI Humane đã chuyển hướng trợ lý ảo Ai Pin thành dịch vụ phần mềm thay vì đi theo kế hoạch ban đầu.
HƯỚNG NHÌN RỘNG HƠN VỀ THỊ TRƯỜNG TRỢ LÝ GIỌNG NÓI AI
Một số chuyên gia nhận định thị phần trợ lý giọng nói AI sẽ tương đối ổn định trong năm nay, với lượng người dùng Alexa được dự báo tăng 2,6% so với cùng kỳ năm trước, Siri tăng 3,3% và Google Assistant tăng 4%.
Mặc dù Amazon và Apple đều cho thấy dấu hiệu tụt hậu trong cuộc đua genAI, nhưng cả hai công ty đã đạt được bước tiến nhất định vào cuối năm 2024, bao gồm trình tạo giọng nói AI từ Amazon Web Services (AWS) và bản cập nhật Siri “thông minh hơn” từ Apple.
Khả năng tiên tiến của trợ lý ảo được củng cố nhờ công nghệ giọng nói genAI tinh vi.
Công nghệ mới mang lại nhiều lợi ích cho Big Tech, nhưng lại gây nguy hiểm cho người tiêu dùng. Điển hình nhất, tin tặc có thể tạo ra bản sao giọng nói siêu thực giống với người thân quen hoặc người của công chúng, từ đó dễ dàng thao túng chủ sở hữu thiết bị cung cấp thông tin cá nhân hoặc thông tin tài chính qua điện thoại.
Hiện nay, Hoa Kỳ chưa ban hành quy định cụ thể cấp liên bang nhằm giám sát công nghệ giọng nói AI, nhưng giới mộ điệu có thể kỳ vọng bộ quy tắc sẽ sớm ban hành khi một số đại gia như OpenAI tung ra công nghệ sao chép giọng nói tiên tiến.
ĐỊNH HƯỚNG PHÁT TRIỂN TƯƠNG LAI
Ngay cả khi nhiều Big Tech quyết định rẽ hướng phát triển trợ lý giọng nói, một bộ phận lớn dân số vẫn chưa biết cách sử dụng hoặc thậm chí không quan tâm đến công nghệ này.
Theo ThinkNow Research, chỉ có 39% thế hệ baby boomers (sinh từ năm 1946 đến 1964) sử dụng trợ lý giọng nói hỗ trợ AI hàng ngày, so với 70% thế hệ millennials (sinh từ đầu những năm 1980 đến giữa những năm 1990) và 51% thế hệ Z (sinh từ năm 1997 đến năm 2012).
Theo YouGov, 33% chủ sở hữu điện thoại thông minh trong độ tuổi từ 18 đến 34 đã sử dụng hoặc mong muốn sử dụng trợ lý giọng nói, so với chỉ 20% những người trên 55 tuổi có nhu cầu này.
Các công ty đang tìm cách mở rộng cơ sở người dùng sẽ được hưởng lợi khi nhắm mục tiêu đến khách hàng thế hệ Z và thế hệ millennials hoặc cha mẹ của thế hệ Alpha (sinh từ sau năm 2012) có xu hướng quan tâm đến công nghệ.
KẾT LUẬN
Các công ty nghiên cứu phát triển trợ lý giọng nói mới sẽ phải vật lộn để đột phá trong thị trường nhằm thu hút lượng người dùng cố hữu cũng như cạnh tranh với các mô hình nổi tiếng của một số công ty công nghệ lớn. Tuy nhiên, ngay cả Big Tech cũng sẽ phải đối mặt với nhiều thách thức vì quá trình nghiên cứu trí tuệ nhân tạo rất tốn kém và việc triển khai ngoài đời thực có thể vấp phải ý kiến trái chiều từ người tiêu dùng.