16:31 25/10/2021

FPT.AI nâng tầm Trợ lý ảo tổng đài với công nghệ giọng máy AceSound

Khánh Huyền

FPT.AI đã cho ra mắt thế hệ giọng máy tiếng Việt mới với chất lượng vượt trội nhờ công nghệ AceSound tiên tiến nhất hiện nay...

Sự bùng nổ của Trí tuệ nhân tạo (AI) đã kích hoạt nhiều tính năng mới của công nghệ với sức mạnh đáng kinh ngạc, trong đó phải kể đến công nghệ tổng hợp giọng nói tự nhiên ứng dụng trong vận hành tổng đài. FPT.AI đã cho ra mắt thế hệ giọng máy tiếng Việt mới với chất lượng vượt trội nhờ công nghệ AceSound tiên tiến nhất hiện nay.

NÂNG TẦM GIỌNG NÓI BẰNG CÔNG NGHỆ HIỆN ĐỊA NHẤT

Là công ty công nghệ hàng đầu trong lĩnh vực Trí tuệ nhân tạo (AI) cùng sự “am hiểu địa phương”, FPT.AI đã có những nghiên cứu chuyên sâu về công nghệ Xử lý Ngôn ngữ Tự nhiên (NLP) tiếng Việt từ hơn một thập kỷ. Mới đây, hàng loạt các giọng máy phát triển bằng công nghệ vượt trội AceSound đã được đội ngũ chuyên gia FPT.AI hoàn thiện và ra mắt.

Công nghệ AceSound được FPT.AI đầu tư và phát triển, nhằm đưa chất lượng giọng máy Text to Speech lên một tầm cao mới. FPT.AI đón đầu xu thế ứng dụng giọng máy vào Trợ lý ảo của các trung tâm tổng đài Chăm sóc khách hàng, thực hiện nhiều nghiệp vụ sơ cấp trong lĩnh vực Tài chính - Ngân hàng, giúp các doanh nghiệp rút ngắn thời gian phục vụ khách hàng, giảm tải áp lực cho đội ngũ nhân sự, tối ưu quy trình vận hành.

Nhiều doanh nghiệp là khách hàng của FPT.AI tiên phong triển khai Trợ lý ảo tổng đài của FPT.AI đã bước đầu gặt hái nhiều thành tựu ấn tượng, tiết kiệm chi phí hơn 17 tỷ đồng mỗi tháng.

AceSound vận dụng những công nghệ tiên tiến nhất về tổng hợp giọng nói, khai thác triệt để công nghệ học sâu (deep learning). Do đó, mô hình máy tính có thể học được hàng nghìn đặc trưng về ngữ điệu, biểu cảm trong giọng nói tự nhiên của con người. Kiến trúc mô hình học sâu được tinh chỉnh riêng để tối ưu cho từng giọng nói theo giới tính, vùng miền. Để giọng máy hoàn thiện và có chất lượng tự nhiên như người thật, đội ngũ kĩ sư, các nhà khoa học của FPT.AI đã thực hiện hàng nghìn thí nghiệm nhằm phân tích mẫu, liên tục cải tiến chất lượng âm học.

Đặc biệt, FPT.AI chú trọng gia tăng hiệu năng triển khai giọng máy cho các hệ thống lớn như tốc độ xử lí nhanh hơn, tiêu thụ ít nguồn lực tính toán hơn, đáp ứng lượng sử dụng lớn với cơ sở hạ tầng nhỏ.

Theo đánh giá từ các đối tác đầu tiên được trải nghiệm giọng mới của FPT.AI, có thể nói, giọng máy AceSound mới của FPT.AI có ngữ điệu, biểu cảm gần như tiệm cận với giọng người thật, thậm chí hay hơn giọng người thật, chất lượng ngang với giọng đọc của các MC chuyên nghiệp. Hầu hết người nghe không phân biệt được giọng máy TTS AceSound với giọng người thật trong 10 giây đầu tiên.

Trải nghiệm giọng mới của FPT.AI với công nghệ AceSound.
Trải nghiệm giọng mới của FPT.AI với công nghệ AceSound.

Những giọng máy nổi tiếng của FPT.AI đã “làm mưa làm gió” trên các nền tảng xã hội như Facebook, Tiktok, Instargram, Youtube phải kể đến giọng Ban Mai (nữ miền Bắc), giọng Minh Quang (nam miền Nam), giọng Thu Minh (nữ miền Bắc)… Thì nay, phiên bản ứng dụng công nghệ mới với những thay đổi về cao độ, tốc độ, cách phát âm, khả năng ngắt nghỉ… khiến giọng máy AceSound trở nên mượt mà, sống động hơn. Các giọng mới như giọng Ban Mai AceSound, giọng Minh Quang AceSound, giọng Thu Minh AceSound… hứa hẹn mang đến cho người dùng nhiều trải nghiệm thú vị.

ỨNG DỤNG THỰC TẾ CỦA GIỌNG MÁY

Một trong những bước nhảy vọt của công nghệ giọng máy Text to Speech đó là được tích hợp vào Trợ lý ảo tổng đài Chăm sóc khách hàng tự động với chất giọng đặc trưng riêng biệt của từng thương hiệu, từng ngành nghề… Việc sử dụng giọng máy tự nhiên giúp nâng cao chất lượng của các trung tâm tổng đài Chăm sóc khách hàng. Bằng cách “huấn luyện” bot hiểu ngôn ngữ tự nhiên nhờ AI, voicebot có thể giao tiếp hai chiều với con người theo thời gian thực, đưa ra phản hồi với giọng điệu tự nhiên, cảm xúc, mang lại sắc thái tự nhiên cho cuộc hội thoại.

Giọng máy có thể hoạt động như người phát ngôn của thương hiệu, truyền bá thông điệp của doanh nghiệp bằng một giọng nói đặc trưng, tạo ra dấu ấn riêng các doanh nghiệp Việt thời 4.0.

Các ứng dụng sử dụng giọng máy để giao tiếp ngày càng trở nên phổ biến hơn trên thế giới. Không chỉ mang lại nhiều lợi ích cho công đồng người khuyết tật, người khiếm thị, những người mất khả năng đọc…, công nghệ giọng nói được cá nhân hóa giúp giải quyết nhiều vấn đề về tương tác khách hàng trong các doanh nghiệp lớn.

Công nghệ chuyển văn bản thành giọng máy (Text to Speech) của FPT.AI dễ dàng tích hợp thông qua API trên giao diện dành cho lập trình viên https://console.fpt.ai, hoặc sử dụng trực tiếp trên website https://voicemaker.fpt.ai với giao diện người dùng để sản xuất nội dung số (video, podcast, sách nói, ebook).

Chỉ với một vài cú nhấp chuột, các nhà xuất bản, nhà sản xuất nội dung có thể dễ dàng chuyển đổi văn bản (sách, bài báo hoặc bất kì tài liệu viết) thành âm thanh với công nghệ Text to Speech của FPT.AI một cách nhanh chóng, tiện lợi, cắt giảm chi phí và tăng hiệu quả cho quá trình sản xuất nội dung, tùy chỉnh đa dạng nhiều giọng vùng miền.

Giọng nói kĩ thuật số, hay giọng máy là công nghệ không thể thiếu trong tương lai bởi tiềm năng ứng dụng sâu rộng và đa dạng vào nhiều lĩnh vực trong đời sống hàng ngày, cho phép con người tối giản nhiều hoạt động, giảm thiểu chi phí và gia tăng tiện ích. FPT.AI liên tục cải tiến, liên tục đổi mới nhằm tạo ra những giọng máy chất lượng, và AceSound chính là công nghệ ưu việt, đồng hành cùng các doanh nghiệp mang đến những trải nghiệm xứng đáng cho người dùng.

* Thông tin chi tiết: https://fpt.ai/