Spotify cắt giảm nhân viên để đẩy nhanh quá trình chinh phục AI
Spotify đã tạo dựng thành công tên tuổi trong lĩnh vực kinh doanh âm thanh trực tuyến nhờ trải nghiệm người dùng siêu cá nhân hóa, trí tuệ nhân tạo và đội ngũ gần 9.800 nhân viên tính đến cuối năm 2022…
Nhưng 3 đợt sa thải trong năm 2023: 590 vị trí vào tháng 1/2023, 200 vị trí vào giữa năm và 1.500 vị trí khác vào đầu tháng này, cộng với khoản đầu tư vào AI nhằm tăng tỷ suất lợi nhuận cho dòng sản phẩm podcast và sách nói đã chứng tỏ Spotify đang tiến vào cuộc đại tu toàn bộ, theo CNN Business.
Ông Justin Patterson, nhà phân tích tại KeyBanc Capital Markets, cho biết: “Spotify đang tận dụng AI tối đa trên nền tảng, ví dụ như ra mắt DJ AI giúp mô phỏng trải nghiệm radio truyền thống tại 50 thị trường bổ sung và triển khai AI Voice Translation cho chuỗi sản phẩm podcast. Cùng với quyết định triển khai dịch vụ sách nói cho tài khoản trả phí, tôi tin rằng Spotify có một số cơ hội thúc đẩy mức độ tương tác và cuối cùng là nâng cao khả năng kiếm tiền nhờ trí tuệ nhân tạo”.
Cổ phiếu công ty mẹ Spotify SA đã tăng hơn 30% trong sáu tháng qua và tăng hơn 135% so với cùng kỳ năm ngoái.
Công ty, cũng như nhiều gã khổng lồ công nghệ khác, đã thực hiện cắt giảm chi tiêu sau đại dịch. Hãng cũng phải bù hơn 1 tỷ USD đã chi cho dịch vụ podcast, phần lớn trong số đó là những thỏa thuận hợp tác với một số ngôi sao nổi tiếng để sản xuất podcast nhưng sau đó không thực hiện được và mua lại nhiều studio podcast nhưng không hoạt động hiệu quả dẫn đến đóng cửa.
“Tăng trưởng kinh tế chậm lại đáng kể và giá cả trở nên đắt đỏ hơn. Spotify không phải ngoại lệ đối với thực tế khó khăn này”, CEO Daniel Ek viết trong bức thư gửi nhân viên.
BƯỚC VÀO CUỘC CHIẾN AI
Vào tháng 11/2023, Spotify đã công bố mối quan hệ hợp tác với Google Cloud nhằm cải tiến thuật toán đề xuất sách nói và podcast thông qua mô hình ngôn ngữ lớn (LLM) đến từ Google Cloud, Vertex AI Search.
Mô hình ngôn ngữ lớn, điển hình như ChatGPT, là chương trình máy tính được đào tạo dựa trên dữ liệu khổng lồ có thể đọc văn bản và thông tin giống con người.
Spotify đã giới thiệu tính năng “DJ AI” vào tháng 2 năm nay và bắt đầu sử dụng công cụ dịch giọng nói “Whisper” đến từ OpenAI để dịch một số tập podcast tiếng Anh sang tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức.
Đại diện Spotify cho biết trong email gửi CNN rằng công ty có kế hoạch mở rộng công nghệ trí tuệ nhân tạo trong tương lai và đang mong chờ phản hồi của nhà sáng tạo nội dung cũng như khán giả. Hãng cũng chỉ ra một số nhận xét của CEO Ek trong báo cáo thu nhập quý 3, nhấn mạnh từ khóa “hiệu quả” đã được sử dụng hơn 20 lần.
Vị CEO phát biểu trong buổi họp báo công bố thu nhập vào tháng 10 của Spotify: “Những sáng kiến AI tạo ra mức độ tương tác lớn. Và mức độ tương tác cao hơn có nghĩa là chúng tôi sẽ giảm được tình trạng gián đoạn cũng như tạo ra nhiều giá trị hơn cho người dùng. Điều đó cho phép tăng giá dịch vụ như cách chúng tôi đã làm trong quý vừa qua”.
Ông Douglas Anmuth, Giám đốc Điều hành và nhà phân tích tại JPMorgan, cho biết rằng cùng với xu hướng đầu tư vào quảng cáo từ nghệ sĩ, đầu tư vào podcast có tiềm năng thúc đẩy tương tác trong thời gian dài.
TRẢI NGHIỆM “SIÊU CÁ NHÂN HÓA” HOẠT ĐỘNG NHƯ THẾ NÀO?
Spotify đã nỗ lực “siêu cá nhân hóa” trải nghiệm người dùng trong khoảng một thập kỷ. Hãng bổ sung dấu ấn cá nhân hoá sau khi mua lại công ty phân tích âm nhạc The Echo Nest Corp vào năm 2014 nhằm kết hợp học máy và xử lý ngôn ngữ tự nhiên.
Công nghệ của Spotify xây dựng cơ sở dữ liệu về tuyển tập bài hát và nghệ sĩ bằng cách nhận dạng cao độ và nhịp độ âm nhạc, đồng thời kết nối tác phẩm của nhiều nghệ sĩ trong bối cảnh văn hóa chung.
Dữ liệu như ngày phát hành hay âm lượng, thời lượng cũng góp phần xác định bài hát phù hợp với sở thích của từng người dùng.
Từ đây, danh sách phát “Daily Mix” và “Discover Weekly” ra đời. Mặt khác, danh sách phát “Time Capsules” và “On Repeat” tập hợp nhiều ca khúc được nghe nhiều nhất hoặc hồi tưởng lại một số bài hát người dùng đã không nghe trong thời gian dài.
Trong email gửi tới CNN, ông Anil Jain, Giám đốc Điều hành toàn cầu ngành tiêu dùng chiến lược tại Google Cloud cho biết Vertex AI Search cho phép các công ty truyền thông và giải trí xây dựng khả năng khám phá nội dung trên video, âm thanh, hình ảnh và văn bản. Ông Jain không bình luận chi tiết về thỏa thuận với Spotify.
Vertex AI Search xem xét nhiều yếu tố khi đề xuất nội dung cho người dùng như hành vi sử dụng theo thời gian thực, sự tương đồng về nội dung hoặc nội dung khác có liên quan đến mục tiêu tìm kiếm.
THÁCH THỨC VÀ CƠ HỘI
Ông Reece Hayden, nhà phân tích cấp cao tại ABI Research, bày tỏ tin tưởng rằng các mô hình ngôn ngữ lớn (LLM) có thể giúp tăng mức độ tương tác trên nền tảng Spotify.
Ông nói thêm rằng không giống như “đa số mô hình dự đoán cơ bản phụ thuộc vào từ khóa/dữ liệu”, LLM có thể hiểu và giải thích thông tin dạng podcast/âm thanh/video để đưa ra đề xuất phù hợp với sở thích người dùng.
Nhưng công nghệ cao luôn đi kèm với cái giá rất đắt.
“Việc chạy LLM để hiểu tất cả podcast/sách nói tiêu tốn nhiều tài nguyên và có thể tăng thêm chi phí vận hành so với mô hình dự đoán cơ bản… LLM mang đến thách thức về quyền riêng tư dữ liệu và chi phí tài nguyên, những thách thức này sẽ rất đáng kể”, ông nhận định.
Nhà phân tích bày tỏ niềm tin Whisper sẽ dịch podcast một cách dễ dàng, nhưng dự đoán hệ thống có thể mắc sai sót dưới dạng câu dài hoặc cụm từ.
Ông nói: “Với sự sẵn có của các bộ dữ liệu khổng lồ, mô hình dịch ngôn ngữ như Whisper sẽ nhanh chóng được cải thiện, đảm bảo độ chính xác cao. Nhưng nhược điểm của Whisper là khả năng cốt lõi của hệ thống này lại là dịch các ngôn ngữ khác sang tiếng Anh thay vì ngược lại. Hầu hết podcast đều được ghi bằng tiếng Anh và do đó Whisper không thể được áp dụng một cách hiệu quả trên diện rộng”.