image Thứ Ba, 23/09/2025

Startup Trung Quốc ra mắt “Canva cho thế hệ video”

Mai Anh

22/09/2025

Chia sẻ

Từng bị cho là chiêu trò thổi phồng, ngành công nghiệp tạo video bằng AI đang dần khẳng định được chỗ đứng…

AIsphere đã sẵn sàng tạo nên “Canva cho thế hệ video”
AIsphere đã sẵn sàng tạo nên “Canva cho thế hệ video”
AIsphere đã sẵn sàng tạo nên “Canva cho thế hệ video”
AIsphere đã sẵn sàng tạo nên “Canva cho thế hệ video”

AIsphere, một startup Trung Quốc, vừa huy động hơn 60 triệu USD trong vòng gọi vốn Series B do Alibaba dẫn đầu, cùng một số nhà đầu tư khác như Fortune Capital, Shenzhen Capital Group, Quỹ đầu tư ngành AI Bắc Kinh, Hệ thống truyền hình Hồ Nam, Giant Network và Antler. Đây là khoản gọi vốn lớn nhất từ trước tới nay dành cho một công ty Trung Quốc trong lĩnh vực tạo video bằng AI, theo KrASIA.

Sản phẩm chủ lực của AIsphere, PixVerse, vượt mốc 100 triệu người dùng toàn cầu, tăng từ 60 triệu chỉ sau vài tháng. Nhà sáng lập kiêm CEO Vương Xương Hổ (Wang Changhu) cho biết doanh thu từ đăng ký thuê bao đã đủ chi trả toàn bộ chi phí vận hành.

Không chỉ AIsphere, nhiều startup khác cũng tăng trưởng nhanh chóng. Gã khổng lồ Kuaishou cho biết đơn vị tạo video của hãng Kling AI đạt doanh thu 250 triệu NDT (35 triệu USD) trong quý II/2025, chiếm 4,8% tổng doanh thu.

Một năm trước, kịch bản này còn khó tưởng tượng. Sự xuất hiện của trình tạo video đến từ OpenAI, Sora, cùng động thái từ các gã khổng lồ Internet Trung Quốc khiến nhiều người nghi ngờ liệu startup có thể tồn tại. Tháng 2/2024, 36Kr từng đưa tin nhiều nhà đầu tư cho rằng mô hình tạo video bằng AI có thể thua lỗ trong ngắn hạn và công ty nhỏ sẽ bị đào thải.

Được thành lập vào tháng 4/2023, AIsphere ra đời trong làn sóng hoài nghi ấy. Việc đặt cược vào video AI bị coi là “ngược dòng”, và ông Vương cùng đồng sáng lập Tạ Từ Trương (Xie Xuzhang) cũng không thuộc nhóm “thần đồng” thường được giới đầu tư săn đón.

HAI QUYẾT ĐỊNH THEN CHỐT

Ông Vương cho rằng sự tiến bộ của công ty đến từ hai lựa chọn quan trọng.

Thứ nhất, hãng không đốt tiền quảng cáo, mà dựa hoàn toàn vào sức hút sản phẩm. Làn sóng bùng nổ gần đây của PixVerse nhờ các hiệu ứng lan truyền như “biến hình Venom”, thu hút hơn 10 tỷ lượt xem kể từ tháng 11/2024.

Thứ hai, hãng tránh mở rộng ồ ạt. Mỗi chu kỳ huấn luyện đều phải chứng minh cải thiện rõ rệt trong khi vẫn kiểm soát chi phí. Phân tích hành vi người dùng cho thấy hầu hết video ngắn, dù chuyên nghiệp hay nghiệp dư, đều dưới 10 giây, rất ít nhu cầu với clip dài 1 phút. Vì vậy, công ty tập trung vào tốc độ, chất lượng và khả năng làm theo truy vấn.

Để rút ngắn thời gian tạo video từ vài phút xuống vài giây, AIsphere áp dụng kỹ thuật tạo ảnh AI tiên tiến distribution matching distillation. Để ổn định chất lượng hình ảnh, hãng bổ sung cơ chế feature self-regularization loss trong quá trình huấn luyện.

Theo ông Vương, hạn chế vốn đầu tư khiến AIsphere chưa thể huấn luyện mô hình ngang tầm Sora. “Nếu nhìn lại, đáng ra chúng tôi nên gọi vốn nhiều hơn, sớm hơn để tăng tốc phát triển”.

Tuy nhiên, việc tham gia thị trường trước khi video AI trở thành “trào lưu” giúp AIsphere tránh được định giá ảo và vòng gọi vốn chạy theo cơn sốt. Đến cuối 2024, khi kiến trúc khuếch tán biến đổi (DiT) của Sora trở thành tiêu chuẩn toàn cầu, nhiều đối thủ mới bắt đầu tham gia, thì PixVerse đã có 10 triệu người dùng với doanh thu ổn định.

PixVerse V5, ra mắt ngày 27/8, hiện đứng thứ ba thế giới về tạo video từ văn bản và số một về tạo video từ hình ảnh, theo bảng xếp hạng của Artificial Analysis ngày 11/9. AIsphere cũng giới thiệu công cụ “trợ lý tạo video” cho người dùng phổ thông, cho phép làm video chỉ bằng gợi ý ngắn và thư viện mẫu có sẵn.

Tính đến ngày 11/9, PixVerse V5 xếp thứ ba về khả năng chuyển văn bản thành video. Nguồn: Artificial Analysis.
Tính đến ngày 11/9, PixVerse V5 xếp thứ ba về khả năng chuyển văn bản thành video. Nguồn: Artificial Analysis.
Tính đến ngày 11/9, PixVerse V5 đứng đầu về khả năng chuyển đổi hình ảnh thành video. Nguồn: Artificial Analysis.
Tính đến ngày 11/9, PixVerse V5 đứng đầu về khả năng chuyển đổi hình ảnh thành video. Nguồn: Artificial Analysis.

CUỘC ĐUA “CANVA” TRONG LĨNH VỰC VIDEO

Liệu ngành công nghiệp này có thể sản sinh ra một “Canva” hay “Photoshop” cho video?

Ngay từ khi ra mắt, AIsphere đã phải đối diện câu hỏi: startup liệu có cạnh tranh nổi với các ông lớn công nghệ? Tháng 7/2024, chỉ ít lâu sau khi Kuaishou tung Kling AI, AIsphere đã phát hành PixVerse V2 – được coi là mô hình video dựa trên DiT đầu tiên của một startup Trung Quốc đủ khả năng ứng dụng thực tế.

Nhà đồng sáng lập Vương nhấn mạnh video AI không chỉ đơn thuần là thay thế nội dung trên TikTok hay nền tảng khác. Quan trọng hơn, xu hướng này mở ra cách tương tác mới: “Một khi video có thể tạo ngay lập tức hoặc gần sát thời gian thực, người dùng sẽ vừa xem vừa chỉnh sửa và sáng tạo. Sự thay đổi sẽ sinh ra làn sóng sản phẩm đại chúng mới, giống như cách video ngắn tạo nên TikTok”.

CẠNH TRANH NGÀY CÀNG KHỐC LIỆT

Thị trường ngày càng đông người chơi. Lưu Vũ, cựu lãnh đạo SenseTime Miaohua kiêm nhà sáng lập Vivix Group, vừa ra mắt sản phẩm TipTap tập trung vào nội dung “người lớn” do AI tạo ra. Tào Việt, đồng sáng lập Moonshot AI, thành lập Sand AI chọn hướng tiếp cận tự hồi quy thay vì DiT để tạo video có thể kéo dài vô hạn.

Trong khi đó, AIsphere kiên định với thị trường phổ thông, nhắm đến đối tượng không có kỹ năng sản xuất. Ông Vương so sánh PixVerse giống Canva, cung cấp công cụ đơn giản cho số đông, trong khi một số nền tảng khác giống Photoshop hay Figma, phục vụ dân chuyên nghiệp.

Từ cuối 2024, loạt template đã giúp PixVerse lan truyền mạnh, nhưng theo vị CEO, đây chỉ là một phần trong chiến lược hạ thấp rào cản sáng tạo. Template do người dùng tạo giờ đã trở thành yếu tố cốt lõi của hệ sinh thái. Trên nền tảng nội địa, nhiều template do người dùng sáng tạo đã thu hút hơn 1 triệu lượt xem.

Với AIsphere, những chỉ số quan trọng nhất là tăng trưởng người dùng, tỷ lệ giữ chân và mức độ gắn kết cộng đồng – đặc biệt đối với nội dung do người dùng tạo.

Thị trường có thể sắp bước vào giai đoạn sàng lọc. Báo cáo năm 2025 của Bessemer Venture Partners dự đoán ngành video AI sẽ thu hẹp chỉ trong vòng một năm, giống như quá trình phát triển mô hình ngôn ngữ lớn. Ông Vương tin rằng các công ty còn ở lại sẽ là những đơn vị vừa đảm bảo chi phí, vừa duy trì được đà tăng trưởng người dùng.


Khám phá kính thông minh tích hợp màn hình thế hệ mới mà Meta vừa ra mắt

Khám phá kính thông minh Meta Ray-Ban Display với công nghệ AI tiên tiến, giúp bạn tương tác dễ dàng hơn với thế giới xung quanh.

15:56 22/09/2025
AI trong hành trình tìm ra thuốc mới

Khám phá cách AI đang cách mạng hóa quá trình phát triển thuốc mới, giúp tăng tốc độ và hiệu quả trong nghiên cứu dược phẩm.

15:55 22/09/2025
AI đang dần tái định hình thị trường thiết bị cá nhân

Khám phá cách AI đang thay đổi trải nghiệm người dùng trên smartphone và laptop, từ nhiếp ảnh đến làm việc hiệu quả.

15:55 22/09/2025
Kỷ nguyên điện toán lượng tử đang đến, nhưng nhiều doanh nghiệp vẫn chưa sẵn sàng

Khám phá lý do doanh nghiệp chưa sẵn sàng cho điện toán lượng tử và cơ hội tiềm năng trong tương lai.

15:54 22/09/2025
Các chatbot đang thay đổi tương tác trên Internet như thế nào?

Khám phá cách chatbot đang thay đổi cách chúng ta tương tác trên Internet và những thách thức đi kèm với công nghệ này.

15:03 18/09/2025
Công cụ AI mới từ Harvard tăng hiệu quả chữa bệnh ngay từ tế bào

Khám phá PDGrapher - công cụ AI mới từ Harvard giúp tăng hiệu quả chữa bệnh và thiết kế thuốc nhanh chóng.

15:02 18/09/2025
Bên trong thế giới bí ẩn của những người huấn luyện mô hình AI

Tìm hiểu về công việc gán nhãn dữ liệu trong ngành AI, những cơ hội thu nhập và những lo ngại về bảo mật và minh bạch.

14:04 18/09/2025
Mô hình ngôn ngữ nhỏ sẽ định hình tương lai AI tác nhân?

Khám phá lợi thế của mô hình ngôn ngữ nhỏ trong AI tác nhân và tiềm năng phát triển trong tương lai.

11:02 18/09/2025