Startup Trung Quốc ra mắt “Canva cho thế hệ video”
Mai Anh
22/09/2025
Từng bị cho là chiêu trò thổi phồng, ngành công nghiệp tạo video bằng AI đang dần khẳng định được chỗ đứng…


AIsphere, một startup Trung Quốc, vừa huy động hơn 60 triệu USD trong vòng gọi vốn Series B do Alibaba dẫn đầu, cùng một số nhà đầu tư khác như Fortune Capital, Shenzhen Capital Group, Quỹ đầu tư ngành AI Bắc Kinh, Hệ thống truyền hình Hồ Nam, Giant Network và Antler. Đây là khoản gọi vốn lớn nhất từ trước tới nay dành cho một công ty Trung Quốc trong lĩnh vực tạo video bằng AI, theo KrASIA.
Sản phẩm chủ lực của AIsphere, PixVerse, vượt mốc 100 triệu người dùng toàn cầu, tăng từ 60 triệu chỉ sau vài tháng. Nhà sáng lập kiêm CEO Vương Xương Hổ (Wang Changhu) cho biết doanh thu từ đăng ký thuê bao đã đủ chi trả toàn bộ chi phí vận hành.
Không chỉ AIsphere, nhiều startup khác cũng tăng trưởng nhanh chóng. Gã khổng lồ Kuaishou cho biết đơn vị tạo video của hãng Kling AI đạt doanh thu 250 triệu NDT (35 triệu USD) trong quý II/2025, chiếm 4,8% tổng doanh thu.
Một năm trước, kịch bản này còn khó tưởng tượng. Sự xuất hiện của trình tạo video đến từ OpenAI, Sora, cùng động thái từ các gã khổng lồ Internet Trung Quốc khiến nhiều người nghi ngờ liệu startup có thể tồn tại. Tháng 2/2024, 36Kr từng đưa tin nhiều nhà đầu tư cho rằng mô hình tạo video bằng AI có thể thua lỗ trong ngắn hạn và công ty nhỏ sẽ bị đào thải.
Được thành lập vào tháng 4/2023, AIsphere ra đời trong làn sóng hoài nghi ấy. Việc đặt cược vào video AI bị coi là “ngược dòng”, và ông Vương cùng đồng sáng lập Tạ Từ Trương (Xie Xuzhang) cũng không thuộc nhóm “thần đồng” thường được giới đầu tư săn đón.
HAI QUYẾT ĐỊNH THEN CHỐT
Ông Vương cho rằng sự tiến bộ của công ty đến từ hai lựa chọn quan trọng.
Thứ nhất, hãng không đốt tiền quảng cáo, mà dựa hoàn toàn vào sức hút sản phẩm. Làn sóng bùng nổ gần đây của PixVerse nhờ các hiệu ứng lan truyền như “biến hình Venom”, thu hút hơn 10 tỷ lượt xem kể từ tháng 11/2024.
Thứ hai, hãng tránh mở rộng ồ ạt. Mỗi chu kỳ huấn luyện đều phải chứng minh cải thiện rõ rệt trong khi vẫn kiểm soát chi phí. Phân tích hành vi người dùng cho thấy hầu hết video ngắn, dù chuyên nghiệp hay nghiệp dư, đều dưới 10 giây, rất ít nhu cầu với clip dài 1 phút. Vì vậy, công ty tập trung vào tốc độ, chất lượng và khả năng làm theo truy vấn.
Để rút ngắn thời gian tạo video từ vài phút xuống vài giây, AIsphere áp dụng kỹ thuật tạo ảnh AI tiên tiến distribution matching distillation. Để ổn định chất lượng hình ảnh, hãng bổ sung cơ chế feature self-regularization loss trong quá trình huấn luyện.
Theo ông Vương, hạn chế vốn đầu tư khiến AIsphere chưa thể huấn luyện mô hình ngang tầm Sora. “Nếu nhìn lại, đáng ra chúng tôi nên gọi vốn nhiều hơn, sớm hơn để tăng tốc phát triển”.
Tuy nhiên, việc tham gia thị trường trước khi video AI trở thành “trào lưu” giúp AIsphere tránh được định giá ảo và vòng gọi vốn chạy theo cơn sốt. Đến cuối 2024, khi kiến trúc khuếch tán biến đổi (DiT) của Sora trở thành tiêu chuẩn toàn cầu, nhiều đối thủ mới bắt đầu tham gia, thì PixVerse đã có 10 triệu người dùng với doanh thu ổn định.
PixVerse V5, ra mắt ngày 27/8, hiện đứng thứ ba thế giới về tạo video từ văn bản và số một về tạo video từ hình ảnh, theo bảng xếp hạng của Artificial Analysis ngày 11/9. AIsphere cũng giới thiệu công cụ “trợ lý tạo video” cho người dùng phổ thông, cho phép làm video chỉ bằng gợi ý ngắn và thư viện mẫu có sẵn.


CUỘC ĐUA “CANVA” TRONG LĨNH VỰC VIDEO
Liệu ngành công nghiệp này có thể sản sinh ra một “Canva” hay “Photoshop” cho video?
Ngay từ khi ra mắt, AIsphere đã phải đối diện câu hỏi: startup liệu có cạnh tranh nổi với các ông lớn công nghệ? Tháng 7/2024, chỉ ít lâu sau khi Kuaishou tung Kling AI, AIsphere đã phát hành PixVerse V2 – được coi là mô hình video dựa trên DiT đầu tiên của một startup Trung Quốc đủ khả năng ứng dụng thực tế.
Nhà đồng sáng lập Vương nhấn mạnh video AI không chỉ đơn thuần là thay thế nội dung trên TikTok hay nền tảng khác. Quan trọng hơn, xu hướng này mở ra cách tương tác mới: “Một khi video có thể tạo ngay lập tức hoặc gần sát thời gian thực, người dùng sẽ vừa xem vừa chỉnh sửa và sáng tạo. Sự thay đổi sẽ sinh ra làn sóng sản phẩm đại chúng mới, giống như cách video ngắn tạo nên TikTok”.
CẠNH TRANH NGÀY CÀNG KHỐC LIỆT
Thị trường ngày càng đông người chơi. Lưu Vũ, cựu lãnh đạo SenseTime Miaohua kiêm nhà sáng lập Vivix Group, vừa ra mắt sản phẩm TipTap tập trung vào nội dung “người lớn” do AI tạo ra. Tào Việt, đồng sáng lập Moonshot AI, thành lập Sand AI chọn hướng tiếp cận tự hồi quy thay vì DiT để tạo video có thể kéo dài vô hạn.
Trong khi đó, AIsphere kiên định với thị trường phổ thông, nhắm đến đối tượng không có kỹ năng sản xuất. Ông Vương so sánh PixVerse giống Canva, cung cấp công cụ đơn giản cho số đông, trong khi một số nền tảng khác giống Photoshop hay Figma, phục vụ dân chuyên nghiệp.
Từ cuối 2024, loạt template đã giúp PixVerse lan truyền mạnh, nhưng theo vị CEO, đây chỉ là một phần trong chiến lược hạ thấp rào cản sáng tạo. Template do người dùng tạo giờ đã trở thành yếu tố cốt lõi của hệ sinh thái. Trên nền tảng nội địa, nhiều template do người dùng sáng tạo đã thu hút hơn 1 triệu lượt xem.
Với AIsphere, những chỉ số quan trọng nhất là tăng trưởng người dùng, tỷ lệ giữ chân và mức độ gắn kết cộng đồng – đặc biệt đối với nội dung do người dùng tạo.
Thị trường có thể sắp bước vào giai đoạn sàng lọc. Báo cáo năm 2025 của Bessemer Venture Partners dự đoán ngành video AI sẽ thu hẹp chỉ trong vòng một năm, giống như quá trình phát triển mô hình ngôn ngữ lớn. Ông Vương tin rằng các công ty còn ở lại sẽ là những đơn vị vừa đảm bảo chi phí, vừa duy trì được đà tăng trưởng người dùng.
Khám phá kính thông minh Meta Ray-Ban Display với công nghệ AI tiên tiến, giúp bạn tương tác dễ dàng hơn với thế giới xung quanh.
Khám phá cách AI đang cách mạng hóa quá trình phát triển thuốc mới, giúp tăng tốc độ và hiệu quả trong nghiên cứu dược phẩm.
Khám phá cách AI đang thay đổi trải nghiệm người dùng trên smartphone và laptop, từ nhiếp ảnh đến làm việc hiệu quả.
Khám phá lý do doanh nghiệp chưa sẵn sàng cho điện toán lượng tử và cơ hội tiềm năng trong tương lai.
Khám phá cách chatbot đang thay đổi cách chúng ta tương tác trên Internet và những thách thức đi kèm với công nghệ này.
Khám phá PDGrapher - công cụ AI mới từ Harvard giúp tăng hiệu quả chữa bệnh và thiết kế thuốc nhanh chóng.
Tìm hiểu về công việc gán nhãn dữ liệu trong ngành AI, những cơ hội thu nhập và những lo ngại về bảo mật và minh bạch.
Khám phá lợi thế của mô hình ngôn ngữ nhỏ trong AI tác nhân và tiềm năng phát triển trong tương lai.