18:38 07/03/2024

Đối thủ của OpenAI ngày càng nhiều, cạnh tranh từ ChatGPT đến Sora

Thanh Minh

Từ các startup đến big tech đều đang cố cạnh tranh với OpenAI. Gần đây, công cụ tạo video Sora đã kích hoạt cuộc đua mới, trong đó không ít đối thủ đến từ Trung Quốc ...

Kể từ khi OpenAI ra mắt ChatGPT, các đối thủ đều háo hức cạnh tranh. Mặc dù nhiều tổ chức đã đạt được những cột mốc quan trọng trong quá trình phát triển của mình, ChatGPT vẫn đang thống trị thị trường...

Mặc dù vậy, các nhà phát triển chatbot AI đối thủ trên toàn thế giới vẫn tiếp tục đổi mới sản phẩm của họ, cung cấp nhiều tính năng phù hợp hơn – hoặc đôi khi hoạt động tốt hơn – ChatGPT. Một trong những đối thủ lớn nhất của OpenAI là Anthropic. Được thành lập vào năm 2021 và hiện là công ty lớn trong lĩnh vực AI, Anthropic được cả Amazon và Google “chống lưng”. Định giá khoảng 18 tỷ USD, công ty AI này hy vọng sẽ đảm bảo được nhiều nguồn tài trợ hơn vì đây có vẻ là thách thức lớn đối với OpenAI.

ANTHROPIC LÀ ĐỐI THỦ AI LỚN NHẤT CỦA OPENAI

Công ty gần đây đã thông báo rằng ba mô hình AI mới – được gọi là Claude 3 Opus, Sonnet và Haiku – là những công cụ có hiệu suất cao nhất và dẫn đầu ngành về khả năng “phù hợp với trí thông minh của con người”.

“Opus, mô hình thông minh nhất của chúng tôi, vượt trội so với các đối thủ trên hầu hết các tiêu chuẩn đánh giá chung cho hệ thống AI. Nó thể hiện mức độ hiểu biết và sự trôi chảy gần như con người trong các nhiệm vụ phức tạp, dẫn đầu về trí tuệ tổng hợp,” Anthropic công bố trong một tuyên bố.

Công ty cũng cho biết tất cả các mẫu Claude 3 đều cho thấy khả năng phân tích và dự đoán cao hơn, tạo nội dung đa sắc thái, tạo mã và trò chuyện bằng các ngôn ngữ không phải tiếng Anh như tiếng Tây Ban Nha, tiếng Nhật và tiếng Pháp.

“Các doanh nghiệp thuộc mọi quy mô đều dựa vào mô hình của chúng tôi để phục vụ khách hàng của họ, điều này khiến cho kết quả đầu ra từ mô hình của chúng tôi bắt buộc phải duy trì độ chính xác cao trên quy mô lớn. Để đánh giá điều này, chúng tôi sử dụng một tập hợp lớn các câu hỏi thực tế, phức tạp nhằm vào những điểm yếu đã biết trong các mô hình hiện tại.

“Chúng tôi phân loại các câu trả lời thành câu trả lời đúng, câu trả lời sai (hoặc ảo giác) và thừa nhận sự không chắc chắn, trong đó mô hình cho biết nó không biết câu trả lời thay vì cung cấp thông tin không chính xác. So với Claude 2.1, Opus thể hiện sự cải thiện gấp đôi về độ chính xác (hoặc câu trả lời đúng) đối với những câu hỏi mở đầy thách thức này đồng thời cũng cho thấy mức độ câu trả lời sai giảm đi,” Anthropic giải thích.

Về những lo ngại tính chính xác và quyền riêng tư của mô hình, Anthropic chỉ ra rằng họ có một số nhóm chuyên trách theo dõi và giảm thiểu nhiều rủi ro, từ thông tin sai lệch và lạm dụng sinh học, can thiệp bầu cử đến kỹ năng sao chép tự động.

Hình ảnh thể hiện hiệu suất của Claude 3 khi so sánh với OpenAI và Google Gemini.
Hình ảnh thể hiện hiệu suất của Claude 3 khi so sánh với OpenAI và Google Gemini.

“Chúng tôi tiếp tục phát triển các phương pháp như Hiến pháp AI để cải thiện tính an toàn và minh bạch cho các mô hình của chúng tôi, đồng thời điều chỉnh các mô hình của mình để giảm thiểu các vấn đề về quyền riêng tư có thể nảy sinh do các phương thức mới. Việc giải quyết những thành kiến trong các mô hình ngày càng phức tạp là một nỗ lực không ngừng và chúng tôi đã đạt được những bước tiến với bản phát hành mới này. Chúng tôi vẫn cam kết cải tiến các kỹ thuật nhằm giảm thành kiến và thúc đẩy tính trung lập hơn trong các mô hình của chúng tôi, đảm bảo chúng không thiên về bất kỳ lập trường đảng phái cụ thể nào,” công ty cho biết.

OPENAI ĐANG GẶP LOẠT ĐỐI THỦ CẠNH TRANH TỪ CHATGPT ĐẾN SORA

Một sản phẩm OpenAI khác có thể sớm phải đối mặt với những kẻ thách thức là Sora. Trình tạo chuyển văn bản thành video đã được phát hành gần đây và đã chứng minh thành công nhờ khả năng tạo video dựa trên lời nhắc. Trong khi hầu hết các trình tạo chuyển văn bản thành video thường tạo nội dung dựa trên thư viện cảnh mà họ có quyền truy cập, SoraAI thực sự tạo nội dung mới dựa trên lời nhắc.

Với tiềm năng của công cụ này, có những lo ngại về việc nó sẽ ảnh hưởng như thế nào đến sinh kế của các nghệ sĩ và nhà thiết kế đồ họa. Tuy nhiên, đó có thể không phải là vấn đề duy nhất khi các đối thủ hiện nay cũng đang tìm cách phát triển phiên bản riêng của mẫu concept này.

Theo báo Trung Quốc SCMP, một nhóm các nhà nghiên cứu đang thực hiện nỗ lực mới để phát triển câu trả lời của Trung Quốc cho Sora. Các giáo sư từ Đại học Bắc Kinh của Trung Quốc và công ty AI Rabbitpre có trụ sở tại Thâm Quyến đã cùng nhau khởi động kế hoạch Open-Sora trên một trang trên GitHub, với sứ mệnh “tái tạo mô hình tạo video của OpenAI”.

Kế hoạch Open-Sora nhằm mục đích tái tạo một phiên bản “đơn giản và có thể mở rộng” của mô hình tạo video của OpenAI với sự trợ giúp từ cộng đồng nguồn mở. OpenAI bắt đầu cơn sốt AI toàn cầu vào cuối năm 2023 với việc ra mắt chatbot tạo ChatGPT.

Một số công ty công nghệ khác của Trung Quốc cũng đang phát triển các phiên bản AI chuyển văn bản thành video của riêng họ. Vào tháng 1 năm 2024, Tencent AI đã phát hành hộp công cụ chỉnh sửa và tạo video nguồn mở có tên VideoCrafter2, có khả năng tạo video từ văn bản.

Ngoài Tencent, chủ sở hữu TikTok, ByteDance cũng phát hành mô hình chuyển văn bản thành video MagicVideo-V2. Theo trang GitHub của dự án, nó kết hợp “mô hình chuyển văn bản thành hình ảnh, trình tạo chuyển động video, mô-đun nhúng hình ảnh tham chiếu và mô-đun nội suy khung vào một đường dẫn tạo video từ đầu đến cuối”.

Trong số các đối thủ của OpenAI, Alibaba cũng đang tham gia vào cuộc chiến này. Phòng thí nghiệm thông minh Damo Vision của gã khổng lồ công nghệ đã phát hành ModelScope, cũng là một mô hình chuyển văn bản thành video. Tuy nhiên, mô hình này hiện chỉ hỗ trợ đầu vào tiếng Anh và đầu ra video bị giới hạn trong hai giây.