Mô hình AI lớn nhất của Trung Quốc đang thách thức sự thống trị công nghệ của Hoa Kỳ
Thành công của Alibaba cho thấy Trung Quốc có thể cạnh tranh với các mô hình AI tốt nhất thế giới và đặt ra câu hỏi nghiêm túc về việc các công ty Hoa Kỳ sẽ tiếp tục thống trị lĩnh vực này trong bao lâu...
Cho đến nay, công nghệ AI hầu như vẫn đang do các công ty Hoa Kỳ như OpenAI, Google và Meta thống trị. Tuy nhiên, trong những tháng gần đây, một cái tên mới đã xuất hiện trong danh sách những công ty AI đáng chú ý trên thế giới: Qwen của Alibaba. Vài tháng qua, các biến thể của Qwen đã đứng đầu bảng xếp hạng của các trang web chuyên đo lường hiệu suất các mô hình AI.
BƯỚC NGOẶT KINH NGẠC ĐỐI VỚI NGÀNH CÔNG NGHIỆP AI TRUNG QUỐC
Thậm chí, Clem Delangue, CEO của Hugging Face đã viết hồi tháng 6 rằng "Qwen 72B là vua, và các mô hình của Trung Quốc đang thống trị", sau khi một mô hình dựa trên Qwen lần đầu tiên vươn lên dẫn đầu bảng xếp hạng LLM mở của Hugging Face.
Đây là một bước ngoặt đáng ngạc nhiên đối với ngành công nghiệp AI của Trung Quốc, vốn được nhiều người cho rằng đang phải vật lộn bởi tình trạng bị hạn chế tiếp cận các loại chip cao cấp và sức mạnh tính toán.
Thành công của Qwen cho thấy Trung Quốc có thể cạnh tranh với các mô hình AI tốt nhất thế giới - nó cũng đặt ra câu hỏi nghiêm túc về việc các công ty Hoa Kỳ sẽ tiếp tục thống trị lĩnh vực này trong bao lâu. Bằng cách tập trung vào các khả năng như hỗ trợ ngôn ngữ, Qwen đang mở ra một hướng đi mới về những gì một mô hình AI có thể làm - và nó có thể được xây dựng cho ai.
Những khả năng đó đã gây bất ngờ cho nhiều nhà phát triển, ngay cả những người đang làm việc trên chính Qwen. Nhà phát triển AI David Ng đã sử dụng Qwen để xây dựng mô hình đứng đầu bảng xếp hạng Open LLM. Ông cũng đã xây dựng các mô hình bằng công nghệ của Meta và Google nhưng cho biết Alibaba đã mang lại cho ông kết quả tốt nhất. "Vì một lý do nào đó, Qwen hoạt động tốt nhất trên các mô hình của Trung Quốc", ông nói.
Trong ngắn hạn, phần lớn thành công của Qwen đến từ vị thế độc đáo của công cụ này trên thị trường Trung Quốc. Khi ra mắt, Alibaba tuyên bố rằng có khoảng 90.000 khách hàng đang sử dụng một số mô hình từ loạt LLM Tongyi Qianwen của Alibaba. (Cái tên "Qwen" bắt nguồn từ cách viết tắt của thuật ngữ này, có nghĩa là "kiến thức toàn diện"). Hầu hết khách hàng là các công ty Trung Quốc, những công ty này sẽ không muốn hình thành quan hệ đối tác trực tiếp với các công ty Hoa Kỳ như OpenAI hoặc Anthropic.
Các công ty trên khắp thế giới đang cố gắng tích hợp AI vào các sản phẩm và dịch vụ của họ, và các công ty Trung Quốc cũng không ngoại lệ. Alibaba tuyên bố rằng Qwen có hơn 2,2 triệu người dùng doanh nghiệp, nhưng hầu hết các quan hệ đối tác công khai vẫn đang trong giai đoạn thử nghiệm.
Một sản phẩm do Qwen cung cấp cho bộ phận thiết bị di động của Xiaomi cho phép người dùng tạo công thức nấu ăn từ ảnh chụp món ăn. Qwen cũng cung cấp năng lượng cho trợ lý di động của Xiaomi, được cung cấp trên cả điện thoại di động và hệ thống trong xe hơi.
ALIBABA ĐANG XÂY DỰNG MÔ HÌNH CHUNG CHO TOÀN THẾ GIỚI, THAY VÌ ƯU TIÊN TRUNG QUỐC
Việc xây dựng trên Qwen mang lại cho các công ty Trung Quốc sự ổn định hơn. Các công ty AI của Hoa Kỳ đã cắt quyền truy cập API cho người dùng Trung Quốc, trong khi nhiều trang web AI bị chính quyền trung ương chặn.
Tuy nhiên, quan trọng hơn, Qwen không chỉ là một giải pháp thay thế khả dụng: Nó đang chứng minh rằng nó có khả năng tương đương với những gì có sẵn ở Hoa Kỳ. Khi ra mắt phiên bản Qwen mới nhất, Alibaba đã chia sẻ kết quả chuẩn mực tiếp cận các mô hình hàng đầu từ OpenAI và Anthropic.
Các kỹ sư cũng có thể truy cập mô hình nền tảng của Alibaba từ hầu hết mọi nơi trên hành tinh. Sự thông thạo của Qwen trong các ngôn ngữ chính nằm ngoài hầu hết dữ liệu đào tạo AI của thế giới - bao gồm các ngôn ngữ có ít tài nguyên như tiếng Miến Điện, tiếng Bengal và tiếng Urdu - mang lại cho nó một lợi thế. Để so sánh, các trường hợp sử dụng mô hình AI nguồn mở Llama của Meta chỉ bao gồm tiếng Anh.
Một số người trong ngành coi cho rằng Alibaba đang xây dựng mô hình chung cho toàn thế giới, thay vì ưu tiên Trung Quốc. "Tôi tin rằng chiến lược của Qwen minh họa cho sứ mệnh ban đầu của Alibaba là 'làm cho việc kinh doanh trở nên dễ dàng ở bất cứ đâu'", Tiezhen Wang, một kỹ sư tại Hugging Face, nói và cho biết mô hình này "có tiềm năng cách mạng hóa giao tiếp kinh doanh toàn cầu bằng cách vượt qua ranh giới ngôn ngữ và thậm chí là văn hóa".
Dylan Patel, của công ty nghiên cứu và phân tích độc lập SemiAnalysis, cho rằng mặc dù Qwen không tốt bằng GPT-4, nhưng đủ “gần tốt” để gây ra sự chú ý. Ông Patel cho biết mô hình của Alibaba thường vượt trội hơn các đối thủ của mình trong các lĩnh vực như toán học chính thức và hoạt động đa ngôn ngữ.
Hiệu suất của Qwen đáng chú ý khi xét đến các rào cản thương mại đáng kể của Washington nhằm làm chậm sự phát triển AI của Trung Quốc. Kể từ năm 2022, Hoa Kỳ đã chặn xuất khẩu các chip tiên tiến nhất của Nvidia - cùng loại chip đang cung cấp năng lượng cho thế hệ mô hình AI mới nhất.
Phần lớn thiết bị cần thiết để sản xuất chip tiên tiến trong nước cũng bị chặn xuất khẩu sang Trung Quốc, vì vậy các công ty công nghệ trong nước như Huawei đã phải vật lộn để lấp đầy khoảng trống. Khi các công ty AI chạy đua để tạo ra các mô hình ngày càng phức tạp hơn, họ cần số lượng lớn hơn bao giờ hết sức mạnh xử lý - và lệnh cấm vận chip có nghĩa là các công ty Trung Quốc có nguy cơ thực sự thiếu hụt sức mạnh xử lý đó.
Nhưng trong khi lệnh cấm vận chip vẫn là một yếu tố, các nhà phân tích coi thành công gần đây của AI Trung Quốc là bằng chứng cho thấy bối cảnh chính sách không hoàn toàn phá hủy ngành công nghiệp này.
"Những ban lãnh đạo LLM này ít nhất cũng chứng minh được hệ sinh thái ở Trung Quốc tinh vi như thế nào", Karman Lucero, một thành viên tại Trung tâm Paul Tsai China thuộc Trường Luật Yale, nói. "Các doanh nghiệp Trung Quốc sẽ không thể làm được điều này nếu không có một trình độ tài năng nhất định”.