Lịch trình làm việc từ một nhân viên Alibaba cho thấy tham vọng LLM của Trung Quốc
Nhiều công ty công nghệ Trung Quốc đang tập hợp tất cả nguồn lực và nhân tài nhằm thu hẹp khoảng cách với OpenAI…
Bài đăng trên mạng xã hội X gần đây của một nhà nghiên cứu đang làm việc tại Alibaba cung cấp góc nhìn sơ bộ hiếm hoi về công cuộc phát triển mô hình ngôn ngữ lớn (LLM) tại gã khổng lồ thương mại điện tử, đồng thời cũng nằm trong số những big tech Trung Quốc đang cố gắng bắt kịp khả năng của ChatGPT, theo TechCrunch.
VĂN HOÁ LÀM VIỆC TẠI HAI ĐẦU THẾ GIỚI
Ông Binyuan Hui, nhà nghiên cứu phụ trách xử lý ngôn ngữ tự nhiên tại nhóm dự án mô hình ngôn ngữ lớn Qwen thuộc Alibaba, đã chia sẻ lịch trình hàng ngày trên mạng xã hội X, đáp trả bài đăng của nhà nghiên cứu OpenAI Jason Wei đã lan truyền gần đây.
Một ngày điển hình của các nhà nghiên cứu cho thấy những điểm tương đồng nổi bật, với thời gian thức dậy lúc 9 giờ sáng và đi ngủ vào khoảng 1 giờ đêm. Cả hai đều bắt đầu ngày mới bằng các cuộc họp, sau đó là thời gian coding, đào tạo mô hình và chuyên tâm nghiên cứu cùng đồng nghiệp. Ngay cả sau khi về nhà, nhiều chuyên gia vẫn tiếp tục chạy thử nghiệm vào ban đêm và suy ngẫm về phương pháp cải thiện mô hình trước khi đi ngủ.
Sự khác biệt đáng chú ý là ở cách nhân viên hai công ty mô tả thời gian giải trí. Nhà nghiên cứu Hui, nhân viên của Alibaba, đã đề cập đến thói quen đọc thêm nhiều tài liệu nghiên cứu và lướt X để cập nhật “những gì đang xảy ra trên thế giới”. Và tất nhiên, Hui không uống một ly rượu sau khi về đến nhà như Wei từ OpenAI.
Chế độ làm việc cường độ cao không phải là điều đáng ngạc nhiên trong bối cảnh chạy đua LLM khốc liệt hiện tại của Trung Quốc, nơi những tài năng công nghệ sở hữu bằng đại học hàng đầu đang gia nhập các gã khổng lồ để xây dựng mô hình AI mang tính cạnh tranh.
Ở khía cạnh nhất định, lịch trình khắt khe của Binyan Hui dường như phản ánh động lực cá nhân mong muốn vượt xa các big tech ở Thung lũng Silicon trong lĩnh vực AI. Lịch trình có vẻ khác với giờ làm việc “996” gắn liền với nhiều cơ sở loại hình kinh doanh internet “truyền thống” hơn của Trung Quốc, thường xuyên được áp dụng trong một số ngành khác, chẳng hạn như trò chơi điện tử và thương mại điện tử.
Được biết, 996 là thuật ngữ chỉ văn hoá làm việc của người dân Trung Quốc với phương thức và chế độ làm việc khắt khe từ 9 giờ sáng đến 9 giờ tối, liên tục 6 ngày trong một tuần.
Quả thực, ngay cả nhà đầu tư AI và nhà khoa học máy tính nổi tiếng Kai-Fu Lee cũng đã đánh đổi và nỗ lực rất nhiều để chạm tới thành công. Khi phóng viên của TechCrunch phỏng vấn ông Lee về kỳ lân LLM 01.AI mới thành lập vào tháng 11 năm ngoái, ông đã thừa nhận vấn đề làm thêm giờ xuất hiện thường xuyên nhưng nhân viên vẫn sẵn sàng làm việc chăm chỉ. Thời điểm đó, nhân viên công ty đã nhắn tin cho ông lúc 2:15 sáng để bày tỏ sự phấn khích khi được trở thành một phần sứ mệnh của 01.AI.
CHẠY ĐUA LLM TẠI TRUNG QUỐC
Một số biểu hiện bên ngoài về tinh thần làm việc mãnh liệt nói lên tính cấp thiết của mục tiêu mà các công ty Trung Quốc đặt ra và tốc độ mà các công ty đó triển khai LLM.
Ví dụ, dự án Qwen đã tạo nguồn mở cho một loạt mô hình nền tảng được đào tạo bằng cả dữ liệu tiếng Anh và tiếng Trung. Số lượng tham số - con số biểu thị kiến thức mà mô hình thu được từ dữ liệu đào tạo nhằm đưa ra phản hồi phù hợp theo ngữ cảnh - là 72 tỷ. Làm phép so sánh đơn giản, GPT3 từ OpenAI được cho là có 175 tỷ tham số; GPT4, LLM mới nhất của công ty, có 1,7 nghìn tỷ.
Nhóm nghiên cứu cũng đã nhanh chóng giới thiệu một số ứng dụng thương mại. Tháng 4 năm ngoái, Alibaba bắt đầu tích hợp Qwen vào nền tảng truyền thông doanh nghiệp DingTalk và nhà bán lẻ trực tuyến Tmall.
Cho đến nay, chưa có nhà lãnh đạo thực sự nào xuất hiện trong không gian LLM Trung Quốc. Hầu hết quỹ đầu tư mạo hiểm cũng như nhà đầu tư doanh nghiệp đều đặt cược vào nhiều người chơi trên thị trường. Bên cạnh công cuộc xây dựng LLM nội bộ, Alibaba còn tích cực đầu tư vào các công ty khởi nghiệp như Moonshot AI, Zhipu AI, Baichuan và 01.AI.
Đối mặt với bối cảnh cạnh tranh, Alibaba đang cố gắng khẳng định vị trí tiên phong trên thị trường. Vào tháng 12 vừa qua, đại gia công nghệ Trung Quốc đã phát hành LLM khả dụng với một số ngôn ngữ Đông Nam Á. Với tên gọi SeaLLM, mô hình có khả năng xử lý thông tin bằng tiếng Việt, tiếng Indonesia, tiếng Thái, tiếng Mã Lai, tiếng Khmer, tiếng Lào, tiếng Tagalog và tiếng Miến Điện. Trước đó, thông qua hoạt động kinh doanh điện toán đám mây và mua lại nền tảng thương mại điện tử Lazada, Alibaba đã tạo dựng được dấu ấn khá lớn trong khu vực và được dự đoán hoàn toàn có khả năng quảng bá SeaLLM cho nhiều dịch vụ trong tương lai.