Lịch trình làm việc từ một nhân viên Alibaba cho thấy tham vọng LLM của Trung Quốc
Bảo Ngọc
02/03/2024
Nhiều công ty công nghệ Trung Quốc đang tập hợp tất cả nguồn lực và nhân tài nhằm thu hẹp khoảng cách với OpenAI…
Bài đăng trên mạng xã hội X gần đây của một nhà nghiên cứu đang làm việc tại Alibaba cung cấp góc nhìn sơ bộ hiếm hoi về công cuộc phát triển mô hình ngôn ngữ lớn (LLM) tại gã khổng lồ thương mại điện tử, đồng thời cũng nằm trong số những big tech Trung Quốc đang cố gắng bắt kịp khả năng của ChatGPT, theo TechCrunch.
VĂN HOÁ LÀM VIỆC TẠI HAI ĐẦU THẾ GIỚI
Ông Binyuan Hui, nhà nghiên cứu phụ trách xử lý ngôn ngữ tự nhiên tại nhóm dự án mô hình ngôn ngữ lớn Qwen thuộc Alibaba, đã chia sẻ lịch trình hàng ngày trên mạng xã hội X, đáp trả bài đăng của nhà nghiên cứu OpenAI Jason Wei đã lan truyền gần đây.
Một ngày điển hình của các nhà nghiên cứu cho thấy những điểm tương đồng nổi bật, với thời gian thức dậy lúc 9 giờ sáng và đi ngủ vào khoảng 1 giờ đêm. Cả hai đều bắt đầu ngày mới bằng các cuộc họp, sau đó là thời gian coding, đào tạo mô hình và chuyên tâm nghiên cứu cùng đồng nghiệp. Ngay cả sau khi về nhà, nhiều chuyên gia vẫn tiếp tục chạy thử nghiệm vào ban đêm và suy ngẫm về phương pháp cải thiện mô hình trước khi đi ngủ.
Sự khác biệt đáng chú ý là ở cách nhân viên hai công ty mô tả thời gian giải trí. Nhà nghiên cứu Hui, nhân viên của Alibaba, đã đề cập đến thói quen đọc thêm nhiều tài liệu nghiên cứu và lướt X để cập nhật “những gì đang xảy ra trên thế giới”. Và tất nhiên, Hui không uống một ly rượu sau khi về đến nhà như Wei từ OpenAI.
Chế độ làm việc cường độ cao không phải là điều đáng ngạc nhiên trong bối cảnh chạy đua LLM khốc liệt hiện tại của Trung Quốc, nơi những tài năng công nghệ sở hữu bằng đại học hàng đầu đang gia nhập các gã khổng lồ để xây dựng mô hình AI mang tính cạnh tranh.
Ở khía cạnh nhất định, lịch trình khắt khe của Binyan Hui dường như phản ánh động lực cá nhân mong muốn vượt xa các big tech ở Thung lũng Silicon trong lĩnh vực AI. Lịch trình có vẻ khác với giờ làm việc “996” gắn liền với nhiều cơ sở loại hình kinh doanh internet “truyền thống” hơn của Trung Quốc, thường xuyên được áp dụng trong một số ngành khác, chẳng hạn như trò chơi điện tử và thương mại điện tử.
Được biết, 996 là thuật ngữ chỉ văn hoá làm việc của người dân Trung Quốc với phương thức và chế độ làm việc khắt khe từ 9 giờ sáng đến 9 giờ tối, liên tục 6 ngày trong một tuần.
Quả thực, ngay cả nhà đầu tư AI và nhà khoa học máy tính nổi tiếng Kai-Fu Lee cũng đã đánh đổi và nỗ lực rất nhiều để chạm tới thành công. Khi phóng viên của TechCrunch phỏng vấn ông Lee về kỳ lân LLM 01.AI mới thành lập vào tháng 11 năm ngoái, ông đã thừa nhận vấn đề làm thêm giờ xuất hiện thường xuyên nhưng nhân viên vẫn sẵn sàng làm việc chăm chỉ. Thời điểm đó, nhân viên công ty đã nhắn tin cho ông lúc 2:15 sáng để bày tỏ sự phấn khích khi được trở thành một phần sứ mệnh của 01.AI.
CHẠY ĐUA LLM TẠI TRUNG QUỐC
Một số biểu hiện bên ngoài về tinh thần làm việc mãnh liệt nói lên tính cấp thiết của mục tiêu mà các công ty Trung Quốc đặt ra và tốc độ mà các công ty đó triển khai LLM.
Ví dụ, dự án Qwen đã tạo nguồn mở cho một loạt mô hình nền tảng được đào tạo bằng cả dữ liệu tiếng Anh và tiếng Trung. Số lượng tham số - con số biểu thị kiến thức mà mô hình thu được từ dữ liệu đào tạo nhằm đưa ra phản hồi phù hợp theo ngữ cảnh - là 72 tỷ. Làm phép so sánh đơn giản, GPT3 từ OpenAI được cho là có 175 tỷ tham số; GPT4, LLM mới nhất của công ty, có 1,7 nghìn tỷ.
Nhóm nghiên cứu cũng đã nhanh chóng giới thiệu một số ứng dụng thương mại. Tháng 4 năm ngoái, Alibaba bắt đầu tích hợp Qwen vào nền tảng truyền thông doanh nghiệp DingTalk và nhà bán lẻ trực tuyến Tmall.
Cho đến nay, chưa có nhà lãnh đạo thực sự nào xuất hiện trong không gian LLM Trung Quốc. Hầu hết quỹ đầu tư mạo hiểm cũng như nhà đầu tư doanh nghiệp đều đặt cược vào nhiều người chơi trên thị trường. Bên cạnh công cuộc xây dựng LLM nội bộ, Alibaba còn tích cực đầu tư vào các công ty khởi nghiệp như Moonshot AI, Zhipu AI, Baichuan và 01.AI.
Đối mặt với bối cảnh cạnh tranh, Alibaba đang cố gắng khẳng định vị trí tiên phong trên thị trường. Vào tháng 12 vừa qua, đại gia công nghệ Trung Quốc đã phát hành LLM khả dụng với một số ngôn ngữ Đông Nam Á. Với tên gọi SeaLLM, mô hình có khả năng xử lý thông tin bằng tiếng Việt, tiếng Indonesia, tiếng Thái, tiếng Mã Lai, tiếng Khmer, tiếng Lào, tiếng Tagalog và tiếng Miến Điện. Trước đó, thông qua hoạt động kinh doanh điện toán đám mây và mua lại nền tảng thương mại điện tử Lazada, Alibaba đã tạo dựng được dấu ấn khá lớn trong khu vực và được dự đoán hoàn toàn có khả năng quảng bá SeaLLM cho nhiều dịch vụ trong tương lai.
Từ khóa:
Không chỉ hàng hóa công nghệ tăng mạnh, các dịch vụ viễn thông, máy tính và công nghệ thông tin cũng tăng, nhờ nhu cầu ngày càng lớn đối với các mô hình AI của Trung Quốc trên thị trường quốc tế...
Trung Quốc đang đẩy mạnh yêu cầu sử dụng năng lượng xanh đối với các trung tâm dữ liệu trí tuệ nhân tạo (AI). Nhu cầu điện phục vụ làn sóng AI ngày càng tạo sức ép lớn lên hệ thống điện quốc gia và mục tiêu giảm phát thải carbon của Bắc Kinh...
TikTok vừa công bố kế hoạch đầu tư 25 tỷ USD vào các dự án hạ tầng dữ liệu tại Thái Lan, đánh dấu khoản đầu tư lớn nhất từ trước đến nay của nền tảng video ngắn này tại Đông Nam Á...
Thứ từng là lợi thế lớn nhất của ngành phần mềm Ấn Độ – nguồn nhân lực đông đảo và giá rẻ – có nguy cơ trở thành điểm yếu trong kỷ nguyên AI...
Điểm đáng chú ý là mức định giá của DeepSeek đã tăng mạnh chỉ trong thời gian ngắn. Khi bắt đầu quá trình gọi vốn cách đây vài tuần, startup này được định giá khoảng 20 tỷ USD…
Đây là lần đầu tiên trong lịch sử hãng điện tử lớn nhất Hàn Quốc đạt được cột mốc này, đồng thời trở thành công ty châu Á thứ hai làm được điều đó, sau Taiwan Semiconductor Manufacturing Co...
Theo thống kê, trong số 64 nhà máy mới dự kiến đi vào hoạt động tại châu Á đến năm 2029, chỉ có 6 cơ sở đặt tại Đông Nam Á, phần lớn còn lại tập trung ở Trung Quốc và Đài Loan (Trung Quốc)…
Động lực tăng trưởng của Huawei không chỉ đến từ nhu cầu thị trường, mà còn từ việc Nvidia gặp nhiều rào cản pháp lý với cả Washington và Bắc Kinh...
Thị trường robot hình người đã bắt đầu tạo ra các đơn hàng thực tế cho chuỗi cung ứng điện tử Trung Quốc…
Một tòa án tại Trung Quốc vừa ra phán quyết mang tính bước ngoặt: doanh nghiệp không thể đơn phương chấm dứt hợp đồng lao động với lý do thay thế con người bằng trí tuệ nhân tạo…