Meta ra mắt mô hình AI Llama mạnh nhất với sự hỗ trợ của Nvidia và đối tác đám mây
Meta chính thức công bố phiên bản mới nhất của Llama AI - Llama 3.1. Đây là mô hình AI được cho là lớn nhất, thông minh nhất của Meta từ trước đến nay, đặc biệt tiếp tục duy trì mã nguồn mở…
Vừa qua, Meta đã công bố phiên bản mới nhất của mô hình trí tuệ nhân tạo Llama, có tên là Llama 3.1. Công nghệ Llama mới có ba phiên bản khác nhau, trong đó có một mô hình được đánh giá là thông minh và tân tiến nhất của Meta từ trước đến nay . Giống như một số phiên bản tiền nhiệm, mô hình mới ra mắt tiếp tục sử dụng mã nguồn mở, do đó cá nhân, tổ chức có thể truy cập miễn phí, theo CNBC.
Phiên bản mô hình ngôn ngữ lớn (LLM) lần này nhấn mạnh khoản đầu tư khổng lồ mà CEO Mark Zuckerberg sẵn sàng "xuống tay" nhằm theo kịp xu hướng với những công ty khởi nghiệp hàng đầu như OpenAI và Anthropic hay những gã khổng lồ công nghệ như Google và Amazon.
Thông báo cũng cho thấy mối quan hệ đối tác ngày càng phát triển tốt đẹp giữa Meta và Nvidia. Nvidia là đối tác quan trọng của Meta, cung cấp cho công ty mẹ Facebook chip điện toán (GPU) đào tạo mô hình AI, bao gồm cả phiên bản mới Llama.
Với OpenAI, công ty đặt mục tiêu doanh thu bằng cách bán quyền truy cập vào LLM độc quyền hoặc cung cấp dịch vụ công nghệ. Còn Meta không có kế hoạch kinh doanh ở mảng này, người phát ngôn Meta khẳng định trong cuộc họp báo.
Thay vào đó, tương tự khi phát hành Llama 2 vào mùa hè năm ngoái, Meta duy trì hợp tác với một số công ty công nghệ, cung cấp cho khách hàng quyền truy cập Llama 3.1 thông qua nền tảng điện toán đám mây tương ứng, và bán công cụ quản lý, bảo mật hoạt động kèm phần mềm mới. Một số trong số 25 đối tác doanh nghiệp liên quan đến Llama của Meta bao gồm Amazon Web Services, Google Cloud, Microsoft Azure, Databricks và Dell.
Trong cuộc họp báo cáo kết quả hoạt động trước đây, Giám đốc điều hành Meta Mark Zuckerberg nói với giới phân tích rằng công ty có một số nguồn doanh thu từ quan hệ đối tác Llama. Tuy nhiên, người phát ngôn của Meta cho biết bất kỳ lợi ích tài chính nào cũng chỉ là gia tăng.
Thay vào đó, Meta tin rằng bằng cách đầu tư vào Llama, công nghệ AI liên quan và cung cấp dịch vụ miễn phí thông qua mã nguồn mở, hãng có thể thu hút nhân tài, giảm chi phí đầu tư cơ sở hạ tầng điện toán hay vô vàn lợi ích khác.
Sự ra mắt của Llama 3.1 diễn ra ngay trước hội nghị về đồ họa máy tính tiên tiến, nơi CEO Zuckerberg và Giám đốc Điều hành Nvidia Jensen Huang dự kiến cùng nhau đối thoại.
Gã khổng lồ mạng xã hội Hoa Kỳ là một trong những khách hàng top đầu của Nvidia, không điều hành dịch vụ đám mây phục vụ lợi ích bản thân doanh nghiệp mà cần chip mới để đào tạo mô hình AI, vốn được sử dụng nội bộ. Phiên bản lớn nhất Llama 3.1 mới công bố được đào tạo trên 16.000 bộ xử lý đồ họa H100 của Nvidia.
MỐI QUAN HỆ GIỮA HAI ÔNG LỚN
Đối với Nvidia, kế hoạch Meta đào tạo mô hình nguồn mở để các doanh nghiệp sử dụng và tùy chỉnh sao cho phù hợp mà không phải trả phí hay xin phép, có thể mở rộng việc sử dụng chip của Nvidia và duy trì nhu cầu ở mức cao.
Xây dựng mô hình nguồn mở có thể tiêu tốn hàng trăm triệu hoặc hàng tỷ USD. Không có nhiều công ty có khả năng tài chính để phát triển và vận hành mô hình như vậy với số tiền đầu tư khổng lồ. Google và OpenAI, mặc dù là khách hàng của Nvidia nhưng vẫn giữ kín các mô hình tiên tiến nhất.
Mặt khác, Meta cần một nguồn cung cấp GPU đáng tin cậy nhằm đào tạo mô hình ngày càng mạnh mẽ. Giống như Nvidia, Meta cố gắng xây dựng hệ sinh thái các nhà phát triển ứng dụng AI với phần mềm nguồn mở, ngay cả khi công ty cung cấp dịch vụ miễn phí và rất tốn kém để xây dựng.
Ông Ash Jhaveri, Phó Chủ tịch quan hệ đối tác AI Meta trả lời báo chí rằng tiếp cận nguồn mở mang lại nhiều lợi ích cho Meta, cho phép nhà phát triển tiếp cận công cụ nội bộ và mời họ xây dựng nền tảng. Ông nhận định điều này có lợi cho Meta vì công ty tận dụng được những cải tiến do cộng đồng mã nguồn mở thực hiện.
Trong một bài đăng trên blog, CEO Zuckerberg cho hay công ty đang thực hiện "cách tiếp cận khác" trong việc phát hành Llama và "chúng tôi đang tích cực xây dựng mối quan hệ đối tác để nhiều công ty trong hệ sinh thái cũng có thể cung cấp chức năng độc đáo cho khách hàng".
Vì Meta không phải là nhà cung cấp doanh nghiệp nên nếu có nhu cầu, công ty sẽ giới thiệu những tổ chức quan tâm Llama đến một trong số đối tác chẳng hạn như Nvidia.
Phiên bản lớn nhất của dòng Llama 3.1 được gọi là Llama 3.1 405B. Mô hình ngôn ngữ này chứa 405 tỷ tham số - biến số quyết định kích thước tổng thể của mô hình và lượng dữ liệu có thể xử lý.
Một LLM lớn với lượng tham số khủng có thể thực hiện nhiệm vụ phức tạp hơn so với LLM nhỏ, chẳng hạn như hiểu ngữ cảnh trong nội dung văn bản dài, giải phương trình toán và thậm chí tạo ra dữ liệu tổng hợp để cải thiện một số mô hình AI nhỏ hơn.
Meta đồng thời phát hành các phiên bản nhỏ hơn là Llama 3.1 8B và Llama 3.1 70B. Về cơ bản, chúng là phiên bản nâng cấp của mô hình tiền nhiệm, cung cấp năng lượng cho chatbot và trợ lý mã hóa phần mềm.
Người phát ngôn của Meta cho biết, người dùng WhatsApp và Meta.AI tại Hoa Kỳ có thể linh hoạt chuyển đổi giữa LLM Llama 3.1 khổng lồ với phiên bản nhỏ hơn để nhận câu trả lời phù hợp nhất.