Google ra mắt mô hình AI nguồn mở Gemma
26/02/2024
Google tiết lộ sẽ ra mắt mô hình AI nguồn mở miễn phí nhằm cạnh tranh với các mô hình từ Meta và một số công ty khởi nghiệp AI được tài trợ tốt như Mistral và Hugging Face…
Mô hình nguồn mở AI này có tên là Gemma, được mở cho các nhà phát triển và nhà nghiên cứu AI sử dụng và phân phối lại cho mục đích thương mại. Động thái này đã thay đổi cái nhìn của công chúng với gã khổng lồ này–từng bị chỉ trích vì công nghệ AI khép kín trong khi toàn ngành mở rộng hợp tác để nghiên cứu AI.
Trong khi, Gemini, mô hình ngôn ngữ của Google cạnh tranh với ChatGPT của OpenAI, được xây dựng dựa trên mô hình nhẹ; Gemma có hai kích cỡ, phiên bản nhỏ hơn và lớn hơn với tên gọi lần lượt là Gemma 2B và 7B, có thể chạy trực tiếp trên máy tính xách tay hay máy tính để bàn. Mô hình mở này sẽ giúp các nhà phát triển và nhà nghiên cứu xây dựng các hệ thống AI khác.
PHÂN CỰC NGUỒN MỞ VÀ ĐÓNG TRONG CUỘC ĐUA AI
Trong khi các công ty như Meta, Hugging Face và Mistral ủng hộ quyền truy cập nguồn mở, giúp công nghệ này phổ biến rộng rãi dưới danh nghĩa hợp tác và tiến bộ khoa học. Ở phía ngược lại, các công ty như Google và OpenAI , lại ủng hộ việc nghiên cứu khép kín độc quyền được kiểm soát chặt chẽ với lý do là giảm thiểu rủi ro và có thể ngăn chặn hành vi lạm dụng dễ dàng hơn.
Bộ phận điện toán đám mây AWS của Amazon cũng đã đứng giữa cả hai phe, ban đầu thân thiện với những người chơi nguồn mở như Hugging Face và sau đó ký kết hợp tác với Anthropic, công ty cung cấp các mô hình độc quyền.
Khi Google phát hành phiên bản Gemini mới nhất, được gọi là Gemini 1.5, công ty chỉ cung cấp phần mềm cho các nhà phát triển và khách hàng trên nền tảng đám mây của Google. Tuy nhiên, Gemma thì khác, điều này cho thấy một chiến lược mở rộng cho Google. Thậm chí, nhà khoa học trưởng của Meta, Yann LeCun từng chia sẻ với Forbes trong một cuộc phỏng vấn vào tháng 11: “Họ ngày càng trở nên ít cởi mở hơn. Tôi nghĩ nó sẽ làm chậm tiến độ trong toàn bộ lĩnh vực”.
GEMMA VƯỢT QUA HIỆU SUẤT CỦA CÁC MÔ HÌNH MỞ KHÁC
Các mô hình Gemma có hai kích cỡ: Gemma 2B bao gồm mạng lưới thần kinh với 2 tỷ biến có thể điều chỉnh, được gọi là tham số và Gemma 7B là mạng lưới thần kinh với 7 tỷ tham số. Theo đó, Gemma 2B và 7B đều đạt được hiệu suất tốt nhất trong phân khúc đối với kích thước của chúng so với các mẫu mở khác. Và các mẫu Gemma có khả năng chạy trực tiếp trên máy tính xách tay hoặc máy tính để bàn của nhà phát triển. Đáng chú ý, Gemma vượt qua các mô hình lớn hơn đáng kể về các điểm chuẩn chính trong khi vẫn tuân thủ các tiêu chuẩn khắt khe về kết quả đầu ra an toàn và có trách nhiệm.
Trong buổi ra mắt Gemma gần đây, Google cũng đã phát hành API với các công cụ và hướng dẫn để xây dựng an toàn với mô hình.
Ông Tris Warkentin, Giám đốc quản lý sản phẩm tại Google DeepMind, cho biết Google hy vọng bằng cách cung cấp cả mô hình độc quyền và nguồn mở, Google có thể thu hút nhiều khách hàng hơn để xây dựng các ứng dụng AI của họ hoàn toàn trong Nền tảng đám mây của Google.
Gã khổng lồ này cho biết các mô hình Gemma dựa trên một số nguyên tắc giống như các mô hình Gemini, nhưng các mô hình Gemini được thiết kế để nhập và xuất dữ liệu âm thanh, dữ liệu hình ảnh và văn bản, trong khi các mô hình Gemma chỉ có văn bản. Gemini đa ngôn ngữ, trong khi Gemma sẽ chỉ có tiếng Anh.
RỦI RO TIỀM ẨN CỦA MÔ HÌNH NGUỒN MỞ
Google đã cố gắng khẳng định trách nhiệm của mình so với các đối thủ cạnh tranh khác khi nói đến sự an toàn của các mô hình AI mà hãng đang phát hành. Mặc dù vậy, rõ ràng các mô hình nguồn mở nguy hiểm hơn các mô hình độc quyền. Rất khó để ngăn chặn kẻ xấu sử dụng mô hình cho mục đích bất chính, chẳng hạn như tạo mã phần mềm độc hại.
Các nhà nghiên cứu tại Đại học Carnegie Mellon năm ngoái đã chỉ ra rằng nếu họ có quyền truy cập vào cài đặt mạng lưới thần kinh của mô hình ngôn ngữ nguồn mở, họ có thể tạo ra phần mềm tự động thiết kế các lời nhắc có thể vượt qua các rào cản của cả mô hình nguồn mở đó. cũng như hầu hết các mô hình độc quyền. Điều này thậm chí có thể dễ dàng hơn nếu các mô hình có một số điểm tương đồng, như Google đã nói rằng Gemma và Gemini khá tương đồng với nhau.
TRÁCH NHIỆM CỦA GOOGLE VỚI MÔ HÌNH MỞ MỚI
Chính vì vậy, Google cho biết họ đã xây dựng Gemma với những biện pháp bảo vệ mạnh mẽ nhất có thể với công nghệ nguồn mở, bao gồm kỹ thuật tự động lọc ra một số thông tin cá nhân nhất định và dữ liệu nhạy cảm khác khỏi các tập huấn luyện; phương pháp học tập tăng cường và tinh chỉnh sâu rộng từ phản hồi của con người (RLHF) để điều chỉnh các mô hình với các hành vi có trách nhiệm.
Google cho biết họ đã phát hành Gemma cùng với các hướng dẫn về việc sử dụng và triển khai mô hình một cách có trách nhiệm cũng như một kỹ thuật mới để xây dựng các bộ lọc an toàn mà những người sử dụng mô hình có thể áp dụng để giúp chặn mọi đầu ra có vấn đề từ mô hình.
Jeanine Banks, Phó chủ tịch kiêm Tổng giám đốc và người đứng đầu bộ phận quan hệ phát triển tại Google, cho biết công ty có các điều khoản và điều kiện cấp phép rộng rãi cấm các lập trình viên sử dụng Gemma cho bất kỳ mục đích bất chính nào. Đây là một trong những lý do công ty thích gọi Gemma là “mô hình mở” để phân biệt với phần mềm “nguồn mở” truyền thống. Khác với việc Meta đưa ra các điều khoản cấp phép nhằm ngăn cản các đối thủ Big Tech sử dụng các mô hình nguồn mở Llama 2, Gemma không có những hạn chế thương mại như vậy.
Từ khóa:
Đáng chú ý, làn sóng vốn mới đổ vào robot Trung Quốc đang chuyển sang trọng tâm xây dựng “bộ não” cho robot hình người…
UpScrolled muốn tạo ra không gian nơi người dùng có thể “tự do bày tỏ suy nghĩ, chia sẻ khoảnh khắc và kết nối mọi người” bên ngoài các nền tảng Big Tech truyền thống…
Khi các nội dung AI na ná nhau xuất hiện ngày càng nhiều, cuộc đua tìm kiếm những con người có thể kể chuyện thật sự ngày càng khốc liệt hơn…
Mô hình AI của Google DeepMind có thể giải mã DNA và dự đoán một số đột biến, mở ra hướng đi mới cho nghiên cứu chữa bệnh…
Các bác sĩ cho biết kết quả ban đầu của Neuralink rất đáng khích lệ, nhưng công nghệ hiện vẫn trong giai đoạn thử nghiệm…
Các đối thủ đã kiếm được hàng tỷ đô la trong lĩnh vực kinh doanh chip năm qua, cho thấy rằng Nvidia không phải là người duy nhất thống trị thị trường…
Khi các tính năng sản phẩm và sự hỗ trợ của AI dần trở nên bão hòa, cảm xúc trở thành "chiến trường" cuối cùng để các thương hiệu giành lấy niềm tin khách hàng...
Công nghệ giáo dục đang chuyển sang một kỷ nguyên thích ứng, nơi các hệ thống vận hành như một hệ sinh thái số thống nhất và không ngừng phát triển…
Sự hợp tác được thúc đẩy bởi nhu cầu hiện đại hóa và tình trạng thiếu hụt nhân sự tại Nhật Bản, giữa lúc Việt Nam nổi lên là điểm đến tối ưu nhờ năng lực chuyên môn, khả năng mở rộng đội ngũ và kinh nghiệm làm việc dày dặn với khách hàng Nhật...
Hackathon nhấn mạnh cách tiếp cận giải quyết vấn đề từ thực tiễn, việc sử dụng AI một cách có trách nhiệm và đạo đức, cũng như sự phù hợp của giải pháp với điều kiện khí hậu và bối cảnh địa phương của Đồng bằng sông Cửu Long...