Google ra mắt mô hình AI nguồn mở Gemma

Mô hình nguồn mở AI này có tên là Gemma, được mở cho các nhà phát triển và nhà nghiên cứu AI sử dụng và phân phối lại cho mục đích thương mại. Động thái này đã thay đổi cái nhìn của công chúng với gã khổng lồ này–từng bị chỉ trích vì công nghệ AI khép kín trong khi toàn ngành mở rộng hợp tác để nghiên cứu AI.

Trong khi, Gemini, mô hình ngôn ngữ của Google cạnh tranh với ChatGPT của OpenAI, được xây dựng dựa trên mô hình nhẹ; Gemma có hai kích cỡ, phiên bản nhỏ hơn và lớn hơn với tên gọi lần lượt là Gemma 2B và 7B, có thể chạy trực tiếp trên máy tính xách tay hay máy tính để bàn. Mô hình mở này sẽ giúp các nhà phát triển và nhà nghiên cứu xây dựng các hệ thống AI khác.

PHÂN CỰC NGUỒN MỞ VÀ ĐÓNG TRONG CUỘC ĐUA AI

Trong khi các công ty như Meta, Hugging Face và Mistral ủng hộ quyền truy cập nguồn mở, giúp công nghệ này phổ biến rộng rãi dưới danh nghĩa hợp tác và tiến bộ khoa học. Ở phía ngược lại, các công ty như Google và OpenAI , lại ủng hộ việc nghiên cứu khép kín độc quyền được kiểm soát chặt chẽ với lý do là giảm thiểu rủi ro và có thể ngăn chặn hành vi lạm dụng dễ dàng hơn.

Bộ phận điện toán đám mây AWS của Amazon cũng đã đứng giữa cả hai phe, ban đầu thân thiện với những người chơi nguồn mở như Hugging Face và sau đó ký kết hợp tác với Anthropic, công ty cung cấp các mô hình độc quyền.

Khi Google phát hành phiên bản Gemini mới nhất, được gọi là Gemini 1.5, công ty chỉ cung cấp phần mềm cho các nhà phát triển và khách hàng trên nền tảng đám mây của Google. Tuy nhiên, Gemma thì khác, điều này cho thấy một chiến lược mở rộng cho Google. Thậm chí, nhà khoa học trưởng của Meta, Yann LeCun từng chia sẻ với Forbes trong một cuộc phỏng vấn vào tháng 11: “Họ ngày càng trở nên ít cởi mở hơn. Tôi nghĩ nó sẽ làm chậm tiến độ trong toàn bộ lĩnh vực”.

GEMMA VƯỢT QUA HIỆU SUẤT CỦA CÁC MÔ HÌNH MỞ KHÁC

Các mô hình Gemma có hai kích cỡ: Gemma 2B bao gồm mạng lưới thần kinh với 2 tỷ biến có thể điều chỉnh, được gọi là tham số và Gemma 7B là mạng lưới thần kinh với 7 tỷ tham số. Theo đó, Gemma 2B và 7B đều đạt được hiệu suất tốt nhất trong phân khúc đối với kích thước của chúng so với các mẫu mở khác. Và các mẫu Gemma có khả năng chạy trực tiếp trên máy tính xách tay hoặc máy tính để bàn của nhà phát triển. Đáng chú ý, Gemma vượt qua các mô hình lớn hơn đáng kể về các điểm chuẩn chính trong khi vẫn tuân thủ các tiêu chuẩn khắt khe về kết quả đầu ra an toàn và có trách nhiệm.

Trong buổi ra mắt Gemma gần đây, Google cũng đã phát hành API với các công cụ và hướng dẫn để xây dựng an toàn với mô hình.

Ông Tris Warkentin, Giám đốc quản lý sản phẩm tại Google DeepMind, cho biết Google hy vọng bằng cách cung cấp cả mô hình độc quyền và nguồn mở, Google có thể thu hút nhiều khách hàng hơn để xây dựng các ứng dụng AI của họ hoàn toàn trong Nền tảng đám mây của Google.

Gã khổng lồ này cho biết các mô hình Gemma dựa trên một số nguyên tắc giống như các mô hình Gemini, nhưng các mô hình Gemini được thiết kế để nhập và xuất dữ liệu âm thanh, dữ liệu hình ảnh và văn bản, trong khi các mô hình Gemma chỉ có văn bản. Gemini đa ngôn ngữ, trong khi Gemma sẽ chỉ có tiếng Anh.

RỦI RO TIỀM ẨN CỦA MÔ HÌNH NGUỒN MỞ

Google đã cố gắng khẳng định trách nhiệm của mình so với các đối thủ cạnh tranh khác khi nói đến sự an toàn của các mô hình AI mà hãng đang phát hành. Mặc dù vậy, rõ ràng các mô hình nguồn mở nguy hiểm hơn các mô hình độc quyền. Rất khó để ngăn chặn kẻ xấu sử dụng mô hình cho mục đích bất chính, chẳng hạn như tạo mã phần mềm độc hại.

Các nhà nghiên cứu tại Đại học Carnegie Mellon năm ngoái đã chỉ ra rằng nếu họ có quyền truy cập vào cài đặt mạng lưới thần kinh của mô hình ngôn ngữ nguồn mở, họ có thể tạo ra phần mềm tự động thiết kế các lời nhắc có thể vượt qua các rào cản của cả mô hình nguồn mở đó. cũng như hầu hết các mô hình độc quyền. Điều này thậm chí có thể dễ dàng hơn nếu các mô hình có một số điểm tương đồng, như Google đã nói rằng Gemma và Gemini khá tương đồng với nhau.

TRÁCH NHIỆM CỦA GOOGLE VỚI MÔ HÌNH MỞ MỚI

Ông Warkentin, Giám đốc quản lý sản phẩm tại Google DeepMind cho biết thử nghiệm an toàn của Gemma thậm chí còn rộng hơn so với mô hình Gemini của Google.

Chính vì vậy, Google cho biết họ đã xây dựng Gemma với những biện pháp bảo vệ mạnh mẽ nhất có thể với công nghệ nguồn mở, bao gồm kỹ thuật tự động lọc ra một số thông tin cá nhân nhất định và dữ liệu nhạy cảm khác khỏi các tập huấn luyện; phương pháp học tập tăng cường và tinh chỉnh sâu rộng từ phản hồi của con người (RLHF) để điều chỉnh các mô hình với các hành vi có trách nhiệm.

Google cho biết họ đã phát hành Gemma cùng với các hướng dẫn về việc sử dụng và triển khai mô hình một cách có trách nhiệm cũng như một kỹ thuật mới để xây dựng các bộ lọc an toàn mà những người sử dụng mô hình có thể áp dụng để giúp chặn mọi đầu ra có vấn đề từ mô hình.

Jeanine Banks, Phó chủ tịch kiêm Tổng giám đốc và người đứng đầu bộ phận quan hệ phát triển tại Google, cho biết công ty có các điều khoản và điều kiện cấp phép rộng rãi cấm các lập trình viên sử dụng Gemma cho bất kỳ mục đích bất chính nào. Đây là một trong những lý do công ty thích gọi Gemma là “mô hình mở” để phân biệt với phần mềm “nguồn mở” truyền thống. Khác với việc Meta đưa ra các điều khoản cấp phép nhằm ngăn cản các đối thủ Big Tech sử dụng các mô hình nguồn mở Llama 2, Gemma không có những hạn chế thương mại như vậy.