Phía sau hành trình 6 năm kiến tạo hệ sinh thái công nghệ & AI tự chủ của VnEconomy

Phía sau hành trình 6 năm kiến tạo hệ sinh thái công nghệ & AI tự chủ của VnEconomy

Đây là những chia sẻ đáng chú ý của ông Nguyễn Sỹ Hoàng, Phó Tổng Thư ký Tòa soạn VnEconomy tại Lễ kỷ niệm 35 năm thành lập Thời báo Kinh tế Việt Nam - Tạp chí Kinh tế Việt Nam và 6 năm chuyển đổi toàn diện, phát triển nền tảng công nghệ AI Askonomy diễn ra chiều ngày 26/6.

Nhắc lại bước ngoặt lịch sử của tòa soạn, ông Nguyễn Sỹ Hoàng cho biết, muốn hiểu được hành trình phát triển của hệ sinh thái hiện tại, phải quay ngược thời gian về 6 năm trước.

Đó là năm 2020, khi Thời báo Kinh tế Việt Nam thực hiện cuộc chuyển đổi mô hình quan trọng thành Tạp chí Kinh tế Việt Nam. "Ngay từ thời điểm bứt phá đó, ban lãnh đạo đã đưa ra một định hướng mang tính chiến lược: biến VnEconomy thành một hub thông tin kinh tế toàn diện – một nhiệm vụ mang tính bước ngoặt và hoàn toàn khác biệt so với giai đoạn trước", ông Hoàng chia sẻ.

CHUẨN HOÁ, LƯU TRỮ DỮ LIỆU: BÀI TOÁN ĐẦY THÁCH THỨC

Ông Nguyễn Sỹ Hoàng cho biết trái tim của một "hub thông tin kinh tế" là dữ liệu. Tuy nhiên câu chuyện thu thập, chuẩn hóa, lưu trữ dữ liệu và phân phối đến độc giả qua các kênh nào, là bài toán rất khó khăn ở thời điểm năm 2020, bởi vì các định dạng dữ liệu khác nhau khiến việc chuẩn hóa gặp nhiều trở ngại, và mô hình cơ sở dữ liệu kiểu cũ không còn phù hợp nữa.

Đến năm 2022, ChatGPT ra đời. Tạp chí Kinh tế Việt Nam nhìn thấy mô hình ngôn ngữ lớn có thể học và đào tạo dữ liệu một cách tự động và phân phối qua các hỏi đáp trực tiếp, thay vì người đọc phải tra cứu qua các công cụ tìm kiếm thông thường và lọc qua hàng chục bài báo khác nhau.

“Trong suốt 6 năm qua, chúng tôi đã lần lượt phối hợp với các đối tác để nâng cấp và phát triển công cụ AI của mình. Thành quả mới nhất là xây dựng được một hệ sinh thái AI bao gồm nhiều công cụ được tích hợp trong một nền tảng thông minh. Đến nay, toàn bộ hệ sinh thái này được tích hợp hoàn toàn vào nền tảng CMS để quản trị dữ liệu”, ông Nguyễn Sỹ Hoàng cho biết.

NHỮNG QUYẾT ĐỊNH KHIẾN VNECONOMY CHỌN PHÁT TRIỂN MÔ HÌNH RIÊNG

Phó Tổng Thư ký Tòa soạn VnEconomy chia sẻ rằng một câu hỏi ông rất hay gặp khi đi giới thiệu về thành quả của tòa soạn là tại sao phải chọn con đường khó khăn hơn là phát triển một giải pháp riêng trong khi ChatGPT hay Gemini đã làm rất tốt rồi.

Bản thân ông nhìn nhận, đến thời điểm này, câu hỏi đó không còn nhiều ý nghĩa nữa. Thực tế hiện nay, không ít các tổ chức tài chính, công ty kiểm toán hay những hãng luật đều đang tự phát triển mô hình AI riêng của họ. Và điểm chung của tất cả là không một ai muốn dữ liệu của mình, của khách hàng vượt ra khỏi vòng bảo mật.

Ông Nguyễn Sỹ Hoàng, Phó Tổng Thư ký Tòa soạn VnEconomy
Ông Nguyễn Sỹ Hoàng, Phó Tổng Thư ký Tòa soạn VnEconomy

Đối với một cơ quan báo chí, ông Hoàng cho biết có bốn lý do chính để phát triển mô hình riêng.

Thứ nhất là tính chính thống và chính xác. Đối với một cơ quan báo chí, tất cả dữ liệu đưa ra bên ngoài bắt buộc phải chính thống và chính xác. Để đạt được điều đó thì cần phải kiểm soát được mô hình, kiểm soát được quá trình đào tạo, kiểm soát được dữ liệu đầu vào.

Thứ hai là sự chuyên biệt về dữ liệu. ChatGPT hay Gemini được đào tạo với dữ liệu rất rộng, rất đại trà. Còn mô hình nhỏ mà lãnh đạo Tạp chí Kinh tế Việt Nam hay dùng hình ảnh “con kiến” khi nói đến, được đào tạo chuyên biệt riêng cho dữ liệu kinh tế. Và khi kiểm soát được mô hình, chúng tôi có thể đưa vào nhiều dạng dữ liệu khác nhau - cả dữ liệu phi cấu trúc như các bài báo, lẫn dữ liệu có cấu trúc phục vụ cho các số liệu kinh tế.

Thứ ba là tối ưu chi phí. Hiện nay không khó để đọc những bài báo nói về việc các doanh nghiệp bị rơi vào bẫy chi phí giá rẻ ban đầu, nhưng sau đó là “hóa đơn token khổng lồ”. Chi phí đó liên quan đến việc khi dữ liệu càng phát triển, cửa sổ ngữ cảnh trao đổi (context window) càng lớn, hoặc càng nhiều người sử dụng thì chi phí token càng cao, dẫn đến hiệu quả sinh lời từ các hoạt động không thể cân bằng được với bài toán chi phí.

Thứ tư là khả năng kiểm soát mô hình. “Khi chúng tôi làm chủ mô hình, chúng tôi có thể tích hợp chặt chẽ vào tất cả các quy trình của tòa soạn cũng như hỗ trợ tích cực vào những quy trình xử lý dữ liệu của doanh nghiệp đối tác”, ông Nguyễn Sỹ Hoàng nói.

BA TRỤ CỘT VÀ BỐN LỢI THẾ CỐT LÕI CỦA HỆ SINH THÁI AI ASKONOMY

Phó Tổng Thư ký Tòa soạn VnEconomy cũng đã chỉ ra bốn lợi thế của hệ sinh thái công nghệ AI Askonomy.

Lợi thế thứ nhất là tự chủ công nghệ, đồng nghĩa với việc có thể tiết giảm chi phí về dài hạn. Tự chủ công nghệ cũng mang lại sự linh hoạt rất lớn, như chỉnh sửa các tham số để làm cho độ chính xác và tin cậy của mô hình ngày càng cao hơn.

Lợi thế thứ hai là bảo mật và an toàn thông tin. Điều này rất quan trọng đối với cả báo chí lẫn doanh nghiệp. Triển khai trên hệ thống server nội bộ sẽ không bị lộ lọt thông tin nhạy cảm ra bên ngoài.

Lợi thế thứ ba là tính chuyên biệt. Khi chỉ sử dụng dữ liệu kinh tế đã được kiểm soát và xác thực, độ tin cậy của kết quả tra cứu tương đương với việc trích dẫn từ chính Tạp chí Kinh tế Việt Nam.

Lợi thế thứ tư, đây cũng là lợi thế lớn nhất mà Tạp chí Kinh tế Việt Nam có thể mang lại cho các đối tác.

Theo chia sẻ của ông Nguyễn Sỹ Hoàng, thành quả đóng gói và sẵn sàng chuyển giao công nghệ ở thời điểm hiện tại của VnEconomy và các đối tác công nghệ như Hemera và Actable AI được đổi bằng 6 năm ròng rã với rất nhiều vấp ngã và sai lầm phải sửa chữa. Việc liên tục tái đào tạo nội dung và mô hình trong suốt thời gian qua chính là để tạo ra một lối đi sẵn có, giúp các đơn vị khác tối ưu hóa lộ trình mà không phải lặp lại những thử thách cũ.

Hệ sinh thái Askonomy được xây dựng trên ba trụ cột chính.

Trụ cột thứ nhất là Asko Smart, một trợ lý AI Agentic bao gồm nhiều tính năng khác nhau, từ tra cứu kinh tế chuyên ngành, chuyển âm thanh thành văn bản, đến tạo giọng đọc tự động và nhiều tính năng khác.

Trụ cột thứ hai là Asko Meet, công cụ phiên dịch trực tiếp.

Trụ cột thứ ba Asko CMS, tích hợp toàn bộ vào một hệ thống quản trị nội dung CMS.