Một công cụ AI trích xuất bảng biểu siêu nhanh của Việt Nam góp mặt tại Hội nghị Châu Âu về Trí tuệ nhân tạo

26/10/2024, 09:42

Tại hội nghị ECAI - Hội nghị Châu Âu về Trí tuệ nhân tạo 2024, một giải pháp nhận diện, trích xuất thông tin từ bảng biểu trong thời gian thực với tốc độ nhanh gấp 4 lần so với các giải pháp hiện có trên thế giới được phát triển bởi đội ngũ kỹ sư Việt Nam đã được công bố…

Viettel AI đã công bố giải pháp tự động trích xuất cấu trúc bảng biểu bằng AI tại Hội nghị Châu Âu về Trí tuệ nhân tạo 2024.
Viettel AI đã công bố giải pháp tự động trích xuất cấu trúc bảng biểu bằng AI tại Hội nghị Châu Âu về Trí tuệ nhân tạo 2024.

Tại hội nghị, nhóm nghiên cứu đến từ Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đã công bố giải pháp tự động trích xuất cấu trúc bảng biểu trong thời gian thực, giúp đẩy tốc độ trích xuất thông tin nhanh hơn 4 lần so với các giải pháp hiện có trên thị trường trong nước và quốc tế. 

Tự động trích xuất dữ liệu là việc sử dụng công nghệ, như trí tuệ nhân tạo (AI) và nhận diện ký tự quang học (OCR) để tự động lấy thông tin từ các nguồn như văn bản, hình ảnh, hoặc tài liệu scan và chuyển đổi chúng thành định dạng dễ xử lý, ví dụ như file Excel. Đây là nghiệp vụ được thực hiện nhiều trong ứng dụng văn phòng số, hỗ trợ đắc lực cho quá trình số hóa giấy tờ vật lý tại các tổ chức. 

Mặc dù chữ viết đã được xử lý khá hiệu quả, việc nhận diện và trích xuất chính xác thông tin từ các bảng biểu trong tài liệu đến nay vẫn là một bài toán khó. Tự động hóa quá trình này giúp giảm bớt công việc nhập liệu thủ công, tăng độ chính xác và tốc độ xử lý văn bản.

Theo đại diện nhóm nghiên cứu của Viettel AI, giải pháp trích xuất dữ liệu từ bảng biểu của Viettel AI có tốc độ xử lý nhanh gấp 4 lần so với công nghệ hiện nay, lên tới 40 FPS (khung hình/giây) trong một số trường hợp. Đặc biệt, mặc dù đẩy mạnh tốc độ, độ chính xác vẫn được đảm bảo tương đương các giải pháp hiện có, với độ khác biệt chỉ khoảng 2% trên các tập dữ liệu chuẩn. 

Thay vì trích xuất thông tin bằng hai giai đoạn như thông thường, nhóm nghiên cứu đã giảm quá trình xuống còn một giai đoạn, giúp xử lý những loại bảng nhiều hàng, cột nhanh chóng hơn. Giải pháp này còn tiếp cận theo hướng giảm độ phức tạp của quy trình xử lý, giúp tiết kiệm bộ nhớ và huấn luyện mô hình AI dễ dàng hơn, hướng đến những cải thiện ưu việt hơn nữa trong tương lai.

Đại diện nhóm nghiên cứu cũng cho biết, hiện công nghệ này đã được tích hợp vào Viettel IDP – giải pháp xử lý hồ sơ thông minh do Viettel AI nghiên cứu và phát triển. 

Viettel IDP có khả năng tự động bóc tách thông tin dạng ảnh với tốc độ dưới 2 giây/trang tài liệu, nhanh hơn 60-80 lần so với nhập liệu thủ công, độ chính xác lên tới 90%, giúp người dùng tiết kiệm 80% thời gian phê duyệt hồ sơ. Công nghệ được công bố tại Hội nghị ECAI 2024 là bước đầu trong quá trình tăng tốc độ xử lý của Viettel IDP, hướng đến mục tiêu xử lý thông tin không chỉ dưới 2 giây mà là tức thì.

ECAI là một trong những hội nghị thường kỳ có uy tín hàng đầu thế giới về AI, thu hút sự tham dự của hàng trăm chuyên gia, nhà nghiên cứu và nhà khoa học xuất sắc đến từ nhiều quốc gia trên thế giới. Đây là nơi quy tụ những nghiên cứu và công nghệ mới nhất, là bệ phóng cho những ý tưởng và giải pháp mang tính đột phá trong lĩnh vực AI. ECAI 2024 được Hiệp hội Trí tuệ Nhân tạo Châu Âu và Hiệp hội Trí tuệ Nhân tạo Tây Ban Nha phối hợp tổ chức.

Viettel AI là đơn vị trực thuộc Tập đoàn Công nghiệp – Viễn thông Quân đội (Viettel), tiên phong làm chủ và phát triển các sản phẩm, dịch vụ thuộc lĩnh vực AI, Big Data, Robotics và Digital Twin. 

Đọc thêm

Dòng sự kiện

Giá vàng trong nước và thế giới

Giá vàng trong nước và thế giới

VnEconomy cập nhật giá vàng trong nước & thế giới hôm nay: SJC, 9999, giá vàng USD/oz, biến động giá vàng tăng, giảm - phân tích, dự báo & dữ liệu lịch sử.

Bài viết mới nhất

Bài viết mới nhất

Diễn đàn Kinh tế mới Việt Nam 2025

Diễn đàn Kinh tế mới Việt Nam 2025

Sáng kiến Diễn đàn thường niên Kinh tế mới Việt Nam (VNEF) đã được khởi xướng và tổ chức thành công từ năm 2023. VNEF 2025 (lần thứ 3) có chủ đề: "Sức bật kinh tế Việt Nam: từ nội lực tới chuỗi giá trị toàn cầu".

Bài viết mới nhất

VnEconomy Interactive

VnEconomy Interactive

Interactive là một sản phẩm báo chí mới của VnEconomy vừa được ra mắt bạn đọc từ đầu tháng 3/2023 đã gây ấn tượng mạnh với độc giả bởi sự mới lạ, độc đáo. Đây cũng là sản phẩm độc quyền chỉ có trên VnEconomy.

Bài viết mới nhất

Trợ lý thông tin kinh tế Askonomy - Asko Platform

Trợ lý thông tin kinh tế Askonomy - Asko Platform

Trong kỷ nguyên trí tuệ nhân tạo, đặc biệt là generative AI, phát triển mạnh mẽ, Tạp chí Kinh tế Việt Nam/VnEconomy đã tiên phong ứng dụng công nghê để mang đến trải nghiệm thông tin đột phá với chatbot AI Askonomy...

Bài viết mới nhất

30 quốc gia có năng lực cạnh tranh về AI cao nhất thế giới

30 quốc gia có năng lực cạnh tranh về AI cao nhất thế giới

Sửa đổi Luật Thống kê: “Khơi thông” dòng chảy dữ liệu từ cấp cơ sở

Sửa đổi Luật Thống kê: “Khơi thông” dòng chảy dữ liệu từ cấp cơ sở

GDP bình quân đầu người của 50 nền kinh tế lớn nhất thế giới trong 25 năm qua

GDP bình quân đầu người của 50 nền kinh tế lớn nhất thế giới trong 25 năm qua

Asko AI Platform

Askonomy AI

...

icon

Thuế đối ứng của Mỹ có ảnh hướng thế nào đến chứng khoán?

Chính sách thuế quan mới của Mỹ, đặc biệt với mức thuế đối ứng 20% áp dụng từ ngày 7/8/2025 (giảm từ 46% sau đàm phán), có tác động đáng kể đến kinh tế Việt Nam do sự phụ thuộc lớn vào xuất khẩu sang Mỹ (chiếm ~30% kim ngạch xuất khẩu). Dưới đây là phân tích ngắn gọn về các ảnh hưởng chính:

VnEconomy