“Vinaseek sẽ đầu tư để giành thị phần của Google”
"Có vẻ như Google đang bành trướng khủng khiếp và người Việt ta đang dùng Google là chủ yếu"
Trước đây, chúng ta thường tìm kiếm (search) trên mạng Internet bằng các công cụ như: hoatieu.com, panvietnam.com, và đặc biệt là bằng vinaseek.com.
Nhưng từ ngày Google thêm "phiên bản Việt Nam" (có hỗ trợ bảng mã tiếng Việt Unicode), thì các công cụ kia gần như bị lãng quên.
Trước sự "lấn sân" của Google, ông Hoàng Tô, Chủ tịch Hội đồng Quản trị Công ty Cổ phần Công nghệ Tinh Vân, đơn vị quản lý Vinaseek, đã đề cập đến hướng phát triển của Vinaseek trong tương lai.
Thưa ông Vinaseek đã ra đời như thế nào? Tại sao thời điểm đó, các ông lại "liều lĩnh" muốn làm một Google thứ hai?
Vinaseek ra đời cách đây khá lâu, hơn 10 năm. Khi đó Tinh Vân tham gia xây dựng hệ thống mạng của Ban chuyên đề quốc gia về công nghệ thông tin, là mạng Intranet đầu tiên ở Việt Nam có kết nối đến tất cả các tỉnh, thành.
Chúng tôi đã nhận thấy nhu cầu tìm kiếm thông tin tiếng Việt là rất lớn. Hồi đó, các bảng mã tiếng Việt chưa thống nhất, có tới 20 bảng mã khác nhau cùng tồn tại, và các search engine (công cụ tìm kiếm) khi đó như Altavista hay Yahoo không hỗ trợ mã tiếng Việt.
Tinh Vân phát triển cộng cụ tìm kiếm tiếng Việt đầu tiên (khi đó mang tên VIS) và đến năm 2000 thì Vinaseek ra đời, phục vụ miễn phí trên Internet. Đây là công cụ tìm kiếm tiếng Việt mạnh nhất lúc bấy giờ (sau đó có thêm panvietnam.com và hoatieu.com). Vinaseek đã gây được một tiếng vang lớn, có số lượng người sử dụng kỷ lục.
Và sau đó...
Sau đó theo xu thế chung, hầu hết các trang web tiếng Việt tuân thủ mã Unicode và Google đã hỗ trợ tốt bảng mã quốc tế này.
Do đó Vinaseek không thể hiện được sức mạnh và phải nhường chỗ cho Google Việt Nam. Vinaseek vẫn tồn tại nhưng số người sử dụng nó không nhiều, chủ yếu là những khách hàng quen và muốn tìm kiếm sâu hơn vào các nhánh của trang web (vì Google tìm kiếm khá nông).
Theo ông, Google đã mạnh như vậy và nó đã thực sự bành trướng để trở thành công cụ tìm kiếm của toàn cầu. Vậy thì, phải chăng Vinaseek nên chấm dứt sự tồn tại của mình?
Có vẻ như Google đang bành trướng khủng khiếp và người Việt ta đang dùng Google là chủ yếu. Nhưng chúng tôi hy vọng trong tương lai tình hình sẽ khác.
Ở nhiều nước như Nga, Trung Quốc, Hàn Quốc... các công cụ tìm kiếm riêng của họ (như Baidu ở Trung Quốc, Ramble ở Nga...) vẫn chiếm tới 50 - 60% thị phần, còn lại mới là Google và các công cụ tìm kiếm khác.
Google đúng là người khổng lồ mang tính toàn cầu, nhưng mỗi ngôn ngữ, mỗi địa phương vẫn cần có một công cụ riêng, vì Google không thể bản địa hóa một cách sâu sắc cho từng ngôn ngữ một, và gắn với mỗi ngôn ngữ là cả vấn đề văn hóa đặc trưng.
Nghĩa là Google vẫn có những điểm yếu khi tìm kiếm tiếng Việt?
Hiện nay Google mới chỉ có dữ liệu của khoảng 30 triệu trang tiếng Việt, trong khi tại thời điểm này số trang tiếng Việt đã lên tới 150 - 200 triệu trang.
Thứ hai là trên Internet vẫn còn những kho dữ liệu tiếng Việt rất lớn thuộc các bảng mã khác không phải Unicode - với những kho dữ liệu này Google không thể tìm kiếm được.
Mảng thứ ba quan trọng hơn là Google tìm kiếm tiếng Anh rất tốt, hiểu ý người dùng, nhưng với tiếng Việt thì hoàn toàn vô cảm (thí dụ Google không hiểu được các từ kép trong tiếng Việt, mà nó hiểu đơn giản đó là hai từ đơn, do đó nó tìm được những kết quả rất máy móc các văn bản có hai từ đơn đó cạnh nhau, không đúng ý của người tìm kiếm. Ngoài ra còn các vấn đề khác như xử lý được các trường hợp đồng âm, đồng nghĩa trong tiếng Việt - PV).
Đây là điểm mà Vinaseek sẽ khai thác mạnh để tạo vị thế cạnh tranh. Chúng tôi đang xây dựng một vỏ xử lý ngôn ngữ Việt thông minh và gần gũi với người sử dụng, cũng như hiểu được phong cách và thói quen tìm kiếm thông tin của người Việt.
Nghĩa là Vinaseek sẽ dám cạnh tranh với Gongle?
Vinaseek không thể cạnh tranh và cũng không nên cạnh tranh với Google về mặt công nghệ, thậm chí còn phải liên kết với Google để tận dụng các kết quả tìm kiếm phi Việt ngữ.
Vấn đề có thể cạnh tranh chính là sự hiểu biết về ngôn ngữ tiếng Việt và văn hóa bản địa đặc trưng. Nâng cấp Vinaseek sẽ tiêu tốn khoảng 1 triệu USD trong pha đầu tiên, và đó mới chỉ là con số tối thiểu.
Chẳng hạn, Vinaseek sẽ xây dựng phần mềm xử lý ngôn ngữ thông tin với sự tham gia của các nhà khoa học để việc tìm kiếm các văn bản tiếng Việt hiệu quả hơn; sẽ được hỗ trợ để xử lý các trường hợp đồng âm, đồng nghĩa trong tiếng Việt; xử lý các từ kép, và đặc biệt cũng như khó nhất là khả năng đoán được mục đích của người tìm kiếm, qua đó đưa ra gợi ý để họ chọn từ tìm kiếm đúng...
Vinaseek sẽ ra sao sau khi nâng cấp?
Năm 2007 sẽ cần một sự đầu tư mạnh mẽ cho Vinaseek để giành lại một thị phần của Google ở Việt Nam. Mục tiêu chúng tôi hướng tới là ít nhất cũng sẽ thu hút được 40 - 60% người Việt trên khắp thế giới cần tìm kiếm các văn bản tiếng Việt trên Internet.
Hiện tại, Vinaseek có dữ liệu chỉ mục và toàn văn của 8 triệu trang, do đó người dùng sẽ ưu tiên Google (hơn 30 triệu) là điều đương nhiên. Nhưng trong vòng 18 - 24 tháng nữa,Vinaseek sẽ quét được toàn bộ các trang tiếng Việt trên internet (ước có khoảng 150 - 200 triệu trang). Vinaseek xử lý sắp xếp ưu tiên kết quả tìm kiếm chưa được tối ưu và thông minh như Google.
Tất cả những trở ngại đó chúng tôi đều đã tìm được giải pháp công nghệ thích hợp và sẽ giải quyết triệt để trong một tương lai gần. Chúng tôi cũng sẽ tích hợp các dịch vụ về tìm kiếm ảnh, video, các dịch vụ bản đồ phục vụ việc tìm đường, du lịch, quy hoạch và bất động sản.
Đầu tư hơn 1 triệu USD, chắc chắn không chỉ vì "mầu cờ sắc áo". Vậy các ông sẽ thu lợi từ Vinaseek như thế nào?
Cách kiếm tiền của các công cụ tìm kiếm nói chung sẽ không phải là hình thức đặt banner quảng cáo như các báo điện tử, vì phương pháp này có thể gây khó chịu đối với người sử dụng, mà sẽ quảng cáo một cách tinh tế hơn, thí dụ như hình thức thu tiền các từ khóa mà người dùng tìm kiếm.
Nhưng nói chung, khi đã thu hút được một lượng lớn người dùng thì sẽ xuất hiện vô số các cơ hội để kiếm tiền cũng như sẽ tạo được những giá trị gia tăng khổng lồ.
Nhưng từ ngày Google thêm "phiên bản Việt Nam" (có hỗ trợ bảng mã tiếng Việt Unicode), thì các công cụ kia gần như bị lãng quên.
Trước sự "lấn sân" của Google, ông Hoàng Tô, Chủ tịch Hội đồng Quản trị Công ty Cổ phần Công nghệ Tinh Vân, đơn vị quản lý Vinaseek, đã đề cập đến hướng phát triển của Vinaseek trong tương lai.
Thưa ông Vinaseek đã ra đời như thế nào? Tại sao thời điểm đó, các ông lại "liều lĩnh" muốn làm một Google thứ hai?
Vinaseek ra đời cách đây khá lâu, hơn 10 năm. Khi đó Tinh Vân tham gia xây dựng hệ thống mạng của Ban chuyên đề quốc gia về công nghệ thông tin, là mạng Intranet đầu tiên ở Việt Nam có kết nối đến tất cả các tỉnh, thành.
Chúng tôi đã nhận thấy nhu cầu tìm kiếm thông tin tiếng Việt là rất lớn. Hồi đó, các bảng mã tiếng Việt chưa thống nhất, có tới 20 bảng mã khác nhau cùng tồn tại, và các search engine (công cụ tìm kiếm) khi đó như Altavista hay Yahoo không hỗ trợ mã tiếng Việt.
Tinh Vân phát triển cộng cụ tìm kiếm tiếng Việt đầu tiên (khi đó mang tên VIS) và đến năm 2000 thì Vinaseek ra đời, phục vụ miễn phí trên Internet. Đây là công cụ tìm kiếm tiếng Việt mạnh nhất lúc bấy giờ (sau đó có thêm panvietnam.com và hoatieu.com). Vinaseek đã gây được một tiếng vang lớn, có số lượng người sử dụng kỷ lục.
Và sau đó...
Sau đó theo xu thế chung, hầu hết các trang web tiếng Việt tuân thủ mã Unicode và Google đã hỗ trợ tốt bảng mã quốc tế này.
Do đó Vinaseek không thể hiện được sức mạnh và phải nhường chỗ cho Google Việt Nam. Vinaseek vẫn tồn tại nhưng số người sử dụng nó không nhiều, chủ yếu là những khách hàng quen và muốn tìm kiếm sâu hơn vào các nhánh của trang web (vì Google tìm kiếm khá nông).
Theo ông, Google đã mạnh như vậy và nó đã thực sự bành trướng để trở thành công cụ tìm kiếm của toàn cầu. Vậy thì, phải chăng Vinaseek nên chấm dứt sự tồn tại của mình?
Có vẻ như Google đang bành trướng khủng khiếp và người Việt ta đang dùng Google là chủ yếu. Nhưng chúng tôi hy vọng trong tương lai tình hình sẽ khác.
Ở nhiều nước như Nga, Trung Quốc, Hàn Quốc... các công cụ tìm kiếm riêng của họ (như Baidu ở Trung Quốc, Ramble ở Nga...) vẫn chiếm tới 50 - 60% thị phần, còn lại mới là Google và các công cụ tìm kiếm khác.
Google đúng là người khổng lồ mang tính toàn cầu, nhưng mỗi ngôn ngữ, mỗi địa phương vẫn cần có một công cụ riêng, vì Google không thể bản địa hóa một cách sâu sắc cho từng ngôn ngữ một, và gắn với mỗi ngôn ngữ là cả vấn đề văn hóa đặc trưng.
Nghĩa là Google vẫn có những điểm yếu khi tìm kiếm tiếng Việt?
Hiện nay Google mới chỉ có dữ liệu của khoảng 30 triệu trang tiếng Việt, trong khi tại thời điểm này số trang tiếng Việt đã lên tới 150 - 200 triệu trang.
Thứ hai là trên Internet vẫn còn những kho dữ liệu tiếng Việt rất lớn thuộc các bảng mã khác không phải Unicode - với những kho dữ liệu này Google không thể tìm kiếm được.
Mảng thứ ba quan trọng hơn là Google tìm kiếm tiếng Anh rất tốt, hiểu ý người dùng, nhưng với tiếng Việt thì hoàn toàn vô cảm (thí dụ Google không hiểu được các từ kép trong tiếng Việt, mà nó hiểu đơn giản đó là hai từ đơn, do đó nó tìm được những kết quả rất máy móc các văn bản có hai từ đơn đó cạnh nhau, không đúng ý của người tìm kiếm. Ngoài ra còn các vấn đề khác như xử lý được các trường hợp đồng âm, đồng nghĩa trong tiếng Việt - PV).
Đây là điểm mà Vinaseek sẽ khai thác mạnh để tạo vị thế cạnh tranh. Chúng tôi đang xây dựng một vỏ xử lý ngôn ngữ Việt thông minh và gần gũi với người sử dụng, cũng như hiểu được phong cách và thói quen tìm kiếm thông tin của người Việt.
Nghĩa là Vinaseek sẽ dám cạnh tranh với Gongle?
Vinaseek không thể cạnh tranh và cũng không nên cạnh tranh với Google về mặt công nghệ, thậm chí còn phải liên kết với Google để tận dụng các kết quả tìm kiếm phi Việt ngữ.
Vấn đề có thể cạnh tranh chính là sự hiểu biết về ngôn ngữ tiếng Việt và văn hóa bản địa đặc trưng. Nâng cấp Vinaseek sẽ tiêu tốn khoảng 1 triệu USD trong pha đầu tiên, và đó mới chỉ là con số tối thiểu.
Chẳng hạn, Vinaseek sẽ xây dựng phần mềm xử lý ngôn ngữ thông tin với sự tham gia của các nhà khoa học để việc tìm kiếm các văn bản tiếng Việt hiệu quả hơn; sẽ được hỗ trợ để xử lý các trường hợp đồng âm, đồng nghĩa trong tiếng Việt; xử lý các từ kép, và đặc biệt cũng như khó nhất là khả năng đoán được mục đích của người tìm kiếm, qua đó đưa ra gợi ý để họ chọn từ tìm kiếm đúng...
Vinaseek sẽ ra sao sau khi nâng cấp?
Năm 2007 sẽ cần một sự đầu tư mạnh mẽ cho Vinaseek để giành lại một thị phần của Google ở Việt Nam. Mục tiêu chúng tôi hướng tới là ít nhất cũng sẽ thu hút được 40 - 60% người Việt trên khắp thế giới cần tìm kiếm các văn bản tiếng Việt trên Internet.
Hiện tại, Vinaseek có dữ liệu chỉ mục và toàn văn của 8 triệu trang, do đó người dùng sẽ ưu tiên Google (hơn 30 triệu) là điều đương nhiên. Nhưng trong vòng 18 - 24 tháng nữa,Vinaseek sẽ quét được toàn bộ các trang tiếng Việt trên internet (ước có khoảng 150 - 200 triệu trang). Vinaseek xử lý sắp xếp ưu tiên kết quả tìm kiếm chưa được tối ưu và thông minh như Google.
Tất cả những trở ngại đó chúng tôi đều đã tìm được giải pháp công nghệ thích hợp và sẽ giải quyết triệt để trong một tương lai gần. Chúng tôi cũng sẽ tích hợp các dịch vụ về tìm kiếm ảnh, video, các dịch vụ bản đồ phục vụ việc tìm đường, du lịch, quy hoạch và bất động sản.
Đầu tư hơn 1 triệu USD, chắc chắn không chỉ vì "mầu cờ sắc áo". Vậy các ông sẽ thu lợi từ Vinaseek như thế nào?
Cách kiếm tiền của các công cụ tìm kiếm nói chung sẽ không phải là hình thức đặt banner quảng cáo như các báo điện tử, vì phương pháp này có thể gây khó chịu đối với người sử dụng, mà sẽ quảng cáo một cách tinh tế hơn, thí dụ như hình thức thu tiền các từ khóa mà người dùng tìm kiếm.
Nhưng nói chung, khi đã thu hút được một lượng lớn người dùng thì sẽ xuất hiện vô số các cơ hội để kiếm tiền cũng như sẽ tạo được những giá trị gia tăng khổng lồ.