Anh bắt đầu học như thế nào ở Mỹ? Tại sao anh lại chọn ngành hóa học lý thuyết, ngành này có gì hấp dẫn anh?
- Tôi đã học đại học tại Đại học California – Davis, và
chọn chuyên ngành hóa học lý thuyết (theoretical chemistry) vì môn học này là ngành trung tâm của các ngành khoa học khác, như toán, vật lý, hóa học, công nghệ thông tin... Năm 1996, tôi tốt nghiệp cử nhân hạng tối danh dự (highest honors: cao nhất toàn trường, tôi là 1 trong 18 sinh viên tốt nghiệp với danh hiệu này trên tổng số trên 20.000 sinh viên của trường này).
...
“Hành trang ngày trở về” của anh là Vietica với giao diện tìm kiếm thông tin thân thiện, Việt hóa đến mức tối ưu, và được tin rằng phát triển riêng cho người Việt. Vietica được thành lập dựa trên những cơ sở nào?
Khoảng 4 năm về trước, tôi đã nghiên cứu và phát triển thuật toán (algorithm) cho việc xử lý chuỗi (string) trong di truyền học, mà có thể ứng dụng vào việc phân tích và xử lý ngôn ngữ tự nhiên, như tiếng Việt. Từ đó, hệ thống tìm kiếm (search engine) cho ngôn ngữ tiếng Việt có thể được xây dựng trên cơ sở ấy. Ngày 21.2.2006, cùng với một số đồng nghiệp (là những chuyên gia trong lĩnh vực toán, công nghệ thông tin, khoa học, công nghệ…),
Vietica chính thức được thành lập để phát triển công cụ tìm kiếm này và nó có trụ sở chính tại San Jose, thủ phủ của Silicon Valley. Vietica ra đời với mục đích chính là cung cấp dịch vụ trao đổi và thu thập, và tìm kiếm thông tin qua mạng.
Tại sao anh hứng thú với Vietica khi đã có rất nhiều công cụ tìm kiếm miễn phí cho người dùng internet ở Việt Nam?
Tôi nhận thấy các công cụ tìm kiếm thông tin cho tiếng Việt hiện nay chưa đáp ứng được nhu cầu tìm kiếm của người dùng. Với Google chẳng hạn, công cụ tìm kiếm quen thuộc này chưa “hiểu” được những khác biệt của ngôn ngữ tiếng Việt so với tiếng Anh. Bởi vì tiếng Việt có nhiều điểm khác biệt rất lớn (mono-syllable v.s. poly-syllable) so với tiếng Anh, như cấu trúc từ, cú pháp, ngữ nghĩa… Ở đây có thể tìm ví dụ như với hệ thống Top News của Vietica.
Đây là một ứng dụng quan trọng của thuật toán mà tôi đã phát triển cho search engine dành cho ngôn ngữ tiếng Việt. Trong hệ thống Top News, nội dung của các bài báo được phân tích, tổng hợp và phân loại theo chủ đề một cách tự động. Và tất cả những hoạt động đó đều dựa trên thuật toán do tôi phát triển, để giúp người đọc có thể đọc được những tin tức quan trọng nhất vào mỗi thời điểm trong ngày. Google (
www.news.google.com) đã làm việc này cho rất nhiều ngôn ngữ khác nhau trên thế giới, như tiếng Anh, Trung Quốc, Tây Ban Nha, Pháp, Đức…, nhưng chưa thể làm được cho ngôn ngữ tiếng Việt.
Vietica là công ty đầu tiên trên thế giới phát triển được hệ thống này. Hiện nay, các độc giả của tiếng Việt đã có thể bắt đầu đọc các tin tức top news này tại
http://news.vietica.com. Ngoài ra,
www.zing.vn, portal lớn nhất Việt Nam, cũng đang sử dụng công nghệ tìm kiếm của Vietica. Tóm lại, tôi mong muốn có một hệ thống tìm kiếm nhanh, chính xác và comprehensive (bao hàm nhiều khái niệm) dành riêng cho ngôn ngữ tiếng Việt.
Bookmarks