PDA

View Full Version : Cho tôi đóng góp ý kiến với



hoanghp2000
01-10-2002, 09:15
Chào tất cả anh em.
Tôi hoàn toàn ủng hộ sáng kiến trên của các bạn. Hiện tại tôi có một vấn đề tương đối hay và có ứng dụng thực tiễn luôn. Có nghĩa là mọi người viết thành công vấn đề này thì hoàn toàn có thể bán ra tiền luôn.
Tôi có thể nêu sơ qua yêu cầu nhé:
Dùng ngôn ngữ lập trình và hệ CSDL đơn như kiểu Access hoặc CVS file để viết 1 search engine cho CSDL văn bản. Yêu cầu là ko được dùng bất cứ Webserver nào cả mà viết hoàn toàn bằng những thuật toán của mình.
Các bạn nghĩ sao ?

KEM_WALL
01-10-2002, 11:01
vd tìm từ "hải" trong chuỗi "Tui tên Hải"
- biến str = "Tui tên Hải"
- đầu tiên cắt kí tự đầu tiên của từ cần tìm left("Hải",1) = "H"
- instr nó : instr(str,"H") = 12
- ti`m tie'p (for next)
- dậy thui

White_Rose
01-10-2002, 13:03
tại sao phải tự viết khi các hệ DBMS nó có thể tìm hộ mình???

hoanghp2000
01-10-2002, 14:29
Chào các bạn.
Mình rất vui mừng vì mọi người quan tâm đến vấn đề này. Theo các giải pháp của mọi người đã đưa ra thì đó chỉ là trên lĩnh vực lý thuyết thôi. Trong thực tế thì ai đã làm 1 search engine sẽ gặp phải một số vướng mắc sau đây:
- Với số lượng dữ liệu lớn cỡ 1CD=650MB thì phương án mở các file ra để tìm là không đáp ứng được về yêu cầu tốc độ tìm kiếm.
- Để cho các hệ CSDL làm giúp cho thì chúng ta sẽ phải đưa toàn bộ nội dung của các văn bản chúng ta vào trong CSDL. Với mức chịu đựng như hiện nay của Access theo mình được biết thì cỡ 50MB trở lên thông tin sẽ có khả năng bị hỏng mà không biết lý do. Với yêu cầu như thế thì những định dạng file dữ liệu của chúng ta hợp lý nhất chỉ có thể là text file nhưng làm thể nào để lưu trữ thông tin chỉ mục phục vụ cho việc full-text search nhanh chóng là cả 1 vấn đề lớn.
Rất mong mọi người đóng góp ý kiến.

KEM_WALL
02-10-2002, 19:13
chia text file vào 1 mảng to, mỗi phần tử khoảng 1000, và search trên từng phần tử ;)