PDA

View Full Version : Search Engine viết bằng JSP



quangvu
12-01-2003, 20:22
Chào các bạn
Mình đang viết một Search Engine (http://search.qnesoft.com) bằng JSP ,đang trong giai đoạn Test Alpha 1 .Đây là một dạng Search được xây dựng theo mô hình Meta Search .Tức bản thân nó không tự xây dựng CSDL riên của mình mà đến truy vấn CSDL của các Search khác ,trong Search của mình hai Điểm mà nó đến lấy kết quả là Teoma và Alltheweb .
Một đều nửa là Search (http://search.qnesoft.com) của mình không dùng các API được cung cấp sẳn của các Search (Alltheweb có hổ trợ ,teoma thì không) mà dùng một kỉ thuật hoàn toàn khác để truy xuất kết quả.
Search hiện đang ở giai đoạn Alpha 1 ,còn rất nhiều phần chưa hoàn thiện nhưng mình nghĩ đã cần đến sự trợ giúp của công đồng ,nhất là ở khâu Testing.Hi vọng các bạn tham gia một tay giúp mình hoàn thiện sản phẩm này .
** Mọi góp ý xin vui lòng gửi đến địa chỉ webmaster@qnesoft.com hoặc có thể Post tại đây
** Các từ khoá mà tại đó ,bạn phát hiện Search hoạt đông không ổ định (nói đúng hơn là có Bug) bạn có thể Post tại đây .
Rất cám ơn .

dangquochung
27-01-2003, 14:41
mình nghĩ bạn cho thêm bộ gõ vietuni vào là ok nhé ! ngoài ra cần chỉnh ngôn ngữ ! và bề ngoài nữa!

cũng có thể nói liên kết vậy là good rồi ! nhưng bạn có thể cho source không !

quangvu
28-01-2003, 15:19
Thaks DangQuocChung ,
Quả là một ý kiến hay ,mình đã không nghĩ ra điều đó .Còn source thì sẽ có vào khoãng tháng 5 ,khi đó mình sẽ thiết kế các API cho phép các trang Web khác đến lấy kết quả về .
Ngoài ra còn có các PowerSearch ,Doc . . .

TinyToon
13-02-2003, 20:57
Bài viết được gửi bởi quangvu
Chào các bạn
Mình đang viết một Search Engine (http://search.qnesoft.com) bằng JSP ,đang trong giai đoạn Test Alpha 1 .Đây là một dạng Search được xây dựng theo mô hình Meta Search .Tức bản thân nó không tự xây dựng CSDL riên của mình mà đến truy vấn CSDL của các Search khác ,trong Search của mình hai Điểm mà nó đến lấy kết quả là Teoma và Alltheweb .
Một đều nửa là Search (http://search.qnesoft.com) của mình không dùng các API được cung cấp sẳn của các Search (Alltheweb có hổ trợ ,teoma thì không) mà dùng một kỉ thuật hoàn toàn khác để truy xuất kết quả.
Search hiện đang ở giai đoạn Alpha 1 ,còn rất nhiều phần chưa hoàn thiện nhưng mình nghĩ đã cần đến sự trợ giúp của công đồng ,nhất là ở khâu Testing.Hi vọng các bạn tham gia một tay giúp mình hoàn thiện sản phẩm này .
** Mọi góp ý xin vui lòng gửi đến địa chỉ webmaster@qnesoft.com hoặc có thể Post tại đây
** Các từ khoá mà tại đó ,bạn phát hiện Search hoạt đông không ổ định (nói đúng hơn là có Bug) bạn có thể Post tại đây .
Rất cám ơn .
Có lẽ bạn nhầm cơ bản giữa khái niệm Search engine và Web-search. Của bạn chỉ là trang Web xuất ra kết quả tìm kiếm của Search Engine khác bằng cách gửi HTTP request đến các search engine và thu thập lai kết quả, hiển thị lên màn hình.
Bạn không có cách nào khác ngoài cách dùng hàm API mà search engine đó cung cấp.
Vấn đề Tiếng Việt không thể giải quyết được ở đây.
Trong rất nhiều Web-site nếu bạn để ý, họ cũng có nhúng Web-form để lấy kq từ các Search engine khác, điều đó rất bình thường.

quangvu
14-02-2003, 08:03
Thank TinyToon ,
Vũ nghĩ mình không nhầm ,các Web Search cũng là một Search Engine thôi .Search Engine có rất nhiều loại như Web Search ,Meta Web Search ,App Search . . .
Search của mình không hề dùng bất kì một API nào do các Search cung cấp để lấy về kết quả .Có thể bạn không tin nhưng đây là sự thật ,Search này dùng một kĩ thuật khác để lấy về kết quả .Do đó ,Vũ hy vọng có thể giải quyết được vấn đề Tiếng Việt .
Môt số Web-Site dùng Web-Form để lấy kết quả từ Search khác ,tuy nhiên ,sau đó User sẽ "ra khỏi" Web site đó của họ và đến Search Site đó .Cách này không hay lắm và những người dùng nó có lẽ là " Bất đắt dĩ" .

TinyToon
15-02-2003, 08:11
Bài viết được gửi bởi quangvu
Thank TinyToon ,
Vũ nghĩ mình không nhầm ,các Web Search cũng là một Search Engine thôi .Search Engine có rất nhiều loại như Web Search ,Meta Web Search ,App Search . . .
Search của mình không hề dùng bất kì một API nào do các Search cung cấp để lấy về kết quả .Có thể bạn không tin nhưng đây là sự thật ,Search này dùng một kĩ thuật khác để lấy về kết quả .Do đó ,Vũ hy vọng có thể giải quyết được vấn đề Tiếng Việt .
Môt số Web-Site dùng Web-Form để lấy kết quả từ Search khác ,tuy nhiên ,sau đó User sẽ "ra khỏi" Web site đó của họ và đến Search Site đó .Cách này không hay lắm và những người dùng nó có lẽ là " Bất đắt dĩ" .
Hi QuangVu,
Rất vui vì được thảo luận với bạn.
Search Engine là danh từ chung chỉ những phần mềm có khả năng tìm kiếm từ những thông tin(hình ảnh, text, file...) mà nó thu nhập được trên Internet. Vì phần mềm của bạn không có khả năng tự thu thập dữ liệu nên không gọi là Search Engine(tạm dịch là cỗ máy tìm kiếm) được. Thôi, dù sao cũng là chuyện thuật ngữ.
API là các hàm giao diện của Search engine với user. Đấy là cách duy nhất và tốt nhất để giao tiếp với nó. Có thể bạn nói cách khác, cái khác ở đây có thể là cách xử lý có hơi khác trong các kết quả tìm kiếm đã được trang JSP của bạn thu thập về.
Cách thu thập và hiển thị kết quả của bạn có thể là:
Sau khi lấy được kết quả từ hai "search engine" kể trên, bạn hiện thị lần lượt 1-1 các kết quả đó, và bạn đã không kiểm tra sự trùng lặp lẫn nhau giữa các kết quả tìm kiếm. Tất nhiên, hai trang web này cho ra trùng nhau rất nhiểu kết quả tìm kiếm.
`` Môt số Web-Site dùng Web-Form để lấy kết quả từ Search khác ,tuy nhiên ,sau đó User sẽ "ra khỏi" Web site đó của họ và đến Search Site đó .Cách này không hay lắm và những người dùng nó có lẽ là " Bất đắt dĩ" ``
Đây hoàn toàn là điều rất hợp lý đứng về phía người sử dụng, trong khi trang web của bạn lại thay đổi địa chỉ IP của trang Web ,là kết quả tìm kiếm, thành địa chỉ trang web của bạn, một điều bất hợp lý. Vấn đề mà bạn nói là nhược điểm của Web/Form nhúng vào các Website là không có, hoàn toàn có thể khắc phục được bằng cách .. bạn tham khảo site này sẽ rõ. www.vinaseek.com
Bàn về vấn đề Tiếng Việt. Không thể nào giải quyết được nó một khi web/site của bạn lại phụ thuộc kết quả tìm kiếm của các trang Web khác, trừ khi đó là Vietnamese Search engine ;)
Dù sao, mình không biết được mà nguồn nên không biết chính xác bạn làm như thế nào, chỉ là phán đoán. Bởi vậy, mong có lời giải thích về kĩ thuật bạn sử dụng nếu không có gì bí mật.

quangvu
18-02-2003, 16:49
Về phần tiếng Việt ,Vũ cho chạy thữ một bản Mô Phỏng thì thấy không có vấn đề gì ,hy vọng khi đưa vào sử dụng thì cũng thế :) .
Về sự trùng lấp thì Vũ nghĩ cũng không phải vấn đề nghiêm trọng ,thực chất ÍT User nào KHÓ CHỊU khi THẤY kết quả trùng lấp .Bản thân Google mà còn có chứa KQ trùng lấp .
Về mặt kĩ thuật ,thực sự thì đây chỉ mới là phần thử nghiệm ,Vũ đang cố phát triển Search theo một hướng khác .không giống Google hay Teoma .

qthuong
19-06-2003, 23:17
thật là hay một giải pháp mới nhưng không có thấy source gi hết trơi bạn có the post lên được không vậy thay mặt bà con cảm ơn trưóc nhé
a mà nêu muốn dùng hàm API thi phai lam sao cách viết trong asp đó hoặc jsp cung được đang cần xin cảm ơn
thoi bye mình quangvu đợi trả lời đó

quangvu
20-06-2003, 09:10
Hiện Search của Quang Vũ chỉ mới support Java Servlet thôi, tức để run bạn phải có host support Java Servlet.
Vào giửa tháng 7, Quang Vũ sẽ thiết kế các giao tiếp bằng PHP và Perl. Và sẽ mở cổng để các bạn vào lấy thông tin về :) .
Thân.

thangnc
25-06-2003, 11:47
Vũ ơi,mình cũng đang thiết kế 1 web search bằng jsp.Mình định là sẽ dựa vào google để search.Khi có yêu cầu tìm kiếm sẽ link tới google,sau đó dùng bộ lọc để lọc những gì có dính chữ google ra.Cuối cùng sẽ đưa ra kết quả với interface của trang web của mình.

quangvu
25-06-2003, 19:20
Không đơn giản đâu, vì các API của Google sẻ làm chậm quá trình Truy Vấn kết của máy bạn.Trừ khi bạn trả "xiền" :)

bill
26-06-2003, 19:26
Bạn dùng thử Google Web services API đi. Rất tiện lợi và hiệu quả.

poorguy11385
28-06-2003, 10:14
Quang Vu & các bác nên tham khảo thêm cái search này. Cái này mình thử tiếng việt hay lắm. Có cần fải bỏ nhiều thời gian để đi phát minh cái bánh xe kô?

xem thử ở đây (http://www.me.lv/jse/index.html)

quangvu
21-07-2003, 18:43
Cái Search mà anh poorguy11385 nói không được tốt lắm, vừa chậm vừa khó quản lý.

tranducnhuan
24-07-2009, 09:40
Theo minh thi Search Engine cua ban :
1) giao dien chua bat mat
2) phan hien ket qua chua visual. Ban cu nhin google ma doi chieu
Ban nen dung cac API cua Google, Yahoo, Microsoft cho tien. Vua de, vua de lam, ket qua lai tuong doi chinh xac