PDA

View Full Version : Dịch vụ cung cấp nội dung WebSpider



up2store
04-05-2009, 15:17
Hiện tại mình mới hoàn thành 1 web spider, chuyên bóc tách, xử lý thông tin, có những feature sau:

1. Tự động tìm kiếm trên các website tin tức, bóc tách lấy các nội dung theo từ khóa

2. Lấy hết thông tin từ các site tin tức

3. Tốc độ xử lý bóc tách: 2 tin/giây

4. Xử lý bóc tách đưa về dạng XML thuần túy, phù hợp cho mọi nhu cầu sử dụng

5. Quét liên tục trên các trang tin, tốc độ 5 phút quét qua một lần trên tất cả các trang tin

6. Định nghĩa vùng nội dung bóc tách chi tiết, linh hoạt, mềm dẻo (VietSpider chỉ bóc vùng nội dung thôi nhé)

7. Cung cấp dịch vụ qua web service cho khách hàng có nhu cầu

Nhu cầu thực tế:
Ví dụ website của bạn chuyên về địa ốc, bất động sản, hệ thống của mình sẽ quét qua chừng 20 keyword liên quan đến bất động sản, và bóc tách nội dung về

Nếu bạn có nhu cầu, liên lạc:

Email: ng 2 t u a n @ gờ mail .com

dxt49
06-05-2009, 09:50
mình đang muốn tìm hiểu về việc bóc tách thông tin. Bạn có thể cho mình thuật toán để làm chuyện này ko? hoạc có thể chỉ cho mình cách thức để thực hiện công việc đó?
thanks