PDA

View Full Version : Web mining - thu thập tin tức



Quanptit
22-05-2011, 17:43
mình đang muôn xây dựng một ứng dụng đọc báo online mà nó có thu thập thông tin từ nhiều nguồn khác nhau. đại lại tương tụ như cái ứng dụng yahoo ý.

http://farm3.anhso.net/upload/20110522/11/o/anhso-113421_aa.jpg

yêu cầu ở đây là sử dụng các kỹ thuật web mining chứ không phải là tách String HTML

ai đã từng nghiên cứu về lĩnh vực này có thể hướng dẫn tớ nên bắt đầu từ đâu và nên tập chung vào cái nào được không. chứ tớ đang đọc về các kỹ thuật web mining rộng quá, mông lung quá. chưa biết phải làm thế nào , áp dụng kỹ thuật cụ thế nào cho bài toán này. giúp tớ với !

thanks rất nhiều.

Trịnh Ngọc Lan
22-05-2011, 18:05
web mining là cái gì thế lol

tungls1
27-05-2011, 19:29
Bạn này chắc là đệ tử thầy tdque rồi =))

muasam08
27-05-2011, 20:17
Cái này là sao nhi?....

Quanptit
27-05-2011, 23:52
hehe, ai mà cũng biết tdque vậy ta

thuantink31
25-06-2011, 21:35
Vấn đề này khá phức tạp, bạn nên tìm cho mình một giáo viên hướng dẫn!

bé_tí
25-06-2011, 21:42
ai làm được PM mình hen. Cái này giống dạng báo mới đây mà

Quanptit
26-06-2011, 15:44
hi, mình đang nghiên cứu. cũng hiểu sơ sơ rùi.

Osama Binladen
26-06-2011, 16:03
Giờ các mô hình tổng hợp tin tự động cũng lỗi thời rồi, nghĩ chủ thớt nên tìm hướng khác đi tắt đón đầu có phải hay hơn không:)

jangeur
26-06-2011, 17:26
Giờ các mô hình tổng hợp tin tự động cũng lỗi thời rồi, nghĩ chủ thớt nên tìm hướng khác đi tắt đón đầu có phải hay hơn không:)

Cũng không phải lỗi thời đâu, người đọc bây giờ khó tính hơn và họ tự biết định hướng thông tin khá tốt. Trang tin lá cải với trang tin có xuất xứ, có chủ thể rõ ràng có phản ứng khác nhau đối với người đọc. Trang tin lá cải nhiều khi visit đông nhưng chết lên chết xuống vì ko có tiền, chứ trang tin có chủ thể hợp pháp thì vẫn kiếm được tài trợ đều đều mặc dù chất lượng không bằng trang lá cải.

Xem thêm chút:

http://ddth.com/showthread.php?p=2908160

Quanptit
05-07-2011, 00:00
tổng hợp tin tức ở đây chỉ là một ứng dụng minh họa cho kỹ thuật tách thông tin tự động trên web mà mình đang nghiên cứu. lĩnh vực này khá là hay àh