PDA

View Full Version : Có ai biết công nghệ bóc tách thông tin không?



copper
20-08-2004, 07:34
Mình muốn viết một chương trình có thể thu thập thông tin trên internet với một số nguồn nhất định.
Nhưng không biết làm sao để có thể lấy thông tin từ các website?
Có ai có thể giúp tôi không?
Cám ơn nhiều.

NumPad0
20-08-2004, 10:32
Biết được cái đó là kím được nhìu tiền lắm đó. :punk:

jcisio
20-08-2004, 11:50
2 năm trước có cái chú này làm đề tài tốt nghiệp ĐH về cái nì đó. Cũng có lang thang ở DDTH này. Liên lạc thử xem: http://4u.jcisio.com/r/author2471.htm

NumPad0
21-08-2004, 08:59
2 năm trước có cái chú này làm đề tài tốt nghiệp ĐH về cái nì đó. Cũng có lang thang ở DDTH này. Liên lạc thử xem: http://4u.jcisio.com/r/author2471.htm
Not chú, năm nay có 23 tuổi thôi áh. Gọi chú chi già wá !
"Chú" không tiết lộ đâu áh. Hì hì... cái đó là lưỡi câu moi tiềng mà. Share cho anh em thì "chú" đói àh?

jcisio
21-08-2004, 10:30
25 chứ, SN 79 mà.
Có ai bảo share khi nào đâu ? Ai cần thì liên lạc thôi mà, giá cả thương lượng sau.

copper
27-08-2004, 13:55
25 chứ, SN 79 mà.
Có ai bảo share khi nào đâu ? Ai cần thì liên lạc thôi mà, giá cả thương lượng sau.

Anh em có gưi thư liên lạc nhưng không thấy trả lời : HoangNamHai@Yahoo.Com .
Xem lại xem có phải anh bận quá không? Có phải địa chỉ email đó không?

NumPad0
28-08-2004, 01:35
25 chứ, SN 79 mà.
Có ai bảo share khi nào đâu ? Ai cần thì liên lạc thôi mà, giá cả thương lượng sau.
U có biết một bản NewsSpider+CMS thương phẩm (Commercial Software) như iCMS giá bao nhiêu không? Nó đòi giá tới 25K$ lận. Lưu ý đây là thành phẩm (not source...)
Vì đây là cả một công nghệ và còn là cả một quá trình nghiên cứu lâu dài như vậy. Nếu có thì người ta chỉ trao cho bạn thành phẩm chứ không thể trao cho bạn công nghệ, hay nói cụ thể hơn là thuật toán...

KEM_WALL
31-08-2004, 02:04
source iCMS share wá trời mà mấy u, down về coi đi chứ.

NumPad0
31-08-2004, 02:39
source iCMS share wá trời mà mấy u, down về coi đi chứ.
Đâu áh. Chỉ đi nào cưng

NumPad0
31-08-2004, 03:01
source iCMS share wá trời mà mấy u, down về coi đi chứ.
No CMS. The problem here is the NEWS SPIDER and GRABBER. We say it is the Technology (No, only a simple algor) :punk:

Hồngnt
28-08-2009, 07:28
Trùi ui. Em đang tìm hiểu về công nghệ bóc tách thông tin làm đồ án. Anh chị trên diễn đàn chỉ dùm em chút nhé

as247
26-01-2011, 09:41
Ôi dào, mình cũng đang làm KLTN nhưng chắc là ko cần đi sâu nghiên cứu nó bóc tách kiểu gì mà chỉ cần tách được nó ra thôi, cũng chỉ biết sơ sơ có 2 hướng đó là dùng regex và dom tree :-<
Cái này đúng là nếu không mô tả về mấy cái thuật toán thì chả có gì để mà chém gió :-< Tất cả chỉ có: Read -> Check for new content -> Content filtering -> Check duplicate content -> Save

Erereaneume
26-01-2011, 15:34
thats frekking hot, thx

Mr.joogle
02-02-2011, 13:10
Công nghệ bóc tách tự động giống báo mới, tin247.com phải không bác em cũng đang quan tâm vấn đề này
Nhân đây cho em hỏi các Pro có biết zingchat của Vinagame sử dụng công nghệ gì không ạ, hoặc 24h Oinline
Thanks các Pro
Chuc ACE diễn đàn một năm mới thành công

123345
13-10-2011, 15:15
không đôi thủ tại đây : http://www.sohoa.com.vn/

123345
13-10-2011, 15:50
số 1 việt nam : http://.www.sohoa.com.vn bóc tách thông tin numberone!