PDA

View Full Version : Cần tìm gia sư dạy làm web, gấp lắm ạ...



tulc
03-03-2010, 22:36
Tình hình là thầy giáo em giao bài tập lớn về thiết kế trang web viết bằng asp. Đề tài là: Hệ hỗ trợ phân loại tin tự động.
Yêu cầu: chỉ làm về mục thể thao có các mục nhỏ hơn là Bóng đá, Bơi lội, Điền Kinh...
Làm thế nào lấy tin về thể thao từ các trang web khác phân về đúng mục Bóng đá, bơi lội...
E chỉ biết sơ sơ về web, a chị nào biết thì làm gia sư cho em với, e đang cần gấp lắm, cuối tháng 4 em báo cáo rồi huhu. E có thể tự làm, những phần nào ko biết a chị có thể gia sư online hoặc qua nhà em dạy cũng dc ạ. Còn tiền gia sư sẽ trả thỏa đáng (kể cả dạy em online e cũng phải gửi xiền ah).
E đang cần gấp, các a chị giúp em nhé.
Nick của em: anh.meobeo@yahoo.com (con gái tự dưng đâm đầu vào học lập trình khổ thế ạ)

lastcreate
03-03-2010, 22:53
Nếu học cấp tốc mà làm được thì là siêu nhân rồi lol
Bạn lên mạng kiếm mả nguồn asp rồi về chỉnh sửa lại theo nhu cầu.
Kiếm mấy cái asp news ấy lol

hoangminh
04-03-2010, 07:27
asp thì botay, asp.net thì có thể, nhưng vẫn ko hiểu ý đồ của cái đề tài -> bochan

tulc
04-03-2010, 13:40
Thực ra em cũng đã làm web với asp rồi nhưng ko siêu thôi, mới cả bài tập thầy ra ý là phải biết cách load tin tức tự động từ các website khác rồi phân cái tin đó về đúng mục của mình.
E ko biết làm nên nhờ các anh chị siêu lập trình gia sư cho em với, hik.
Tks...

dinhtrungac
04-03-2010, 15:34
Thực ra em cũng đã làm web với asp rồi nhưng ko siêu thôi, mới cả bài tập thầy ra ý là phải biết cách load tin tức tự động từ các website khác rồi phân cái tin đó về đúng mục của mình.
E ko biết làm nên nhờ các anh chị siêu lập trình gia sư cho em với, hik.
Tks...

Viết một con ro bốt bằng C#, hoặc VB. Đặt lên server chứa website. Nhiệm vụ của nó là đi đến các trang tin mà bạn muốn lấy dữ liệu lấy thông tin về và export ra từng bài trong một trang .asp(tĩnh). rồi ghi thông tin về về link, address... vào DB. Khi người dùng click vào link tương ứng bạn sẽ trỏ tới bài(Là trang mà robot của bạn đã export ra). Ngoài ra bạn có thể lấy tin về và đổ vào DB của bạn. Khi cần lấy thì querry thông tin lên và đổ vào trang .asp rồi hiển thị lên.

Cái này trước đây mình có làm cho trang PDA.vn, và sau đó là chuyên mục đọc báo của IPTV portal(truyền hình qua internet)

Mình rất bận. Nhưng nếu bạn có gì thì cứ mail cho mình(dinhtrungac@yahoo.com), mình sẽ cố gắng trả lời.

tulc
04-03-2010, 21:16
E cảm ơn a nhiều lắm, nhưng a nói vậy e ko biết bắt đầu từ đâu, hik. A có thể giảng giải kĩ cho e từng bước được ko a ơi, huhu, hoặc a cho e cái phần a đã làm hoặc ntn...cũng dc tùy a. A giúp em đi mà, có source code rồi em cố gắng đọc và hiểu.

dinhtrungac
04-03-2010, 22:22
E cảm ơn a nhiều lắm, nhưng a nói vậy e ko biết bắt đầu từ đâu, hik. A có thể giảng giải kĩ cho e từng bước được ko a ơi, huhu, hoặc a cho e cái phần a đã làm hoặc ntn...cũng dc tùy a. A giúp em đi mà, có source code rồi em cố gắng đọc và hiểu.

Bạn vào: http://forum.aspvn.net/tm.aspx?m=12038 Tham khảo nhé
Ngoài ra bạn lên google search với từ khóa "Bóc tách dữ liệu" để biết cách viết một robot.

Nghiên cứu thêm RSS để giảm thiểu dung lượng cần thiết khi truyền qua mạng.

Có gì kg hiểu cứ PM mình.

dhaudo
15-03-2010, 18:22
chủ đề này hay quá :d

nonggiatu
15-03-2010, 18:42
"Con robot" mà bạn trên kia nói gọi là crawler.
VD: Để lấy các tin thể thao trên vnexpress, bạn load nội dung của trang http://www.vnexpress.net/GL/The-thao/, sau đó tìm ra khu vực nào (tức là thẻ HTML nào) chứa các link tin tức thể thao. Duyệt từng link và load nội dung của các tin tức đó. Sau đó bạn phải tìm ra khu vực nào chứa nội dung tin bài để tách nó ra và đưa vào cơ sở dữ liệu. Việc cuối cùng phải làm là làm cách nào để loại bỏ những tin trùng nhau (ví dụ: 1 tin được đăng cả trên vnexpress, dantri và vietnamnet thì chỉ cần lưu vào CSDL 1 lần).
Việc bóc tách thông tin thì đòi hỏi phải hiểu biết một chút về HTML, còn thuật toán để loại bỏ những tin trùng nhau thì nên hỏi thầy.