Trang 1 / 2 12 LastLast
Hiển thị kết quả từ 1 đến 10 / 12
  1. #1
    Tham gia
    23-11-2009
    Bài viết
    3
    Like
    1
    Thanked 0 Times in 0 Posts

    Ngạc nhiên Các bước để lấy tin tự động

    Chào các bạn !

    Mình đang cần làm một project về lấy tin tức tự động từ một số trang như vnexpress, dantri,com...

    Mình muốn biết quy trình để làm một trang web như thế thì gồm những bước nào. Có bạn nào biết thì chỉ giùm mình với.

    Mình cảm ơn các bạn nhiều !
    Quote Quote

  2. #2
    Tham gia
    07-11-2003
    Bài viết
    386
    Like
    0
    Thanked 6 Times in 3 Posts
    - Download Wordpress hoặc joomla hoặc NukeViet về.
    - Cài lên và chạy web thành công.
    - Download VietSpider bản VietSpider - Vietnamese News Extractor
    tại http://vietspider.org/webextractor/download.htm
    - Config quét tin từ trang bạn muốn lấy
    - Config tới web mình đang chạy.
    - Gửi tin lên.

  3. 4 thành viên Like bài viết này:


  4. #3
    Tham gia
    23-11-2009
    Bài viết
    3
    Like
    1
    Thanked 0 Times in 0 Posts
    Cảm ơn bạn đã chia sẻ, nhưng đây là bài tập của mình nên mình phải tìm hiểu từ đầu và phải tự xây dựng các function để lấy tin. Vì mình chưa từng lấy tin bao giờ nên cũng chưa biết phải bắt đầu từ đâu. Rất mong các bạn cùng thảo luận cũng như hướng dẫn mình chi tiết hơn.

    thank all !

  5. #4
    Tham gia
    20-12-2011
    Location
    Tâm Huyết .Com
    Bài viết
    718
    Like
    26
    Thanked 119 Times in 91 Posts
    Bản chất cũng là curl nội dung, Split content ra và lấy được thứ muốn lấy. Nhưng mà như thế rất không hay. Mình cũng ngại và ko muốn biến site của mình thành một đống rác
    realkai.com | Mạng quảng cáo hiển thị

  6. #5
    Tham gia
    12-03-2012
    Bài viết
    5
    Like
    1
    Thanked 0 Times in 0 Posts
    Nếu buôn bán điện thoại thì cách lấy tin tức công nghệ số từ mấy trang dantri cũng được đấy chứ?.
    Mình lấy phần tin mình muốn cũng ko phải là rối rắm lắm đâu.
    Có thể bác ý muốn là lấy từ 1 trang thôi chứ ko phải tất cả.
    Em nói thế đúng ko nhri?
    Cũng đang tìm hiểu về cùng vấn đề với chủ pic

  7. #6
    Tham gia
    11-03-2012
    Bài viết
    4
    Like
    0
    Thanked 0 Times in 0 Posts
    đầu tiên vào 1 trang chủ, đi tới tất cả những link mà trang chủ đó chỉ tới -> cứ đi như vậy cho tới khi nào không đi được nữa, bạn sẽ có được toàn bộ nội dung của site đó, giờ với mỗi đường link lấy phần mình quan tâm (header, content), cũng đơn giản mà, sạch sẽ nữa chớ

  8. #7
    Tham gia
    02-03-2012
    Location
    www.ThietKeMienPhi.Net
    Bài viết
    156
    Like
    0
    Thanked 25 Times in 20 Posts
    1 điều thường thấy ở diễn đàn này khi có các bạn sinh viên vào, đó là:

    Nước đến chân mới nhảy ( đề án sắp đến hạn nộp mới lên đây hỏi, nhờ,...) nhưng nhận thấy thêm 1 điều nữa đó là khả năng của các bạn soi với yêu cầu bài toán là 1 trời 1 vực.

    K lẽ nền giáo dục vn chỉ bắt sv nộp đề tài mà trước đó chưa từng dạy, hay sv k chịu học cho kĩ rồi mới đi thi? Đừng đổ lỗi, tôi nghĩ k phải tất cả 100% các bạn sv đều bí lối trc những vấn đề căn bản này.

    Đây là 1 đề tài dành cho tất cả tất cả sv, thì thiết nghĩ ai cũng làm dc, chứ đâu phải là đề bài dành cho sinh viên xuất sắc mà kêu than?
    =>ThietKeMienPhi . Net - Thiết Kế Website ???

  9. #8
    Tham gia
    28-02-2006
    Bài viết
    512
    Like
    27
    Thanked 67 Times in 58 Posts
    Quote Được gửi bởi duybinh2000 View Post
    Cảm ơn bạn đã chia sẻ, nhưng đây là bài tập của mình nên mình phải tìm hiểu từ đầu và phải tự xây dựng các function để lấy tin.
    bài tập hay là cái gì thì cũng phải "tìm hiểu từ đầu và phải tự xây dựng các function"
    Quote Được gửi bởi duybinh2000 View Post
    Vì mình chưa từng lấy tin bao giờ nên cũng chưa biết phải bắt đầu từ đâu.
    nếu bạn đã làm rồi thì còn bắt đầu để làm gì nữa
    Cách làm thì bạn chiase.net đã nói rồi đó,bạn theo cách đó mà làm
    Bài này chắc để luyện regular express,mình nghĩ sẽ thú vị đó,bạn nên hào hứng lên

  10. #9
    Tham gia
    28-07-2009
    Bài viết
    303
    Like
    3
    Thanked 7 Times in 6 Posts
    1- bạn nên tìm cách lấy nội dung từ RSS-> trang chứa nội dung trước-> phân tích code từng trang -> bóc tách html

  11. #10
    Tham gia
    13-12-2006
    Location
    TPHCM
    Bài viết
    559
    Like
    9
    Thanked 47 Times in 39 Posts
    Mình đưa gợi ý để bạn tự search trên Google nhé:
    + PHP CURL (dùng để crawl data trên các trang web)
    + Simple HTML DOM (1 class của php để bóc tách HTML theo DOM element)

    Với 2 công cụ đó và 1 chút tìm tòi của bạn, bạn sẽ hoàn tất được bài tập! Hy vọng là bạn đừng lười xài Google! Chúc bạn làm tốt!

Trang 1 / 2 12 LastLast

Bookmarks

Quy định

  • Bạn không thể tạo chủ đề mới
  • Bạn không thể trả lời bài viết
  • Bạn không thể gửi file đính kèm
  • Bạn không thể sửa bài viết của mình
  •