Hiển thị kết quả từ 1 đến 1 / 1
  1. #1
    Tham gia
    10-10-2009
    Bài viết
    99
    Like
    3
    Thanked 30 Times in 22 Posts

    Cấu hình tối ưu robots.txt



    Khi một
    search engine ( tìm kiếm thông tin web bạn trên google ) trước tiên nó phải kiếm tập tin robots.txt. Vậy tập tin robots.txt là gì ?

    Robots.txt nó giống như một cách bạn đề phòng khi mời một người bạn chưa quen thân vào nhà chơi vậy, bạn có thể giới thiệu và cho họ tham quan gần hết ngôi nhà cũng được nhưng bạn cũng phải dấu kín đi thông tin nơi cất giấu két sắt tiền hay một số giấy tờ nhàquan trọng trong nhà của mình, đời thì có ai biết được ai tốt ai xấu đúng ko ? Lý Thông thì nhiều mà Thạch Sanh thì ít, he he

    >> Xem chi tiết hơn bài viết này <<

    Chức năng Robots.txt cũng tương tự như vậy, bạn phải cấm khách hàng truy cập vào một số thư mục quan trọng của web, người bình thường thì không nói gì, chứ đối với một hacker hạng bình dân thì đó đúng là một món mồi béo bỏ để xăm xỉa phá hoại code của bạn

    Ở trong các Web bán hàng tại Thoitrang-dientu.com đều có chức năng này mà khách hàng hầu hết không chú ý tới nó

    Mình chỉ cho các bạn cách kích hoạt nó lên nhé :

    Bước 1 ) Bạn đăng nhập vào trang Admin >> Phần mở rộng >> Dữ liệu sản phẩm >> Cài đặt Sơ đồ trang web Google



    Bước 2 ) Bạn nhấn nút Sửa Sơ đồ trang web Google xem thông tin






    Bước 3 ) Bạn chú ý ở ô Nguồn cung cấp Url có cung cấp cho bạn đường dẫn http://domain-của-bạn.com/index.php?route=feed/google_sitemap, bạn copy đường dẫn mục Sitemapbước 4





    Bước 4 ) Tạo một file tập tin robots.txt với nội dung là



    User-agent: *
    Disallow: /cgi-bin/
    Disallow: /admin/
    Disallow: /download/
    Disallow: /system/
    Disallow: /vqmod/
    Disallow: /*&limit
    Disallow: /*&sort
    Disallow: /*?route=checkout/
    Disallow: /*?route=account/
    Disallow: /*?route=product/search
    Disallow: /*?route=affiliate/
    Sitemap: http://domain-của-bạn.com/index.php?route=feed/google_sitemap


    Bước 5 ) Sau đó copy file robots.txt lên host ngang với source web của mình



    Giải thích chút xíu về thằng Disallow này nhé : có chức năng không cho người xem web của mình "nhòm nhó" vào các thư mục quan trọng trên web. Ví dụ như các thư mục : cgi-bin, admin, download, system, vqmod, thanh toán ....

    *** Mình không đào sâu về vấn đề này để tránh gây " nhức đầu " thêm cho khách hàng, bạn cứ làm theo các bước như mình đã hướng dẫn như trên, thông tin nội dung file robots.txt mình đã soạn đầy đủ và rất chi là chuẩn men rồi

    Có vấn đề gì trong khi làm bạn cứ Pm qua Yahoo hoặc Skype cho mình

    Yahoo : tuandatvn22
    Skype : tuandatvn22
    Quote Quote

  2. Thành viên Like bài viết này:


Tags for this Thread

Bookmarks

Quy định

  • Bạn không thể tạo chủ đề mới
  • Bạn không thể trả lời bài viết
  • Bạn không thể gửi file đính kèm
  • Bạn không thể sửa bài viết của mình
  •