PDA

View Full Version : Force Google to revisit + reindexed pages :)



BossFTP
20-02-2009, 15:55
Chào,

Để Google index page của site có rất nhiều cách, rất dễ dàng, thậm chỉ chỉ cần 1 phút sau khi post là đã dc indexed. Vấn đề nằm ở chỗ khi trang của bạn thay đổi nội dung, bạn muốn Google quay lại, nhưng Google thường khá "chây ì" :( có khi cả tháng sau mới quay lại một page đã dc indexed, nhất là các trang có PR thấp.

Em nghĩ ra một cách, ko biết có ai post chưa, đó là dùng Google Translate "dịch" trang web của bạn.

Giả thiết: Google rất thông minh :w00t: (đúng)
=> Google chả dại gì mỗi lần dịch đều phải get page của bạn (treo server luôn :no:)

=> Google sẽ tạo cache, nếu xem header ko thấy thay đổi gì so với cache thì thôi :yes:, còn nếu ko sẽ get page.

=> Google cũng chả dại gì mà lưu cache G translate và G search riêng => phí đĩa cứng :(

=> Google sẽ dùng chung cache cho cả G search và G translate (dĩ nhiên, page cần allow G bot)

=> Mỗi lần bạn "dịch" trang web của bạn -> G quay lại + index lại page :)

Mời các bác cho ý kiến lol

superthin
20-02-2009, 16:17
Không thấy có gì chứng minh là mỗi khi dịch Google đồng thời Index lại trang nào đó. Việc dịch là không cần có sự tham gia trực tiếp của một server nào của Google cả nên Google không lo bị treo máy, có treo máy chăng là treo máy server trang "bị" dịch hoặc máy tính người dùng.

Bạn thử lấy file Log do Apache / IIS / ... cung cấp mỗi khi bạn nhờ Google dịch trang của bạn thử xem, thấy có gì lạ xuất hiện và cho biết rằng con Bot là chức năng Index sục sạo vào site của bạn cùng thời điểm đó, mình đọc 70MB file log chưa thấy có dòng nào chứng minh điều đó, và không có ý định đọc lại lần hai vì mất những 3 ngày cho file log đó.

BossFTP
20-02-2009, 16:31
Ý em ko phải là G bot bay vào ăn ké :no: mà là khi G translate page sẽ tranh thủ cache lại trang web của bác (nếu trang đó đã dc indexed / allow g bot) :| như vậy thì G sẽ đỡ mất công hơn là chờ đến kì mới revisit :yes:

hung3rd
20-02-2009, 16:34
Cảm ơn những phát hiện của bạn. Để thử xem sao?

hostindexvn.com
20-02-2009, 19:35
Có nhiều cách, chẳng nhất thiết phải dùng cách không chắc chắn của cậu

happyman_1x
20-02-2009, 19:44
hi hi,

mình không nghĩ là G translate và G search dùng cùng 1 bot. Bạn thử log lại các visit đến trang web trong web server xem chúng nó có cùng 1 con bot không, chứ như GA và GS là 2 con bot khác hoàn toàn. Và nếu tôi đúng thì bạn có dịch trang web của bạn hàng trăm lần, G Search cũng sẽ chẳng cache trang web cũng bạn lại :)

Theo mình biết thì có 1 cách yêu cầu G Search claw lại trang của mình, nhưng dĩ nhiên nó chỉ đặt higher priority revisit lại thôi chứ chẳng claw lại liền đâu, ngoại trừ trang web của bạn có lượt truy cập cao và tần suất thay đổi nhiều:
- Bạn cập nhật lại các file sitemap với modified date là mới nhất. Lúc đó, bot sẽ ưu tiên claw lại những trang đó. Nếu bạn có xài G webmaster thì sẽ theo dõi được 1 phần công việc: xem trong statics, trong 1 ngày nào đó, tự nhiên lượt claw tăng lên đột ngột.

Bạn hãy thử xem!

.

hostindexvn.com
20-02-2009, 19:56
Thạt ra SEO rất dễ, chỉ quảng bá là khó

r0memb0
20-02-2009, 20:45
Tăng Crawn rate thì sao bà con.

đóivl
01-03-2009, 19:11
Đã test ....
Bật 2 table .... 1 tab lướt web bình thường . 1 tab dùng google translate.
Vào xem thử thì ... T_T
Khi bạn dùng google translate , nó giống như bạn truy cập thông qua 1 proxy vậy .
Ko tin có thể thử dùng http://translate.google.com.vn , bỏ link http://ip2location.com vào translate thử .

Còn việc mình xác định là bot của google ko liên quan gì đến công cụ translate này . Bạn nào dùng mã nguồn forum VBB (http://chemgio.vn/forum/forumdisplay.php?f=151) thì thử đi .
1 Tab lướt bt , 1 tab dùng google translate , vào trang forum (http://chemgio.vn/forum) của bạn , ở tab lướt bt thử vào trong phần xem ai đang online ý .
Sẽ thấy 1 ip là của chính bạn , 1 IP là của thằng google , thử copy IP đó vào ip2location.com whois thử .... T_T

vantienart
02-03-2009, 08:23
hai bot của google chẳng có gì liên quan đến nhau, có chăng tăng thêm visit từ google dịch, không ảnh hưởng đến Crawn rate.

mistarg
03-03-2009, 00:06
vậy có cách nào update cached nhanh hơn không?

bapnon
03-03-2009, 04:21
dùng ping service như kiểu Wordpress được không? mình muốn dùng xmlrpc như kiểu wordpress nhưng chưa hiểu cách trao đổi data với cái xmlrpc server khác.

Mình thấy CakePHP có class xmlrpc sẵn rồi mà chưa biết cách dùng như kiểu Wordpress. Mình mới làm 1 trang mới thử với Wordpress trong vòng 3 tiếng thấy Google visit và update 2 lần. Thấy ping service của Wordpress thật tuyệt nhưng mình hiện vẫn mù tịt về xmlrpc, có làm thử với example của class xmlrpc thì nó works! nhưng chưa biết cách áp dụng vào website của mình sau mỗi lần update để Google tới viếng nhà!

BossFTP
03-03-2009, 12:01
Đã test ....
Bật 2 table .... 1 tab lướt web bình thường . 1 tab dùng google translate.
Vào xem thử thì ... T_T
Khi bạn dùng google translate , nó giống như bạn truy cập thông qua 1 proxy vậy .
Ko tin có thể thử dùng http://translate.google.com.vn , bỏ link http://ip2location.com vào translate thử .

Còn việc mình xác định là bot của google ko liên quan gì đến công cụ translate này . Bạn nào dùng mã nguồn forum VBB thì thử đi .
1 Tab lướt bt , 1 tab dùng google translate , vào trang forum của bạn , ở tab lướt bt thử vào trong phần xem ai đang online ý .
Sẽ thấy 1 ip là của chính bạn , 1 IP là của thằng google , thử copy IP đó vào ip2location.com whois thử .... T_T



OK men, em nói lại cho rõ một tẹo lol

Em ko nói Google Translate = Google Bot (khác IP, user agent), em chỉ suy đoán rằng Google bot + Google Translate xài chung cache, hoặc chí ít cũng có liên quan với nhau, cũng giống như có bác từng khẳng định Sự có mặt của Google Media Bot (adsense) làm tăng tần số crawl của Google Bot.

Điều này ko dc chứng minh = lý thuyết, nhưng có thể nhận ra = thực nghiệm.

VD như site em các sub page cả tháng+ G mới reindex một lần (e.g links exchange page), nhưng khi translate thử một lượt toàn site (khoảng 6-7 trang), thì chỉ hôm sau toàn bộ các subpage đều đã dc cache lại (check với lệnh site: ).

đóivl
03-03-2009, 16:20
OK men, em nói lại cho rõ một tẹo lol

Em ko nói Google Translate = Google Bot (khác IP, user agent), em chỉ suy đoán rằng Google bot + Google Translate xài chung cache, hoặc chí ít cũng có liên quan với nhau, cũng giống như có bác từng khẳng định Sự có mặt của Google Media Bot (adsense) làm tăng tần số crawl của Google Bot.

Điều này ko dc chứng minh = lý thuyết, nhưng có thể nhận ra = thực nghiệm.

VD như site em các sub page cả tháng+ G mới reindex một lần (e.g links exchange page), nhưng khi translate thử một lượt toàn site (khoảng 6-7 trang), thì chỉ hôm sau toàn bộ các subpage đều đã dc cache lại (check với lệnh site: ).


Xác nhận............

Mr.Triết
05-03-2009, 19:24
seo không phải là chuyện đơn giản