PDA

View Full Version : Giới thiệu giúp tôi vài ví dụ về dịch vụ data mining?



tedhive
12-01-2016, 15:31
Chào các bạn.

Tôi đang làm dự án Dokoor với mục tiêu đánh chỉ mục toàn bộ Internet. Để tìm kiếm nguồn thu nhập giúp trang trải cho dự án, tôi có ý định chạy thêm dịch vụ data mining với các dữ liệu được thu thập là các trang web trên Internet. Tuy nhiên tôi chưa hiểu rõ nhu cầu của người dùng đối với dịch vụ data mining này.

Mong các bạn giúp tôi giới thiệu ít thông tin về:
+ Các công ty cung cấp dịch vụ data mining được ưa chuộng
+ Các loại dịch vụ data mining và các dữ liệu đầu ra được cung cấp
+ Các thông tin mà các web master cần (có thể được cung cấp qua data mining)

habogay
12-01-2016, 15:37
Nhiều lắm , tùy lĩnh vực .
Lấy ví dụ về webmaster cần :
- Site của đối thủ tạo bao nhiều backlink ? , mỗi ngày bao nhiêu , tỷ lệ thế nào
- Có bao nhiêu site trên thế giới dung wordpress , jquery ...
- Một thằng xyz nào đó sở hữu bao nhiêu site
- danh sách site cho phép guest post , sử dụng openid hoặc loại captchar nào ?


nói chung là vô cùng vô tận .

tedhive
12-01-2016, 16:00
Nhiều lắm , tùy lĩnh vực .
Lấy ví dụ về webmaster cần :
- Site của đối thủ tạo bao nhiều backlink ? , mỗi ngày bao nhiêu , tỷ lệ thế nào
- Có bao nhiêu site trên thế giới dung wordpress , jquery ...
- Một thằng xyz nào đó sở hữu bao nhiêu site
- danh sách site cho phép guest post , sử dụng openid hoặc loại captchar nào ?


nói chung là vô cùng vô tận .

Cám ơn về chia sẽ của bạn rất nhiều. Bạn có thể giới thiệu cho tôi vài công ty cung cấp một hoặc tất cả các dịch vụ trên được không? Nếu có website của công ty và bảng giá dịch vụ thì quá tốt. Tôi định thu thập thông tin giá cả để xây dựng bảng giá dịch vụ cho mình.

tedhive
12-01-2016, 17:33
Chào bạn habogay,

Theo gợi ý của bạn, mình định cung cấp dịch vụ này:

"- Site của đối thủ tạo bao nhiều backlink ? , mỗi ngày bao nhiêu , tỷ lệ thế nào
- Có bao nhiêu site trên thế giới dung wordpress , jquery ...
- danh sách site cho phép guest post , sử dụng openid hoặc loại captchar nào ?"

Bạn cho mình hỏi, mình cần thu thập được tối thiểu là bao nhiêu dữ liệu: 100 triệu, 1 tỷ, 10 tỷ, 50 tỷ, v.v thì các web master mới bắt đầu thấy hữu dụng và cân nhắc sử dụng dịch vụ của mình?

D@nh
12-01-2016, 19:53
Người ta chỉ cần thấy hữu ích, tìm được cái mình muốn, có được cái mình cần không cần biết dữ liệu nó là bao nhiêu tỷ.

tedhive
13-01-2016, 06:37
Mình mới mở dịch vụ thu thập danh sách backlink của tên miền I will collect backlinks of domain (https://www.fiverr.com/tedclayant/collect-backlinks-of-domain). Các bạn giúp mình review xem có hữu dụng không, có gì cần phải điều chỉnh cho phù hợp với yêu cầu của người dùng không.

Hiện tại dữ liệu của Dokoor còn quá ít nên giá trị dịch vụ đem lại không cao, thời gian sau, khi Dokoor đánh chỉ mục hơn 100 triệu trang web thì danh sách các backlink sẽ nhiều và chính xác hơn, từ đó sẽ hữu dụng hơn bây giờ.

Bạn có thể xem trước kết quả bằng cách vào Dokoor (http://dokoor.com), gõ vào "!backlink", nhấp chuột nút "GO", điền vào tên miền, nhấp chuột nút "Check Backlinks".

http://s21.postimg.org/llzkb6kjr/screen_1.png

gianta
13-01-2016, 08:19
check site lớn đều thấy thông báo
No backlinks found for [ tenmien.com ] domain!

tedhive
13-01-2016, 13:21
check site lớn đều thấy thông báo
No backlinks found for [ tenmien.com ] domain!


Đó là do dữ liệu về backlink của Dokoor (http://dokoor.com) còn quá ít (khoảng 5,000). Khi nào đạt trên 100 triệu thì kết quả mới tạm chấp nhận được. Nếu có được kích thước dữ liệu như công ty này (12 trillion) [ https://ahrefs.com ] thì chất lượng mới đảm bảo.

http://s13.postimg.org/djdpdf4g7/screen_2.png