PDA

View Full Version : Em khổ quá mấy bác vào giúp em với



abcxyz77
19-05-2015, 20:15
Em đang làm một cái web, giờ em có 1 triệu file html có chứa thông tin trên đó, em biết code căn bản. Giờ em phải lấy thông tin trên 1 triệu trang html tạo ra một database sau đó dùng database này để viết web. Em biết viết mấy cái my_sql querry đơn giản trong php, nhưng việc lấy dữ liệu trên 1 triệu trang html kia đưa vào database dùng cái gì? file batch hả mấy bác, viết bằng C hả. Database thì dùng loại . sql hả. Giờ mà thuê người làm cái này thì tốn bao nhiêu tiền, vì em không biết có kiếm được xu nào từ web này không nên cũng ngại đầu tư nhiều.Hic

vuvps
19-05-2015, 21:09
Bạn dùng PHP cũng được mà, sử dụng thư viện XML để trích xuất thông tin từ các file html kia ra, rồi ghi vào database theo một cấu trúc nào đó tối ưu. :D

quangvinhhr
19-05-2015, 22:28
Mỗi trang web có cấu trúc khác nhau thì phải lấy = tay từng trang thôi, còn cấu trúc giống nhau thì dùng mấy hàm read file của php, read từng file trong folder kết hợp vs regex để lựa chọn thông tin cần thiết của trang và insert vào database