PDA

View Full Version : Vấn đề tỉa cây( pruning) trong CART ?



onlyloneblack
01-12-2011, 12:03
Trong thuật toán cart có 2 phần là tạo cây và tỉa cây. Phần tạo cây thì mình dùng gini index để tìm thuộc tính dùng để phân chia. Sau khi phát triển cây lớn nhất, sẽ có bước tỉa cây. Nhưng mình tim hiểu trên mạng nhiều mà vẫn không hiểu được thuật toán cart này tỉa cây như thế nào, liên quan đến độ phức tạp của cây và mức độ phân loại sai đó.
Có anh nào biết rõ về vấn để tỉa cây trong CART không chỉ mình tỉa như thế nào vậy, theo mình biết thì dùng cái gọi là 10-fold cross validation. Giúp em với, em cần lắm ?
Ví dụ áp dụng tỉa cây cho bảng dữ liệu này
http://nf4.upanh.com/b6.s21.d3/5756106dc4e53f84fbf1c0410efeb436_38465494.screenhu nter01dec.gif (http://www.upanh.com/screenhunter_01_dec._01_11.26_upanh/v/4noden8pauk.htm)

onlyloneblack
01-12-2011, 18:27
lên để các anh phụ em