의사결정나무: Decision Tree
·
AI Study/Machine Learning
[분류 문제]• 신규고객에게 신용카드를 발급하려고 하는데 어느 등급으로 해야 할까?• 어떤 부류의 고객이 신용등급이 높을까?• 어떤 구매자가 반품할 확률이 높을까?• 새로 관찰한 식물은 어느 종에 속할까? 디시전 트리 분석- 데이터를 여러 그룹으로 분류하여 변수간 나타나는 의사결정규칙을 트리구조로 분류하는 방법 디시전 트리를 만드는 알고리즘- 엔트로피와 정보획득이론을 기반으로 하는 머신러닝 분야의 ID3, C4.5, C5.0 알고리즘- 통계학에 기반으로 둔 CART와 CHAID C5.0- 엔트로피(entropy)와 정보이득(information gain) 개념에 기반을 둠- 초기 목표변수의 데이터들이 혼재되어 있으면 무질서도, 엔트로피가 큼.- 입력변수들의 데이터들을 분류하는 과정에서 목표변수의 데이터가..