전체 글 37

4장: Classification

[4강: 분류] - 균일도 기반 규칙 조건 - 정보 균일도 측정 방법 1) 정보 이득 ..앤트로피 개념 정보이득 지수 = 1-엔트로피 지수 2) 지니계수: 불평등 지수 지니계수 낮을수록 균일한 데이터 - 결정트리의 규칙노드 생성 프로세스 If true/ else - 결정트리 장점 쉽고 직관적 - 결정트리 단점 과적합(overfitting) sol) 트리크기를 사전에 제한 - 결정트리 주요 hyperparameter - max_depth, max_features.. - Graphviz이용한 결정트리 모델의 시각화(실제 나무 모양 그림으로) - 각 노드에는 피처의 규칙 조건 gini samples: 현 규칙에 해당하는 데이터 건수 value: 클래스 값 기반의 데이터 건수 ex) [41,4,10] 이면 해당..