Molybdenum의 개발기록

[Python] MachineLearning_Tree 본문

Python

[Python] MachineLearning_Tree

Molybdenum_j 2023. 3. 27. 10:20
Decision_Tree_learning(결정 트리 학습법)
: 어떤 항목에 대한 관측값과 목표값을 연결시켜주는 예측 모델로서 결정 트리를 사용

- 분류트리 : 트리 모델 중 목표 변수가 유한한 수의 값을 가진다.

- 회귀트리 : 결정 트리 중 목표 변수가 연속하는 값으로 일반적인 실수를 가진다.

 

결정트리 학습법

  • 결과를 해석하고 이해하기 쉽다
  • 자료를 가공할 필요가 거의 없다
  • 수치 자료와 범주 자료 모두에 적용할 수 있다.
  • 화이트 박스 모델을 사용한다.
  • 안정적이다.
  • 대규모의 데이터 셋에서도 잘 동작한다.

 

결정 트리 파라미터

criterion : 가지의 분할의 품질을 측정하는 기능

max_depth : 트리의 최대 깊이

min_samples_split : 내부 노드를 분할하는 데 필요한 최소 샘플 수

min_samples_leaf : 리프 노드에 있어야 하는 최소 샘플 수

max_leaf_nodes : 리프 노드 숫자의 제한치

random_state : 추정기의 무작위성을 제어한다. 실행했을 때 같은 결과가 나오도록 한다.

 

결정 트리(Decision Tree)

1. 만들어진 모델에 대해서 시각화 가능

2. 시각화가 가능하므로 비전문가도 이해하기 쉽다

3. 데이터의 스케일에 구애받지 않는다.

4. 데이터의 내 변수의 종류가 달라도 잘 작동한다.

5. 학습용 데이터에 과대적합되는 단점이 있다.

'Python' 카테고리의 다른 글

[Python] MachineLearning_SVD  (0) 2023.03.29
[Python] MachineLearning_Ensemble  (0) 2023.03.27
[Python] MachineLearning  (0) 2023.03.27
[Python] Online_Retail  (0) 2023.03.27
[Python] Python_Data_visualization  (0) 2023.03.27
Comments