머신러닝 실습 - 4. 랜덤 포레스트로 붓꽃 데이터 분류

2024. 1. 17. 12:40인공지능/머신러닝 실습(Python)

728x90
반응형

 이 글에서는 Scikit-learn의 sklearn 라이브러리를 사용하여 랜덤 포레스트 모델을 훈련하고, 파라미터들을 조절해가며 성능을 비교한다. 결정 트리에 관한 이론적 내용을 알고 싶다면 이곳으로.


코드 (나머지 시행에서는 올리지 않음)

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
import matplotlib.pyplot as plt
from sklearn.metrics import accuracy_score

iris = datasets.load_iris()

X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state = 1, stratify=y)

rf_model = RandomForestClassifier(n_estimators=25, random_state=1, n_jobs=2)
rf_model.fit(X_train, y_train)

predict = rf_model.predict(X_test)
accuracy = accuracy_score(y_test, predict)
print('Accuracy: ', accuracy)

결과

Accuracy:  0.9777777777777777
728x90
반응형