Hold-out1 특성공학 (Feature Engineering) 모델평가기법 1. Data Split과 모델 검증 언제 데이터를 나누는가? 충분히 큰 데이터 세트가 가용할 때이다. 데이터가 작으면 이 작업을 하기 어렵다. 충분히 크다는 것은 굉장히 추상적이다. 알고리즘이나 분석문제에 따라 다를 수 있다. 충분히 큰 데이터가 없을 때에는 교차확인(Cross Validation)을 고려한다. 왜 데이터를 나누는가? 학습에 사용되지 않는 데이터를 사용하여 예측을 수행함으로써 모델의 일반적인 성능에 대한 적절한 예측을 할 수 있다. 우리가 모델을 만들 때 일반적으로 Training, Test로 나눈다. 학습 데이터를 가지고 모델을 만들고 만든 모델을 가지고 이 모델을 평가해야 하는데 성능 평가 시 사용하는 데이터가 Test 데이터이다. 항상 모든 모델은 처음 보는 데이터를 가지고 평가를.. 2023. 4. 21. 이전 1 다음