훈련 세트1 K-최근접 알고리즘02 (훈련세트/테스트세트) https://colab.research.google.com/drive/1nZUD3xipIo8uq3jt51krpDnDiMa4VYeI?usp=sharing traing_set_test_set.ipynb Colaboratory notebook colab.research.google.com 요약 무언가를 분류하는 알고리즘을 만들 때, 알고리즘이 정답을 모두 알고 있다면 문제가 된다. 모델을 훈련할 때 사용한 데이터로 모델의 성능을 평가하는 것은 정답을 미리 알려주고 시험을 보는 것과 같다. 공정하게 점수를 매기기 위해서는 훈련에 참여하지 않은 샘플을 사용해야한다. 이 때문에 훈련 데이터를 훈련 세트와 테스트 세트로 나누는 것이다. 또한 무작정 훈련 세트와 테스트 세트로 나누는 것은 샘플링 편향을 불러온다. 무.. 2023. 1. 24. 이전 1 다음