-
[30 Days of ML] Day 9 - part 1Program/[Kaggle] 30 Days of ML 2021. 8. 15. 17:46반응형
Tutorials
Selecting Data for Modeling
데이터 셋에 변수가 너무 많아 확인하기가 어렵다. 그래서 직관(intuition)을 통해 몇 가지 변수를 선택해보자. 이후에는 자동으로 변수의 우선 순위를 지정하는 통계 기술을 살펴 볼 것이다.
데이터의 하위 집합을 선택하는 여러 방법
- "prediction target"을 선택하는 데 사용하는 dot 표기법
- "features"를 선택하는 데 사용하는 column list로 선택
Selecting The Prediction Target
dot-notation으로 변수를 선택할 수 있으며 Seires에 저장된다. dot-notation을 통해 prediction target을 선택하며 보통 y라고 부른다.
Choosing "Features"
"features"는 모델에 입력되며 예측할 때 사용된다. 이 경우 주택 가격을 결정하는 데 사용되는 열이다. 보통 X라고 부른다.
X를
data_frame.describe()
혹은data_frame.head()
를 통해 확인 해보는 것이 중요하다.
Building Your Model
모델을 구축하고 사용하는 단계
- Define: 모델의 유형을 결정
- Fit: 제공된 데이터에서 패턴을 캡처
- Predict: 예측
- Evaluate: 모델의 예측이 얼마나 정확한지 확인
반응형'Program > [Kaggle] 30 Days of ML' 카테고리의 다른 글
[30 Days of ML] Day 10 (0) 2021.08.15 [30 Days of ML] Day 9 - part 2 (0) 2021.08.15 [30 Days of ML] Day 8 (0) 2021.08.12 [30 Days of ML] Day 7 (0) 2021.08.12 [30 Days of ML] Day 6 (0) 2021.08.11