ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [30 Days of ML] Day 9 - part 1
    Program/[Kaggle] 30 Days of ML 2021. 8. 15. 17:46
    반응형

    Tutorials


    Selecting Data for Modeling

    데이터 셋에 변수가 너무 많아 확인하기가 어렵다. 그래서 직관(intuition)을 통해 몇 가지 변수를 선택해보자. 이후에는 자동으로 변수의 우선 순위를 지정하는 통계 기술을 살펴 볼 것이다.

    데이터의 하위 집합을 선택하는 여러 방법

    1. "prediction target"을 선택하는 데 사용하는 dot 표기법
    2. "features"를 선택하는 데 사용하는 column list로 선택

    Selecting The Prediction Target

    dot-notation으로 변수를 선택할 수 있으며 Seires에 저장된다. dot-notation을 통해 prediction target을 선택하며 보통 y라고 부른다.


    Choosing "Features"

    "features"는 모델에 입력되며 예측할 때 사용된다. 이 경우 주택 가격을 결정하는 데 사용되는 열이다. 보통 X라고 부른다.

    Xdata_frame.describe() 혹은 data_frame.head()를 통해 확인 해보는 것이 중요하다.


    Building Your Model

    모델을 구축하고 사용하는 단계

    1. Define: 모델의 유형을 결정
    2. Fit: 제공된 데이터에서 패턴을 캡처
    3. Predict: 예측
    4. Evaluate: 모델의 예측이 얼마나 정확한지 확인
    반응형

    'Program > [Kaggle] 30 Days of ML' 카테고리의 다른 글

    [30 Days of ML] Day 10  (0) 2021.08.15
    [30 Days of ML] Day 9 - part 2  (0) 2021.08.15
    [30 Days of ML] Day 8  (0) 2021.08.12
    [30 Days of ML] Day 7  (0) 2021.08.12
    [30 Days of ML] Day 6  (0) 2021.08.11

    댓글

Designed by Tistory.