자격증/빅데이터분석기사

빅데이터분석기사 실기 준비 - Day 1

uding9 2021. 11. 24. 06:41
반응형

1. 리스트(list), 튜플(tuple), 집합(set), dictionary

  • list
    - [ ] 사용
    - 한 번에 여러 유형의 자료를 담을 수 있음
    - append를 통해 요소 추가
    - 값 수정, 변경할 때 list[index]=value 를 통해 변경할 수 있음
  • tuple
    - ( ) 사용
    - 값 수정, 변경 못하는 것 제외하고 list와 동일
  • set
    - { } 사용
    - list, tuple과 다르게 순서가 존재하지 않음
    - 중복된 값이 들어가지 않음
    - add를 통해 요소 추가 / 여러 개의 요소를 추가할 때 update 사용 / 하나의 요소 삭제할 때 remove / 모든 요소 삭제할 때 clear
    - 합집합/교집합/차집합
  • dictionary
    - { } 사용하지만 'key: value' 매칭 형태
    - 인덱스가 아닌 key 값을 통해 value를 조회함
    - key 혹은 value만 가져오기

2. numpy

  • 다차원 배열
    - rank: 배열의 차원 / shape: 각 차원의 크기를 튜플로 표시
    - np.arange() / 행렬 / 행렬 연산

3. pandas

  • Series
  • DataFrame
    • 파일 불러올 때 한글이 깨지는 경우 다음과 같이 encoding 설정해서 읽어오기
      => pd.read_csv('xxx.csv', encoding='euc-kr')DataFrame
    • 열 불러오기
    • iloc 사용
    • 특정 값은 .at[행 번호, '컬럼 이름'] 을 통해 불러오기
    • 기타
    • 데이터 프레임 새로운 변수 생성 및 컬럼 이름 변경

    • 조건에 맞는 데이터 추출하기 (AND 는 '&' 로 OR 는 '|' 로 사용)
    • 범주 확인 & 변경
    • 다음은 함수 생성하여 범주 값 변경하기
    • pandas, numpy 전환
반응형