[데이터 분석 부트캠프] 친근한 엑셀로 실무 엑셀 데이터 분석 시작하기(3)
2023. 6. 26. 23:46ㆍIT 라이프/패캠 데이터분석 부트캠프 9기
반응형
온라인 강의와 일부 겹치는 내용이 있어 복습하는 기분으로 빡세지 않게 강의를 들었다.
실습이 대부분이었는데 엑셀은 뭐니뭐니해도 머리보다 손이 기억하는 부분이 많아 실습은 필수라고 생각한다.
강사님도 우리가 따로 복습할거란 기댈 안하셔서 수업시간을 십분 활용하여 실습시간을 주셨다ㅋㅋ
앞서 들은 온라인 강의도 정리해 두었기 때문에 안겹치는 내용만 따로 정리해 보았다.
1. 데이터 전처리
⌘ 엑셀함수 (온라인 강의 외 내용)
- COUNT(범위) : 숫자 데이터의 개수만 셈
- COUNTA(): 비어 있지 않은 셀의 개수만 셈
- COUNTBLANK() ↔ COUNTA() : 비어있는 셀의 개수만 셈(결측치를 확인할 때 사용)
COUNTIF(셀 범위, 개수 셀 데이터의 조건)← 조건에는 부등호도 들어갈 수 있고, 값이 들어갈 수도 있음- COUNTIFS(셀 범위1, 개수 셀 데이터의 조건1, 셀 범위2, 개수 셀 데이터의 조건2) ← 조건들이 &조건을 만족하는 경우를 구함
더보기
팁
- 새로운 고객 리스트가 밑에 계속 추가될 예정이면 아예 데이터 범위를 열 전체로 잡기, 안전하게 행열 모두 고정($)
- COUNTIFS()는 COUNTIF()를 대신할 수 있으므로 일괄적으로 COUNTIFS()만 쓰는게 기억하기 좋음
- =COUNTIFS($C:$C,N5,$E:$E,">="&O5)
- 셀서식(ctrl 1)에서 사용자형식지정 이용: 셀서식상 “40 이상”이라고 써지지만 실제값은 숫자 40이라서 참조가 가능
- 결측치를 구한 경우, 항상 합계를 구해서 데이터 전수가 맞는지 확인해야 함
SUMIF(조건들의 열 범위, 조건, 더할 값들의 열 범위)- SUMIFS(더할 값들의 열 범위, 조건범위1, 조건1, 조건범위2, 조건2)
- IFERROR(FIND(D$4,$C5,1),0) → sumifs()로 0 초과 개수만 세서 freq를 구할 수 있음
⌘ 기능
- 필터를 활용한 정렬
- 데이터 유효성 검사 : 필터링 가능, 저장 불가
- 목록화하여 필터처럼 사용가능 : 데이터유효성 > 허용:목록 > 원본 : 대상목록 범위 입력 > 확인
- 목록 자동화는 그래프로도 바로 연동되서 편리함
정리
데이터 전처리는 데이터 분석 과정 중 가장 많은 시간과 비용이 필요한 과정이고, garbage in, garbage out이기 때문에 중요성이 강조되는 단계이다. 실습하다가 알게 되었는데 countifs() 함수의 범위 내 숫자가 아닌 문자열이 잘못 들어있는 경우 에러가 나길 기대했지만 무시한 채로 결과가 출력되는걸 보고 전처리를 위해 그 앞 단계인 EDA에서의 체크도 중요하겠단 생각이 들었다.
아무래도 데이터가 많고, 인간은 휴먼에러를 발생시킬 수 밖에 없단건 일하면서 질리도록 봐왔기 때문에 전처리, EDA가 지겹고 재미없어도 막상 하고나면 집청소한 것같은 개운함도 살짝 같이 느껴지는 것 같다.
728x90
반응형
'IT 라이프 > 패캠 데이터분석 부트캠프 9기' 카테고리의 다른 글
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(3) (0) | 2023.06.28 |
---|---|
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(2) (0) | 2023.06.27 |
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(1) (0) | 2023.06.23 |
[데이터분석 부트캠프] 친근한 엑셀로 실무 엑셀 데이터 분석 시작하기(2) (0) | 2023.06.23 |
[데이터 분석 부트캠프] 친근한 엑셀로 실무 엑셀 데이터 분석 시작하기(1) (0) | 2023.06.22 |