9기(7)
-
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(4), 시각화
1. 어제까지 배운 내용 복습 내용 중 ⌘ 표시 형식 셀서식 > 사용자 지정 구문 양수일 때; 음수일 때;0일 때(주가등락,성장율,달성률 등에 사용가능) : [빨강]"▲"#,##0;[파랑]"▼"#,##0;"-” 2. 통계적 데이터 분석 ⌘ 시계열 데이터 대부분은 비정상 시계열 데이터가 많음 분석 결과를 이해하기 어려움. 그래서 뭔가를 더 걷어내고 완만하게 만들어서 정상 시계열 분석방법으로 분석하게 됨 예) 주식의 캔들챠트 = 비정상 시계열 데이터를 평균이동(정상 시계열 분석방법 중 하나) 정상 시계열 분석방법 지수평활법 현재까지의 실제 값과 과거의 예측 값을 합산하여 미래의 예측 값을 구하는 방법 단순 지수 평활법의 사용 예시: 월별 매출액(과거 시계열 데이터)으로 미래의 월별 매출액 예측 미래의 예측 ..
2023.06.29 -
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(3)
앞서 온라인강의를 들으며 궁금한 부분도 생겼고, 따로 이어 공부할 내용도 생겼고, 들었으나 한 번으로는 충분치 않다고 여겨지는 부분도 생겨서 오늘, 내일 있을 실시간 통계강의가 기대되었다. 좀 더 의욕적으로 임하게 되었달까. 오늘 강의에 앞서 강사님이 얘기하신 개념 정의의 중요성은 나도 항상 공감하던 내용이었는데, 오늘 배우는 것도 개념을 정의하고 이해하는 게 중요한 만큼 더 집중해 듣게 되었다(뭐는 안그러겠냐마는...) 1. 통계학의 개념과 목적 ⌘ 통계학 모집단의 특성 파악을 위하여 표본의 특성을 파악 by 표본을 수집, 정리, 요약, 분석 이를 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 배우는 학문 따라서 필연적으로 기술 통계학 → 추론 통계학 순서에 따라 일을 하게 됨 2. 기초 통계 ..
2023.06.28 -
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(2)
기초통계에서 사용하는 지표들은 수식이나 기준이 되는 값을 외울 게 아니라 어떤 방법/값으로 데이터의 특성을 파악할 수 있는지를 알아서 적재적소에 사용할 수 있어야 한다. 데이터를 탐색(EDA)할 때 지표들을 한 번 정도는 항상 확인해야 데이터의 특성을 파악할 수 있다. 데이터의 특성이라고 썼지만, 더 정확하게 말하자면 변수(column) 하나 하나에 대한 기초통계량도 봐야하고, 변수간 상관관계도 봐야하고, 변수 각각의 분포도 확인해야 한다. 이럴거면 데이터를 보기 전에 일괄로 거칠 수 밖에 없는 수치들은 미리 정의해두고 파이썬으로 뽑게 해도 되겠다 싶다. 1. 기술통계 ⌘ 기초통계량(1)- 중심경향성 중심경향성 : 데이터 분포의 중심을 보여주는 값 최빈값(Mode) ← 이산형 자료 뿐 아니라 범주형 자료..
2023.06.27 -
[데이터 분석 부트캠프] 친근한 엑셀로 실무 엑셀 데이터 분석 시작하기(3)
온라인 강의와 일부 겹치는 내용이 있어 복습하는 기분으로 빡세지 않게 강의를 들었다. 실습이 대부분이었는데 엑셀은 뭐니뭐니해도 머리보다 손이 기억하는 부분이 많아 실습은 필수라고 생각한다. 강사님도 우리가 따로 복습할거란 기댈 안하셔서 수업시간을 십분 활용하여 실습시간을 주셨다ㅋㅋ 앞서 들은 온라인 강의도 정리해 두었기 때문에 안겹치는 내용만 따로 정리해 보았다. 1. 데이터 전처리 ⌘ 엑셀함수 (온라인 강의 외 내용) COUNT(범위) : 숫자 데이터의 개수만 셈 COUNTA(): 비어 있지 않은 셀의 개수만 셈 COUNTBLANK() ↔ COUNTA() : 비어있는 셀의 개수만 셈(결측치를 확인할 때 사용) COUNTIF(셀 범위, 개수 셀 데이터의 조건) ← 조건에는 부등호도 들어갈 수 있고, 값이..
2023.06.26 -
[데이터 분석 부트캠프] 데이터 분석을 위한기초 수학/통계(1)
고등학교 때 수학, 통계 공부에서 요구하는 것과 지금 배우는 것의 학습내용과 목표가 다르다는 점에 집중했다. 고등학교에서는 정확한 계산, 개념과 정리의 수학적 응용, 문제를 풀기 위한 다양한 계산적 스킬을 배웠지만 적용과 수치에 대한 해석은 전혀 배움의 대상이 아니었다. 이 수업에서는 확률과 통계의 개념을 빠르게 정리하고, 통계적 방법론을 활용하여 분석 기법을 활용할 수 있게 되는 것을 목표로 한다니 흥미와 궁금증이 생겼다. 결국 수업에서 아래의 내용에 집중하면 되는 거다. 기본적인 용어와 개념을 이해하고, 수식 자체보다는 수식에 담긴 직관적 의미를 파악하고, 통계량에 대한 해석을 할 수 있게 되는 것 1. 데이터 분석과정과 탐색적 데이터 분석(EDA) ⌘ 데이터 분석의 과정 데이터 분석 기획 ← 문제정..
2023.06.23 -
[데이터분석 부트캠프] 친근한 엑셀로 실무 엑셀 데이터 분석 시작하기(2)
어제는 실시간 강의였다면 오늘은 온라인 강의를 수강하는 날이었다. 어제에 이어 엑셀과 데이터분석에 대한 강의를 듣는데, 온라인 강의의 학습범위가 실시간 강의와도 꽤 겹치고, 그렇지 않은 내용들도 있어서 속도를 조절하며 강의를 들었다. 온라인 강의를 듣기 전에는 이렇게 겹치는 부분이 있는 줄 몰랐어서 빡센 느낌이었는데 그 느낌이 많이 희석되었다가 또 막상 강의를 듣다보니 학습내용이 그렇다고 대단히 덜어진 것은 아니라 다시 쉴 새 없이 들었다. 오늘은 학습한 내용들 중 어제 수업과 안겹치는 내용 위주로 정리해 보았다. 1. EDA ⌘ 기초통계량 계산 합계(SUM) 평균(AVERAGE) 중앙값(MEDIAN) → 자료를 크기 순으로 나열했을 때 위치적으로 중앙에 있는 값 최빈값(MODE) → 값들의 freque..
2023.06.23