[mySql 프로젝트] Olist 데이터를 활용한 데이터 분석

2023. 8. 23. 12:49IT 라이프/패캠 데이터분석 부트캠프 9기

반응형

mySql 프로젝트가 끝났다.

 

분석에 사용한 데이터 셋

분석에 사용한 데이터는 캐글에 올라와 있는 브라질 이커머스 Olist사의 데이터이다.

원래는 CSV파일들인데, 강사님께서 변환해주셔서 워크벤치에서 바로 import해서 사용했다.

 

⌘ 분석 과정

브라질의 이커머스, Olist사의 비즈니스 모델 등 배경지식을 조사하는 시간을 가진 후 주어진 테이블들을 검증, EDA하여 이를 발표 및 공유하였다. 아무래도 이 과정에서 결측치 등을 확인하게 되면서 분석에 사용가능해 보이는 컬럼들과 아닌 것들을 판가름하게 된다.

이 과정에서 자연스레(그리고 일정상 EDA도 분석도 각각 하루만에 완료해야 하는 시간적 제약 때문에) 분석 주제가 몇 가지로 추려졌고, 팀 내에서 상의하여 방향을 정해 분석을 진행하였다.

 

데이터와 테이블 자체는 분석하기에 충분한 양이었으나 사실 유의미한 분석을 얻기까지는 상당히 많은 부분의 삽질이 있었다(데이터 분석이 다 그렇지만...) 정말 여러 각도로 테이블을 조인하고, 상관관계를 보거나 설명 가능한 패턴을 찾아 봤고, 그러기 위해서는 중간중간 꼭 정의를 하고 넘어가야 하는 부분들이 있었다. 그런 부분은 공유하고, 의견을 물으며, 모두에게 납득 가능한지를 판단하며 분석을 진행하였다.

 

⌘ 분석 주제 및 소주제

이렇게 하여 우리 팀에서는 최종으로 'Olist의 현재 배송 정책 개선을 통한 비즈니스 모델 고도화'를 주제로 분석 결과를 정리할 수 있었다.

Part1 '무료배송 정책 도입'에서는 마케팅팀에 제안한다고 가정하였고, 이러한 제안을 하게 된 데이터적 근거를 제시하였다. 배송비와 상관관계가 높았던 factor들을 살펴보고, 무료배송을 진행한 셀러들의 평균 매출금액의 변화를 확인, 무료배송 주문들의 평균 리뷰 스코어 등을 분석한 것을 근거로 제시하였다.

Part2 '매출 증대를 위한 셀러 영입 전략'은 셀러 영입을 담당하는 SDR팀에 제안한다고 가정하였고, 포인트는 이미 잘 운영되고 있는 지역이 아닌, 성장 가능성이 전략적으로 높은 지역을 여러 각도로 검증하여 뽑는 부분이었다. 성장 가능성은 인구 수는 많지만 셀러의 수는 적거나 없는 지역으로 정의하였다. 또한 이 기준으로 뽑은 대부분의 지역이 브라질의 북동부로 지리적으로 묶을 수 있어서 신기했다. 실제로 이 기준으로 셀러를 더 영입하는 것이 매출 증대에 도움이 되는지를 판단하는데 도움이 될 분석을 진행하였고, 같은 state 내의 주문이 많은 점, 워낙 브라질이 넓어서 배송기간과 배송비 이슈가 많은데(리뷰로도 확인가능) 판매자와 구매자의 거리와의 상관관계 확인 등을 통하여 이 물리적 거리를 좁히는 것이 리뷰 평점을 높이거나, 배송비를 낮추고 배송기간을 단축하는 방법으로 작용할 수 있음을 확인하였다.

자세한 내용은 아래 분석 결과 파일에 있다.

 

⌘ 분석 결과 파일

SQL 프로젝트 5조 1차 발표 .pptx
3.74MB
SQL 프로젝트 5조 2차 발표 .pptx
1.14MB
SQL 프로젝트 5조 3차 발표.pptx
3.51MB

⌘ 회고

 

 

728x90
반응형