전체 글(165)
-
오늘의 삽질-맥북 m1에서 selenium, chrome webdriver 설치 및 실행
또 간만에 삽질 중이다. 남들은 다 되는데 왜 나만 안되는지 모르겠는 것들이 있다. 오늘도 왜 안되지 구글링하다가 헉 또 맥북 m1이라서 안되는거란 걸 보고 좌절했다. 근데 결국 유튜브에서 맥북(m1은 아녔지만)으로 selenium, 크롬 웹드라이버 설치와 실행 관련된 비디오를 찾았고 6개월 전이긴 하지만 그나마 m1 나온 이후고 상대적으로 최신이라 그걸 참고했다. 1) 크롬에서 내 버전 정보 확인 2) chrome webdriver download로 검색해서 해당 페이지에서 위의 내 크롬 버전과 가장 유사한 거로 다운로드 받기 3) cmd + shift + G로 /usr/local/bin을 열고 그 경로에 2)에서 다운로드 받아 압축 푼 chromedriver를 옮기기 4) 코드 작성 4번에서 다시 막..
2023.07.27 -
[데이터 분석 부트캠프] 데이터 분석가 필수 Tool SQL (1)
1. 키워드 익히기 ⌘ 데이터 타입 간 타입 변환 (내장함수 사용) 숫자 → 문자 : SELECT CAST(123 AS CHAR(5)); 문자 → 숫자 : SELECT CONVERT(’1004’, INT); 문자 → 날짜 : SELCET DATE_FORMAT(’20211225’, ’%Y-%m-%d’) ⌘ 테이블 생성 및 변경 데이터베이스 생성 : CREATE DATABASE [데이터베이스명]; 데이터베이스 목록 보기 : SHOW DATABASES; 이제부터 이 이름을 가진 DB를 사용하겠다 : USE [데이터베이스명]; 테이블 생성 : CREATE TABLE [테이블명] ( [컬럼명] [데이터 타입], [컬럼명] [데이터 타입], …); 테이블명 변경 : ALTER TABLE [테이블명] RENAME [..
2023.07.26 -
[데이터 분석 부트캠프] 데이터 분석을 위한 핵심 Tool Python(10)
앞서 이미 공부했던 내용과 겹쳐서 우선 오늘 내용 중 더 쉽게 개념을 접근할 수 있는 내용 위주로 정리했다. 1. numpy ⌘ numpy 배열 배열(array)은 요소의 갯수를 바꿀 수 없음 ndarray : N dimension array(다차원의 배열 자료구조) cf) 리스트는 1차원 다차원의 개념 배열 요소로 또 다른 배열을 가지는 배열을 말함 즉 2차원 배열은 배열 요소로 1차원 배열을 가지는 배열이며, 3차원 배열은 배열 요소로 2차원 배열을 가지는 배열이고, 4차원 배열은 배열 요소로 3차원 배열을 가지는 배열임 2차원 배열의 개념 이해 아파트 동, 호수랑 같음 예를 들어 101동(차원) 1층(row) 1,2,3,4호(column), 2층 1,2,3,4호가 있고, 각 호수에 사는 사람 수(v..
2023.07.13 -
[데이터 분석 부트캠프] 데이터 분석을 위한 핵심 Tool Python(9)
1. Pandas | 데이터 슬라이싱 ⌘ 행,열 선택하기 행 선택하기 행 하나 가져오기 : df[ ’행 시작 인덱스’ : ’행 시작 인덱스 + 1’ ] 행 여러개 가져오기 : df[ ’행 시작 인덱스’ : ‘행 끝 인덱스’ ] 열 선택하기 열 하나 가져오기 : df[ ’컬럼명’ ] 열 여러개 가져오기 : df[[ ’컬럼명1’, ‘컬럼명2’, … ]] 범위 설정으로 열 여러개 가져오기 : df[df.columns[ 시작인덱스 : 끝인덱스 ]] ⌘ loc, iloc으로 조회 loc 행과 열의 데이터 조회시 ‘특정 레이블(label)을 통해 접근하는 방법 label == 행의 왼쪽에 있는 index(숫자일 수도, 문자일 수도 있음) iloc 행,열 데이터 조회시 ‘숫자 인덱스’(integer index)를 통..
2023.07.12 -
[데이터 분석 부트캠프] 데이터 분석을 위한 핵심 Tool Python(8)
1. 람다 표현식 ⌘ 람다 표현식 이해 함수를 간편하게 작성할 수 있어서 다른 함수의 인수로 넣을 때 주로 사용함 따라서 보기 너무 복잡해지면 람다함수는 지양하고, def로 함수를 만들어서 사용하길 권장 람다 표현식은 lambda에 매개변수를 지정하고 콜론 뒤에 return value(반환값)로 사용할 식을 지정 # 람다식 자체를 실행해보면 함수 객체가 나오는데, 이 상태로는 함수를 호출할 수 없음 # 아! lambda 뒤에 오는게 매개변수였구나. 함수 정의할 때 첫줄에 들어가는 그거.(메인식에서 함수 호출할 때 넣는 인자가 아니라) print(lambda x: x + 10) # # 헷갈린다. 변수로 받았지만 그걸 함수로 사용하니까. plus_ten = lambda x: x+10 print(plus_te..
2023.07.11 -
[데이터 분석 부트캠프] 데이터 분석을 위한 핵심 Tool Python(7)
1. 리스트 ⌘ 요소 추가 append() : 리스트 끝에 요소 추가 extend() : 리스트 끝에 리스트를 item으로 추가 insert(index, item) : 특정 인덱스를 지정하여 요소 추가(지정한 위치에 있는 item부터 뒤로 밀어냄) ⌘ 요소 삭제 pop() : 마지막 요소를 뽑아내는게 default지만 index를 넣으면 해당 위치의 값을 뽑아냄 remove() del list_name[:] : index 지정하여 요소 삭제 clear() ⌘ 할당과 복사 할당 : 변수를 할당하듯 쓰면 copy가 아니라 참조가 됨 복사: list_name.copy(), dict_name.copy() ⌘ list comprehension 기본 문법: [출력값 for item in list] if가 추가된 경..
2023.07.10