본문 바로가기

클래스 리뷰/23.03 프리온보딩 데이터 챌린지9

프리온보딩 후기 3월에 진행했는데, 7월에 글쓰기를 마무리 하는 것은 과연 나의 게으름 때문인 것인가... 하는 자기반성과 함께, 프리온보딩 후기를 써본다. - 프리온보딩에 맞게 신입으로 취업을 준비하는데 가이드라인을 잡아준다. - 무료로 진행된다. - 약 한달이라는 짧은 기간이지만, 생각보다 알차다는 생각이 들었다. - 간단한 실습도 준비되어 있어서 (잘 활용한다면) 포트폴리오에 하나의 프로젝트로 넣을 수 있다. - 과정을 잘 이수하고, 20곳 이상 이력서를 제출하면 1000만원이라는 상금을 나눠갖는 추가 이벤트가 있다.(이제는 하지 않는 것으로 보인다.) - 물론 난 잘 참여해서 작은 금액이지만 상금도 받았다. 훗 - 데이터 사이언티스트로 일하고 있지만, 아직도 모르는게 많고 공부해야할게 산더미같다. - 그 와중에 .. 2023. 7. 23.
데이터 분석가로 취업하기 23년 3월 13일 총 4회 교육 중 3번째 시간은 '데이터 분석가로 취업하기'를 주제로 진행되었다. 어떤걸 위주로 준비하면 좋을지, 취업준비를 할 때 팁 같은 것 들을 알려주었다. 여기에 더해서 내가 현업에서 겪은 내용들을 추가하여 작성했다. 1. 데이터 팀에서 분석가의 역할 - 제목과 같이 데이터를 이용하여 분석하고 새로운 인사이트를 도출하는 것이 데이터 분석가의 역할이다. - 분석에는 비즈니스 분석, 제품 분석, 서비스 분석 등이 있을 것이다. - 하지만 그 외에도 현업에서 필요로 하는 것들은, - 어느 부서든 데이터를 기반으로 논리적이고 합리적인 결정을 할 수 있도록, 전사적 데이터 기반 문화를 고민하는 것 - 더 좋은 분석을 위한 스터디를 진행하는 것 - 데이터 엔지니어와 협업하여 인프라를 개선.. 2023. 7. 21.
A/B 테스트 23년 3월 13일 총 4회 교육 중 3번째 시간은 A/B 테스트를 주제로 진행되었다. 내용은 현업에서 이걸 왜 쓰는지, 실험설계를 어떻게 해야하는지를 위주로 진행되었다. 여기에, 통계를 (간단하게) 공부한 경험이 있어서 살을 더 많이 붙여서 써볼까 한다. 1. A/B 테스트란? - 서비스 혹은 제품에서 변화가 있을 때, 실제로 소비자가 느끼기에 더 좋아진건지(매출이 늘어난다거나, 방문 횟수 혹은 체류시간이 길어짐) 확인하고자 할 경우에 사용한다. - 구체적으로는 신규기능 도입, UI 변화, 백엔드 변화 등이 있다. - 신규기능, UI는 소비자가 직접적으로 확인 가능한 부분이다. - 백엔드 변화로는 로딩시간이 빨라진다거나 끊김이 줄어드는, 서비스 만족도를 간접적으로 향상시킬 수 있다. 1) 가설 수립 -.. 2023. 7. 15.
프로덕트 개발 사이클, 그로스해킹, AARRR 23년 3월 9일 총 4회 교육 중 2번째 시간으로 아래 세가지 주제로 진행되었다. (목차는 프리온보딩 과정을 따라 작성하였으며, 세부 내용은 다른 자료들도 참고하여 살을 붙였다.) 1. 프로덕트 개발 사이클 2. 그로스해킹 3. AARRR 1. 프로덕트 개발 사이클 데이터 분석가 관점에서 작성되었다. 1) 기획 및 플래닝 - 유저 행동 분석 후 아이디어 제안(가설) - 임팩트 시뮬레이션: 기대효과 - 지표설정 (= Feature Engineering) ※ 지표설정 시 아래 사항을 유의해야 한다. 컨트롤 가능해야 하고, 고객 경험에 방해를 주면 안되며, 현재 상황 측정이 가능해야 하고, 미래에도 단기간에 측정 가능해야 한다. 2) 디자인 - 디자이너가 필요로하는 데이터 요청에 대해 친절하게 대응한다. 3.. 2023. 3. 30.
원티드 채용 데이터 EDA 시각화 후 조금 더 분석해보았다. 1. 데이터 크기 # 이 부분은 앞에서 사용한 그대로 가져온다. !pip install krwordrank import pandas as pd import matplotlib.pyplot as plt from krwordrank.word import KRWordRank import numpy as np df.info() 데이터 크기는 388개이다. 결측치는 없다. 사용할 수 있는 정보는, 주요업무, 지원자격, 우대사항, 연차 정보가 있다. 숫자데이터가 직관적으로 파악 및 구분하기 편하기 때문에 연차 정보부터 사용한다. 2. 최소 연차 # 최소연차인 annual_from 데이터를 살펴보면, plt.bar(df.annual_from.value_counts().index, d.. 2023. 3. 18.
코랩에서 Word Cloud 시각화 23년 3월 6일 총 4회 교육 중 1번째 시간으로 아래 세가지 주제로 진행되었다. 1. 빅쿼리 시작하기 2. 쿼리생성, 코랩 연동 3. Word Cloud 시각화 하나씩 정리해보자. 1. 패키지 설치 이전에 코랩(Colab)으로 데이터를 불러오는 것 까지 해봤다. 이제 코랩에서 패키지를 설치한다. !pip install krwordrank 라이브러리를 입력한다. import pandas as pd import matplotlib.pyplot as plt from krwordrank.word import KRWordRank import numpy as np 준비는 끝났다. 2. 전처리 시각화를 하기에 앞서, 데이터가 문제는 없는지 확인하고 처리하는 단계이다. 실습자료이기 때문에 확인과정은 생략하고 약간의.. 2023. 3. 17.
빅쿼리 쿼리 생성, 코랩 연동 23년 3월 6일 총 4회 교육 중 1번째 시간으로 아래 세가지 주제로 진행되었다. 1. 빅쿼리 시작하기 2. 쿼리생성, 코랩 연동 3. Word Cloud 시각화 하나씩 정리해보자. 1. 쿼리 생성 이제 샘플 프로젝트 하위에 테이블이 생성되어 있는 것을 확인할 수 있다. 테이블로 들어가면 스키마가 표시되어있다. 쿼리를 새 탭에서 열면 오른쪽 그림과 같이 나타난다. SELECT position_id , position , SPLIT(SPLIT(jd, '주요업무')[safe_offset(1)], '자격요건')[safe_offset(0)] AS responsibilities , SPLIT(SPLIT(SPLIT(jd, '주요업무')[safe_offset(1)], '자격요건')[safe_offset(1)], '.. 2023. 3. 12.
빅쿼리 시작하기 23년 3월 6일 총 4회 교육 중 1번째 시간으로 아래 세가지 주제로 진행되었다. 1. 빅쿼리 시작하기 2. 쿼리생성, 코랩 연동 3. Word Cloud 시각화 하나씩 정리해보자. 1. 빅쿼리 시작하기 빅쿼리(BigQuery)는 구글(Google)에서 제공하는 데이터 웨어하우스 서비스이다. 구글에서 제공하는 다른 서비스들과 연동이 편한 장점이 있다. 그래서 구글 코랩(Colab)으로 쉽게 데이터를 넘길 수 있다. 빅쿼리를 이용하기 위해선 구글아이디가 필요하다. 구글 아이디로 로그인하면 위와 같은 페이지가 뜬다. 무료로 체험하기 버튼을 누른다. 2. 계정 및 결제 정보 등록 대략 이런 순서로 진행된다. 결제 수단으로 카드를 등록하게 되는데, 자동 가입 방지를 위함이며, 자동 요금 청구는 아니라고 한다... 2023. 3. 11.
[원티드] 프리온보딩 데이터 챌린지 신청 채용 사이트인 원티드에서 데이터관련 교육을 진행하길래 신청했다. 실제 교육기간은 2주이며, 주 2회 진행된다. 교육비는 무료다. 커리큘럼은 아래와 같이 나와있다. 커리큘럼은 데이터분석 공고에 필수적으로 등장하는 A/B 테스트, AARRR, 코호트 분석 등의 내용으로 이루어져 있다. 개인적으로 빅쿼리를 써보고 싶었는데, 마침 커리큘럼에 포함되어 있다. 3월의 도전은 데이터분석으로 결정! 2023. 3. 10.
반응형