본문 바로가기

클래스 리뷰62

프리온보딩 후기 3월에 진행했는데, 7월에 글쓰기를 마무리 하는 것은 과연 나의 게으름 때문인 것인가... 하는 자기반성과 함께, 프리온보딩 후기를 써본다. - 프리온보딩에 맞게 신입으로 취업을 준비하는데 가이드라인을 잡아준다. - 무료로 진행된다. - 약 한달이라는 짧은 기간이지만, 생각보다 알차다는 생각이 들었다. - 간단한 실습도 준비되어 있어서 (잘 활용한다면) 포트폴리오에 하나의 프로젝트로 넣을 수 있다. - 과정을 잘 이수하고, 20곳 이상 이력서를 제출하면 1000만원이라는 상금을 나눠갖는 추가 이벤트가 있다.(이제는 하지 않는 것으로 보인다.) - 물론 난 잘 참여해서 작은 금액이지만 상금도 받았다. 훗 - 데이터 사이언티스트로 일하고 있지만, 아직도 모르는게 많고 공부해야할게 산더미같다. - 그 와중에 .. 2023. 7. 23.
데이터 분석가로 취업하기 23년 3월 13일 총 4회 교육 중 3번째 시간은 '데이터 분석가로 취업하기'를 주제로 진행되었다. 어떤걸 위주로 준비하면 좋을지, 취업준비를 할 때 팁 같은 것 들을 알려주었다. 여기에 더해서 내가 현업에서 겪은 내용들을 추가하여 작성했다. 1. 데이터 팀에서 분석가의 역할 - 제목과 같이 데이터를 이용하여 분석하고 새로운 인사이트를 도출하는 것이 데이터 분석가의 역할이다. - 분석에는 비즈니스 분석, 제품 분석, 서비스 분석 등이 있을 것이다. - 하지만 그 외에도 현업에서 필요로 하는 것들은, - 어느 부서든 데이터를 기반으로 논리적이고 합리적인 결정을 할 수 있도록, 전사적 데이터 기반 문화를 고민하는 것 - 더 좋은 분석을 위한 스터디를 진행하는 것 - 데이터 엔지니어와 협업하여 인프라를 개선.. 2023. 7. 21.
A/B 테스트 23년 3월 13일 총 4회 교육 중 3번째 시간은 A/B 테스트를 주제로 진행되었다. 내용은 현업에서 이걸 왜 쓰는지, 실험설계를 어떻게 해야하는지를 위주로 진행되었다. 여기에, 통계를 (간단하게) 공부한 경험이 있어서 살을 더 많이 붙여서 써볼까 한다. 1. A/B 테스트란? - 서비스 혹은 제품에서 변화가 있을 때, 실제로 소비자가 느끼기에 더 좋아진건지(매출이 늘어난다거나, 방문 횟수 혹은 체류시간이 길어짐) 확인하고자 할 경우에 사용한다. - 구체적으로는 신규기능 도입, UI 변화, 백엔드 변화 등이 있다. - 신규기능, UI는 소비자가 직접적으로 확인 가능한 부분이다. - 백엔드 변화로는 로딩시간이 빨라진다거나 끊김이 줄어드는, 서비스 만족도를 간접적으로 향상시킬 수 있다. 1) 가설 수립 -.. 2023. 7. 15.
[패스트캠퍼스] 딥러닝 강의 - 회귀모델 실습 회귀모델 실습으로 캘리포니아 집값 예측 프로젝트를 하였다. https://scikit-learn.org/stable/datasets/real_world.html#california-housing-dataset 7.2. Real world datasets scikit-learn provides tools to load larger datasets, downloading them if necessary. They can be loaded using the following functions: The Olivetti faces dataset: This dataset contains a set of face... scikit-learn.org 1. 데이터 불러오기 - 데이터는 scikit-learn에서 제공하기.. 2023. 4. 9.
[패스트캠퍼스] 딥러닝 강의 - 분류모델 실습 분류모델 실습으로 캐글(Kaggle)의 타이타닉(Titanic ) 프로젝트를 하였다. 타이타닉 프로젝트는, 타이타닉 침몰 사건의 생존자를 잘 예측하는 알고리즘을 만드는 대회이다. 그래서 데이터에 타이타닉 사건 당시 실제 생존자와 사망자의 정보가 나와있다. 생존자를 예측한다는 것은 생존자, 사망자 둘 중 하나를 예측해야 하는 것이기 때문에 분류(Classification) 문제이다. 1. 데이터 불러오기 # 파일을 구글드라이브에 넣어놔서 구글드라이브를 연결 from google.colab import drive drive.mount('/content/drive') # 데이터를 불러오기 위해 pandas 사용 import pandas as pd # titanic data 불러오기 base_path = "/c.. 2023. 4. 1.
프로덕트 개발 사이클, 그로스해킹, AARRR 23년 3월 9일 총 4회 교육 중 2번째 시간으로 아래 세가지 주제로 진행되었다. (목차는 프리온보딩 과정을 따라 작성하였으며, 세부 내용은 다른 자료들도 참고하여 살을 붙였다.) 1. 프로덕트 개발 사이클 2. 그로스해킹 3. AARRR 1. 프로덕트 개발 사이클 데이터 분석가 관점에서 작성되었다. 1) 기획 및 플래닝 - 유저 행동 분석 후 아이디어 제안(가설) - 임팩트 시뮬레이션: 기대효과 - 지표설정 (= Feature Engineering) ※ 지표설정 시 아래 사항을 유의해야 한다. 컨트롤 가능해야 하고, 고객 경험에 방해를 주면 안되며, 현재 상황 측정이 가능해야 하고, 미래에도 단기간에 측정 가능해야 한다. 2) 디자인 - 디자이너가 필요로하는 데이터 요청에 대해 친절하게 대응한다. 3.. 2023. 3. 30.
원티드 채용 데이터 EDA 시각화 후 조금 더 분석해보았다. 1. 데이터 크기 # 이 부분은 앞에서 사용한 그대로 가져온다. !pip install krwordrank import pandas as pd import matplotlib.pyplot as plt from krwordrank.word import KRWordRank import numpy as np df.info() 데이터 크기는 388개이다. 결측치는 없다. 사용할 수 있는 정보는, 주요업무, 지원자격, 우대사항, 연차 정보가 있다. 숫자데이터가 직관적으로 파악 및 구분하기 편하기 때문에 연차 정보부터 사용한다. 2. 최소 연차 # 최소연차인 annual_from 데이터를 살펴보면, plt.bar(df.annual_from.value_counts().index, d.. 2023. 3. 18.
코랩에서 Word Cloud 시각화 23년 3월 6일 총 4회 교육 중 1번째 시간으로 아래 세가지 주제로 진행되었다. 1. 빅쿼리 시작하기 2. 쿼리생성, 코랩 연동 3. Word Cloud 시각화 하나씩 정리해보자. 1. 패키지 설치 이전에 코랩(Colab)으로 데이터를 불러오는 것 까지 해봤다. 이제 코랩에서 패키지를 설치한다. !pip install krwordrank 라이브러리를 입력한다. import pandas as pd import matplotlib.pyplot as plt from krwordrank.word import KRWordRank import numpy as np 준비는 끝났다. 2. 전처리 시각화를 하기에 앞서, 데이터가 문제는 없는지 확인하고 처리하는 단계이다. 실습자료이기 때문에 확인과정은 생략하고 약간의.. 2023. 3. 17.
빅쿼리 쿼리 생성, 코랩 연동 23년 3월 6일 총 4회 교육 중 1번째 시간으로 아래 세가지 주제로 진행되었다. 1. 빅쿼리 시작하기 2. 쿼리생성, 코랩 연동 3. Word Cloud 시각화 하나씩 정리해보자. 1. 쿼리 생성 이제 샘플 프로젝트 하위에 테이블이 생성되어 있는 것을 확인할 수 있다. 테이블로 들어가면 스키마가 표시되어있다. 쿼리를 새 탭에서 열면 오른쪽 그림과 같이 나타난다. SELECT position_id , position , SPLIT(SPLIT(jd, '주요업무')[safe_offset(1)], '자격요건')[safe_offset(0)] AS responsibilities , SPLIT(SPLIT(SPLIT(jd, '주요업무')[safe_offset(1)], '자격요건')[safe_offset(1)], '.. 2023. 3. 12.
빅쿼리 시작하기 23년 3월 6일 총 4회 교육 중 1번째 시간으로 아래 세가지 주제로 진행되었다. 1. 빅쿼리 시작하기 2. 쿼리생성, 코랩 연동 3. Word Cloud 시각화 하나씩 정리해보자. 1. 빅쿼리 시작하기 빅쿼리(BigQuery)는 구글(Google)에서 제공하는 데이터 웨어하우스 서비스이다. 구글에서 제공하는 다른 서비스들과 연동이 편한 장점이 있다. 그래서 구글 코랩(Colab)으로 쉽게 데이터를 넘길 수 있다. 빅쿼리를 이용하기 위해선 구글아이디가 필요하다. 구글 아이디로 로그인하면 위와 같은 페이지가 뜬다. 무료로 체험하기 버튼을 누른다. 2. 계정 및 결제 정보 등록 대략 이런 순서로 진행된다. 결제 수단으로 카드를 등록하게 되는데, 자동 가입 방지를 위함이며, 자동 요금 청구는 아니라고 한다... 2023. 3. 11.
반응형