데이터분석7 [데이터 분석] Movielens(무비렌즈) 데이터 분석 3 - 인기 영화 분석 1-3. 인기 영화 분석1-3-1. 가장 많이 평가한 영화사람들이 어떤 장르의 영화를 주로 찾는지 궁금하다.이때 사람들이 가장 많이 평가한 영화를 보면 힌트를 얻을 수 있을 것 같다.# 가장 많이 평가된 영화 (평점 수 기준)movie_rating_counts = ratings['movieId'].value_counts().reset_index()movie_rating_counts.columns = ['movieId', 'rating_count']popular_movies = movie_rating_counts.merge(movies, on='movieId')top_rated_movies = popular_movies.sort_values('rating_count', ascending=False).hea.. 2025. 3. 16. [데이터 분석] Movielens(무비렌즈) 데이터 분석 2 - 장르별 영화 분포 분석 1-2. 장르별 영화 분포 분석1-2-1. 장르별 영화 수movie 데이터프레임movie 데이터프레임에서 각 영화는 위 이미지와 같이 여러 장르를 가지기도 한다.그리고 '|' 로 구분되기 때문에, 이 구분자를 이용하여 각 장르를 분리할 수 있다# 장르 분리 및 집계def extract_genres(movies_df): all_genres = [] for genres in movies_df['genres']: all_genres.extend(genres.split('|')) return all_genresall_genres = extract_genres(movies)genre_counts = Counter(all_genres)# 장르별 비율 계산total_genre_mentio.. 2025. 3. 15. [데이터 분석] Movielens(무비렌즈) 데이터 분석 1 - 평점 분포 분석 1. 데이터 분석 1데이터 분석 1(첫번째)로, 데이터 안에 어떤 특징들이 있는지 파악하기 위해 기본적인 데이터 분석을 해보고자 한다.Movielens 데이터는 영화 별점 데이터로, 당연하게도 "영화, 유저(유저 활동), 점수"가 중요한 데이터이다.각각에 대해 자세히 살펴보자.1-0. 데이터 분석 준비 [데이터 분석] 환경설정 - 패키지 설치, 가상환경 설정1. 패키지란?python으로 데이터를 살펴보기 위해 패키지를 설치한다.패키지는 복잡한 기능을 손쉽게 사용 가능하도록 사람들이 미리 만들어놓은 도구같은 것이다.간단한 설치만으로 좋은 도구를work-master.tistory.com패키지 준비앞서 가상환경을 활성화하고, 패키지 설치 방법을 알아보았다.데이터 분석에는 분석을 위한 패키지, 시각화를 위한 패.. 2025. 3. 9. [데이터 분석] Movielens(무비렌즈) 데이터 소개 1. MovieLens 데이터앱으로 제공할 서비스는 '영화 추천'이다.그리고 여기에 사용할 데이터는 MoveLens(무비렌즈)라는 공개 데이터이다.(README.html 파일을 보면 라이센스 설명이 있으며, 상업적으로는 안되고 연구목적으로는 사용 가능하다고 한다.)링크에 접속해서 ml-latest-samll.zip 파일을 다운로드한다.2. 데이터 살펴보기[Flutter/플러터] 새 프로젝트 만들기 포스트에서 movie_rec 프로젝트를 만들었다. [Flutter/플러터] 새 프로젝트 만들기새 프로젝트 만들기처음 flutter를 설치하며, flutter_application_1 앱을 만들었었다.이번엔 기획했던 것과 같이 '영화 추천' 앱을 만들기 위한 새로운 프로젝트를 생성하려고 한다.1). 'Shift'.. 2024. 6. 23. [데이터 분석] 환경설정 - python, jupyter notebook 1. 데이터 분석 환경설정앱으로 데이터를 하나씩 수집하며 서비스를 만들어 나갈 수도 있다.하지만, 일반적으로 사용자가 모이려면 기본 기능이 필요하다.그리고 이 기본 기능을 위한 기본 데이터도 필요하다. 앞서 기획한 '영화 추천 앱'을 만들려면 영화에 대한 데이터가 기본이자 필수 데이터가 되는 것이다. 또한, 데이터를 면밀히 관찰하기 위한 사전작업이 필요하다. flutter도 설치하고, dart 언어도 보고왔는데 또 뭐가 있다고?그렇다.. 그동안 너무 당연하게 사용하고 있어서 깜빡할 뻔 했지만,뒤에 나올 추천시스템을 만들기 위해서라도 꼭 필요한 작업이다. 데이터를 잘 사용하기 위해선 데이터를 이해해야 한다.그리고 이번에 다룰 python과 jupyter notebook이 데이터를 이해하기 위해 필요한 것들.. 2024. 6. 17. 데이터 특성에 따른 통계 분석 방법 - 통계를 전문적으로 배우지 않은 상황에서, 데이터 분석 실무에서 통계를 사용할때 어려웠던 점은 1. 어떤 상황에서 어떤 방법을 써야하는가 - 각각의 방법들을 이론적으로 모두 이해하고 사용하기엔 그 양이 너무 많다. - 하지만 실무에서 사용하려면 어떤 방법이 어떤 상황에서 사용 가능한지는 알야아 한다. - 그래서 분석하고자 하는 상황과 데이터의 종류를 구분하여 사용 가능한 방법들을 찾으며 공부했다. 2. 적합하다고 선택한 방법을 코드로 구현할 때 어떤 라이브러리, 함수를 써야하는가 - 물론 파이썬 라이브러리가(scipy, statsmodels) 잘 만들어져 있기 때문에 가져다 쓰는건 어렵지 않다. - 문제는 각 방법들이 개별 함수로 구현된 경우도 있고, 특정 함수에서 옵션값을 다르게 넣어서 구분하는 경우.. 2023. 12. 10. 데이터 분석가로 취업하기 23년 3월 13일 총 4회 교육 중 3번째 시간은 '데이터 분석가로 취업하기'를 주제로 진행되었다. 어떤걸 위주로 준비하면 좋을지, 취업준비를 할 때 팁 같은 것 들을 알려주었다. 여기에 더해서 내가 현업에서 겪은 내용들을 추가하여 작성했다. 1. 데이터 팀에서 분석가의 역할 - 제목과 같이 데이터를 이용하여 분석하고 새로운 인사이트를 도출하는 것이 데이터 분석가의 역할이다. - 분석에는 비즈니스 분석, 제품 분석, 서비스 분석 등이 있을 것이다. - 하지만 그 외에도 현업에서 필요로 하는 것들은, - 어느 부서든 데이터를 기반으로 논리적이고 합리적인 결정을 할 수 있도록, 전사적 데이터 기반 문화를 고민하는 것 - 더 좋은 분석을 위한 스터디를 진행하는 것 - 데이터 엔지니어와 협업하여 인프라를 개선.. 2023. 7. 21. 이전 1 다음 반응형