본문 바로가기

pandas4

[데이터 분석] Movielens(무비렌즈) 데이터 분석 3 - 인기 영화 분석 1-3. 인기 영화 분석1-3-1. 가장 많이 평가한 영화사람들이 어떤 장르의 영화를 주로 찾는지 궁금하다.이때 사람들이 가장 많이 평가한 영화를 보면 힌트를 얻을 수 있을 것 같다.# 가장 많이 평가된 영화 (평점 수 기준)movie_rating_counts = ratings['movieId'].value_counts().reset_index()movie_rating_counts.columns = ['movieId', 'rating_count']popular_movies = movie_rating_counts.merge(movies, on='movieId')top_rated_movies = popular_movies.sort_values('rating_count', ascending=False).hea.. 2025. 3. 16.
[데이터 분석] Movielens(무비렌즈) 데이터 분석 2 - 장르별 영화 분포 분석 1-2. 장르별 영화 분포 분석1-2-1. 장르별 영화 수movie 데이터프레임movie 데이터프레임에서 각 영화는 위 이미지와 같이 여러 장르를 가지기도 한다.그리고 '|' 로 구분되기 때문에, 이 구분자를 이용하여 각 장르를 분리할 수 있다# 장르 분리 및 집계def extract_genres(movies_df): all_genres = [] for genres in movies_df['genres']: all_genres.extend(genres.split('|')) return all_genresall_genres = extract_genres(movies)genre_counts = Counter(all_genres)# 장르별 비율 계산total_genre_mentio.. 2025. 3. 15.
[데이터 분석] Movielens(무비렌즈) 데이터 분석 1 - 평점 분포 분석 1. 데이터 분석 1데이터 분석 1(첫번째)로, 데이터 안에 어떤 특징들이 있는지 파악하기 위해 기본적인 데이터 분석을 해보고자 한다.Movielens 데이터는 영화 별점 데이터로, 당연하게도 "영화, 유저(유저 활동), 점수"가 중요한 데이터이다.각각에 대해 자세히 살펴보자.1-0. 데이터 분석 준비 [데이터 분석] 환경설정 - 패키지 설치, 가상환경 설정1. 패키지란?python으로 데이터를 살펴보기 위해 패키지를 설치한다.패키지는 복잡한 기능을 손쉽게 사용 가능하도록 사람들이 미리 만들어놓은 도구같은 것이다.간단한 설치만으로 좋은 도구를work-master.tistory.com패키지 준비앞서 가상환경을 활성화하고, 패키지 설치 방법을 알아보았다.데이터 분석에는 분석을 위한 패키지, 시각화를 위한 패.. 2025. 3. 9.
pandas로 논문 형식의 table 작성하기 1. Data 형태 - COLUMN은 0, 1로 구분되어 있다. - column은 one, two, three로 구분되어 있다. - 변수는 4가지가 있다.(Variable 1~4) - COLUMN, column을 이용하여 멀티컬럼(Multicolumn)을 만들고, 변수의 평균, 편차를 보고자 한다. 2. 평균 편차 계산 variables = ['var1', 'var2', 'var3', 'var4'] Table_mean = (Table.groupby(['COLUMN', 'column'])[variables].mean().T).round(2) Table_std = (Table.groupby(['COLUMN', 'column'])[variables].std().T).round(2) col_0 = Table_m.. 2023. 1. 2.
반응형