1. 패키지란?
python으로 데이터를 살펴보기 위해 패키지를 설치한다.
패키지는 복잡한 기능을 손쉽게 사용 가능하도록 사람들이 미리 만들어놓은 도구같은 것이다.
간단한 설치만으로 좋은 도구를 사용할 수 있다.
데이터 분석에 필요한 여러 기능을 담아놓은 pandas라는 패키지가 있다.
이걸 설치해서 사용해보려고 한다.
그 전에..
2. 가상환경 설정
그럼 pandas라는 패키지를 어디에 설치하느냐?
→ python 가상환경에 설치한다.
앞에서 python 설치했는데 가상환경은 또 뭐야?
→ 앱을 만들기 위해 프로젝트를 생성한 것을 기억 할 것이다.
시계 앱을 만들려면 'clock' 프로젝트를 만들고,
다이어리 앱을 만들려면 'diary' 프로젝트를 생성해서 각 앱을 관리 할 것이다.
→ 마찬가지로 시계 데이터 분석을 위한 python 환경을 따로 관리하고,
다이어리 데이터 분석을 위한 python 환경을 따로 관리해야 할 필요성에 의해서 가상환경을 사용한다.
1). VS code의 새 창(New Window)을 열고 Open 버튼을 눌러서 development의 movie_rec 폴더를 연다.
- (movie_rec 폴더 하위에 동일한 이름의 movie_rec(App project) 폴더랑 헷갈리지 않도록 한다.)
2). Panel 부분이 보이지 않는다면, 맨 아래 'No Problems' 부분을 클릭해서 Panel을 활성화 한다.
3). Panel에서 Terminal 탭으로 간 후 가상환경을 만든다. 코드는 아래와 같다.
python3 -m venv (가상환경 이름)
- 나는 가상환경 이름을 'movie_rec_venv'로 만들었다.
- 보통 '.venv' 혹은 'venv'로 만들기도 한다.
- 가상환경을 만들면 왼쪽 탭에 폴더로 생성 될 것이다.
3. 패키지 설치
4). 아래 코드로 방금 만든 가상환경을 활성화 시킨다.
source (가상환경 이름)/bin/activate
- 가상환경이 활성화 되면 분홍색 박스와 같이 가상환경 이름이 경로 왼쪽에 표시 될 것이다.
5). 활성화 된 가상환경에 'pandas' 패키지를 설치한다.
# pip3 install (패키지 이름)
pip3 install pandas
- 설치 과정이 쭉 나온 후 'Successfully installed ~'가 나오면 설치가 완료 된 것이다.
4. 패키지 설치 확인
- 패키지가 설치되었는지 확인하기 위해 jupyter notebook(.ipynb 파일)을 생성한다.
6). 'New Folder' 버튼을 클릭해서 폴더를 추가한다.
7). 폴더 이름은 'data'로 만든다.
8). 'New File' 버튼을 클릭해서 'data'폴더 안에 파일을 생성한다.
9). 파일 이름은 'movie_lens.ipynb'로 만든다.
10). 오른쪽의 'python environment'를 클릭하면 검색창이 활성화되면서, 선택 가능한 가상환경 목록이 뜬다.
11). pandas 패키지를 설치한 'movie_rec_venv' 환경을 선택한다.
- 앞에서 가상환경 활성화 했는데, 또 선택해야 돼? 라는 의문이 있을 수 있다.
- 여기서는 jupyter notebook이 사용하려는 가상환경을 선택하는 것이기 때문에 별도의 작업이라고 생각하면 된다.
12). jupyter notebook의 셀을 클릭한 후 pandas 패키지를 pd라는 이름으로 추가한다.
import pandas as pd
- 'Shift' + 'Enter' 키를 눌러서 셀을 실행시킨다.
13). 'ipykernel' 패키지가 필요하다는 경고 창이 뜬다. '설치' 버튼을 눌러서 해당 패키지를 설치한다.
- 이때, 위와 같은 방법으로 Terminal에서 패키지를 설치해도 된다.
pip3 install ipykernel
- 이 패키지는 설명과 같이, 가상환경을 이용하여 jupyter notebook의 셀을 실행시키기 위한 것이다.
- 다시 셀을 실행시켜 보면 초록색 체크표시와 함께 패키지가 잘 추가 된 것을 볼 수 있다.
'추천시스템 앱 개발 > 데이터' 카테고리의 다른 글
[데이터 분석] Movielens(무비렌즈) 데이터 분석 3 - 인기 영화 분석 (0) | 2025.03.16 |
---|---|
[데이터 분석] Movielens(무비렌즈) 데이터 분석 2 - 장르별 영화 분포 분석 (0) | 2025.03.15 |
[데이터 분석] Movielens(무비렌즈) 데이터 분석 1 - 평점 분포 분석 (2) | 2025.03.09 |
[데이터 분석] Movielens(무비렌즈) 데이터 소개 (0) | 2024.06.23 |
[데이터 분석] 환경설정 - python, jupyter notebook (0) | 2024.06.17 |
댓글