본문 바로가기

데이터 분석4

데이터 특성에 따른 통계 분석 방법 - 통계를 전문적으로 배우지 않은 상황에서, 데이터 분석 실무에서 통계를 사용할때 어려웠던 점은 1. 어떤 상황에서 어떤 방법을 써야하는가 - 각각의 방법들을 이론적으로 모두 이해하고 사용하기엔 그 양이 너무 많다. - 하지만 실무에서 사용하려면 어떤 방법이 어떤 상황에서 사용 가능한지는 알야아 한다. - 그래서 분석하고자 하는 상황과 데이터의 종류를 구분하여 사용 가능한 방법들을 찾으며 공부했다. 2. 적합하다고 선택한 방법을 코드로 구현할 때 어떤 라이브러리, 함수를 써야하는가 - 물론 파이썬 라이브러리가(scipy, statsmodels) 잘 만들어져 있기 때문에 가져다 쓰는건 어렵지 않다. - 문제는 각 방법들이 개별 함수로 구현된 경우도 있고, 특정 함수에서 옵션값을 다르게 넣어서 구분하는 경우.. 2023. 12. 10.
정규화(Normalization), 일반화(Generalization), 표준화(Standardization) 정규화(Normalization), 일반화(Generalization), 표준화(Standardization)는 모두 데이터 분석에서 중요한 개념이며, 데이터를 처리하고 분석하는 방법에 따라 사용되는 용어입니다. 정규화(Normalization)는 데이터의 범위(=스케일(scale))를 조정하여 다른 데이터와 비교할 때 공정한 비교가 가능하도록 만드는 과정입니다. 일반적으로 데이터의 범위를 0~1 또는 -1~1로 조정합니다. 특정 변수의 값이 0과 1사이로 스케일이 조정되면 이를 0-1 정규화라고 합니다. 예를 들어, 나이 데이터를 0~1 범위로 정규화하면 20세인 데이터는 0.2, 30세인 데이터는 0.3 등으로 표시됩니다. 정규화는 데이터의 분포를 바꾸지는 않고, 단지 범위만 변경합니다. 이를 통해 .. 2023. 3. 29.
matplotlib으로 마커 커스텀, animation 만들기 1. plt marker custom plt(matplotlib.pyplot)를 이용하여 그래프를 그릴때 표시되는 점(marker)을 내가 원하는 아이콘으로 커스텀해서 사용하고자 한다. 1-1. 아이콘 선택 "window + . >" 키를 누르면 이모지가 나오는데, 스마일 아이콘을 가져왔다. 메모장에 아이콘을 표시하고 캡쳐 도구로 이미지(.PNG)를 만들었다. 1-2. .svg 포멧 svg란? 확대를 해도 깨지지 않는 벡터기반 그래픽이라고 한다.(자세한건 wiki에게 물어보는거로...) .svg 포멧이면 matplotlib에서 마커로 사용 가능하다. adobe 홈페이지에서 무료로 PNG파일을 svg 파일로 변환 가능하다.(참고자료 1) 1-3. 아이콘 불러오기 # 라이브러리를 가져온다. import pa.. 2023. 1. 4.
pandas로 논문 형식의 table 작성하기 1. Data 형태 - COLUMN은 0, 1로 구분되어 있다. - column은 one, two, three로 구분되어 있다. - 변수는 4가지가 있다.(Variable 1~4) - COLUMN, column을 이용하여 멀티컬럼(Multicolumn)을 만들고, 변수의 평균, 편차를 보고자 한다. 2. 평균 편차 계산 variables = ['var1', 'var2', 'var3', 'var4'] Table_mean = (Table.groupby(['COLUMN', 'column'])[variables].mean().T).round(2) Table_std = (Table.groupby(['COLUMN', 'column'])[variables].std().T).round(2) col_0 = Table_m.. 2023. 1. 2.
반응형