- 통계를 전문적으로 배우지 않은 상황에서, 데이터 분석 실무에서 통계를 사용할때 어려웠던 점은
1. 어떤 상황에서 어떤 방법을 써야하는가
- 각각의 방법들을 이론적으로 모두 이해하고 사용하기엔 그 양이 너무 많다.
- 하지만 실무에서 사용하려면 어떤 방법이 어떤 상황에서 사용 가능한지는 알야아 한다.
- 그래서 분석하고자 하는 상황과 데이터의 종류를 구분하여 사용 가능한 방법들을 찾으며 공부했다.
2. 적합하다고 선택한 방법을 코드로 구현할 때 어떤 라이브러리, 함수를 써야하는가
- 물론 파이썬 라이브러리가(scipy, statsmodels) 잘 만들어져 있기 때문에 가져다 쓰는건 어렵지 않다.
- 문제는 각 방법들이 개별 함수로 구현된 경우도 있고, 특정 함수에서 옵션값을 다르게 넣어서 구분하는 경우도 있다는 것이다.
- 정리할 때 각 방법에 맞게 사용 가능한 함수도 표시했다.(기본은 sicy이고, scipy에 없는건 statsmodels로 표시했다.)
- 가장 좋은 방법은 라이브러리 도큐먼트를 찾아보는게 정확하다.
참고 자료
1. https://docs.scipy.org/doc/scipy/index.html
댓글