본문 바로가기

클래스 리뷰/21.06 K-Digital Training AI 데이터 사이언티스트 과5

데이터베이스 이론 1. 데이터베이스 1-1. 데이터베이스란? 데이터를 저장하고 관리하는 곳, 방대한 데이터를 관리하는 일 데이터베이스 관리 시스템 : 다수의 사용자가 데이터베이스에 접근하고 데이터를 사용하는 시스템 데이터베이스 특징 : 1). 실시간 접근성 : 수 초 내에 결과를 보여주는 실시간 서비스 2). 계속적인 변화 : 데이터 값은 시간에 따라 바뀜 3). 동시 공유 : 여러 사용자에게 동시에 공유 4). 내용에 따른 참조 : 저장된 데이터는 물리적인 위치가 아니라 데이터 값에 따라 참조 됨 1-2. 데이터베이스 기본 기능 데이터 삽입, 삭제, 수정, 조회 가능 동시성 제어 : 일관성, 정합성에 오류가 없도록 제어해야 함. 영화관 좌석이 중복으로 결제되면 대혼란... 장애 대응 기능 : 데이터베이스는 데이터 손실이.. 2023. 3. 5.
웹크롤링 프로젝트 : CGV 리뷰 크롤링 1. 크롤링 과정 간단정리 1). 개발자 도구 - elements tap : 어떤 tag와 어떤 속성을 갖는지 표시 - network tap : - clear : log 지움 - preserve log : log 기록 - browser에서 server에 자료를 요청하고, 업로드되는 것을 볼 수 있음 - 이미지의 경우 개별적으로 업로드 됨 - 댓글의 경우도 API를 이용하여 개별적으로 업로드 됨 2). HTTP Mathod : HTML 문서 등의 리소스를 전송하는 프로토콜 - HTML(Hyper Text Markpu Language) : 웹사이트를 생성하기 위한 언어로 문서와 문서가 링크로 연결되어 있고, 태그를 사용하는 언어 - 리소스 요청 : 클라이언트 → 서버(Get, Post 등) - 리소스 응답 .. 2023. 3. 3.
Numpy, Pandas, Seaborn 1. Numpy(수치계산) 1-1. universal function numpy array는 vector처럼 사용할 수 있다. 대부분의 데이터 분석 라이브러리들이 벡터를 사용한다. 데이터 분석 시 데이터를 벡터로 표현하는데, 벡터가 numpy array로 표현되기 때문에 중요하다. broadcase : 서로 크기가 다른 numpy array를 연산할 때, 자동으로 연산을 전파(broadcase) 해주는 기능이다. universal function : 하나의 함수를 모든 원소에 자동으로 적용해주는 기능이다. 1-2. Masking indexing : list에서의 indexing과 동일한 방법이다. masking ex) data[ : , : ] 이런 식으로 data['raw 검색 조건', 'column 검.. 2023. 2. 22.
python 기초 문법 1. 프로그래밍? 1-1. Computer Architecture cpu(Instruction) ↔ ram(Program) ↔ ssd(Files) ssd의 데이터를 cpu에서 사용하려면, 중간다리 역할인 ram의 역할이 중요하다. 1-2. 프로그래밍 프로그래밍을 잘 하기 위해선 아래 항목을 만족해야 한다. -가독성(읽기 쉬운가) -확장성(오픈소스 라이브러리가 많은가) -생산성(개발속도가 빠른가) 1-3. Python 태생적으로 수치연산에 약하다. 실수형태의 계산이 반복되면 오류가 증가하게 된다. 때문에 수치연산 라이브러리인 numpy를 사용한다. 2. Data type Python은 변수에 값을 할당하는 코드를 실행할 때 데이터 타입이 결정된다.(Dynamic Type Binding) 데이터 타입에 따라.. 2023. 2. 21.
[K-Digital Training] 패스트캠퍼스 AI 기반 데이터 사이언티스트 과정 - 신청에서 합격까지 1. 서류접수(21.06.16) 2. 1차 서류 전형 합격(21.06.21) 나는 자동차 분야에서 2년간 일한 경력이 있다. 제조업계의 하락을 몸소 경험하고, IT업계의 상승 소식을 접했다. 미래를 고민했다. 그리고 IT 분야로 전직 계획을 세웠다. '데이터 분석, 머신러닝, 딥러닝'이 유망하다는 글을 본게 1년차 때였다. 그렇게 1년간 퇴근 후 독학을 하며, 2년 3개월을 채우고 나왔다. 이 이야기를 자기소개서에 솔직하게 담았다. 3. 2차 기초소양 테스트 합격(21.06.28) 직무지식을 평가하는 2차 테스트다. 테스트 전에 참고용으로 유튜브를 제공했다. 테스트 범위는 다음과 같다. 데이터 분석 기본 개요 Python 기초 문법 머신러닝 & 딥러닝 기본 개요 난이도가 어렵지는 않았다. 4. 3차 면접.. 2023. 1. 12.
반응형