[DAY 10] Graph tools matplotlib 데이터 시각화(Data Visualization) 파이썬의 대표적인 시각화 도구 그래프 종류 다양한 graph 지원, pandas 연동 pyplot 객체를 사용하여 데이터를 표시 pyplot 객체에 그래프들을 쌓은 다음 flush pyplot: ...
[부스트캠프 AI Tech / Day10] Math_AI 통계학
[DAY 10] 통계학 모수 통계적 모델링: 적절한 가정 위에서 확률분포를 추정하는 것 기계학습과 통계학의 공통적 목표 유한한 개수의 데이터만 관찰해서 모집단의 분포를 정확하게 알아낸 다는 것은 불가능하므로 ➡ 근사적으로 확률분포를 추정 예측모형의 목적은 분포를 정확하게 맞추는 ...
[부스트캠프 AI Tech / Day9] Today
피어세션 정리 서폿 : numpy pandas Python 실습은 어떻게 진행하고 있는지? 중요하다고 생각되는 것만 따라치는 중 엠제이 : 몬테카를로) 균등분포에서 확률분포로 만들기 위해 구간을 2로 나누는 것은 왜 그런걸까? 균등분포에서 확률분포는 큰값 - 작은 값 기댓값을 ...
[부스트캠프 AI Tech / Day9] 파이썬 Pandas 2
[DAY 9] Pandas 2 Group by - Basic SQL grroupby 명령어와 같음 split ➡ apply ➡ combine 과정을 거쳐서 연산함 pivot table 한 개이상의 column을 묶을 수 있음 df.groupby(기준이 되는 팀)[적용받는 컬럼].(적용받는 연산) ...
[부스트캠프 AI Tech / Day9] Math_AI 확률론
[DAY 9] 확률론 딥러닝에서 확률론이 왜 필요한가? 딥러닝은 확률론 기반의 기계학습 이론에 바탕을 두고있음 기계학습에서 사용되는 손실함수(lossfunction)들의 작동원리는 데이터 공간을 통계적으로 해석해서 유도하게 됨 예측이 틀릴 위험(risk)을 최소화하도록 데이터를 학습하는 원리는 통계적 기계학습의 기본원리 회귀분석...
[부스트캠프 AI Tech / Day8] Today
피어세션 정리 엠제이 (펭귄님 해설 자료) 미분을 하면 뒤로 빠지는걸까? 데코레이터 @ / 행렬곱 @ 기호 차이 데코레이터는 함수위에 있음 여기 변수 사이에 쓰인 것은 행렬곱(dot)을 뜻함 펭귄 ...
[부스트캠프 AI Tech / Day8] 파이썬 Pandas
[DAY 8] Pandas Pandas 구조화된 데이터의 처리를 지원하는 Python 라이브러리 Python계의 엑셀 -panel data ➡ pandas 고성능 array 계산 라이브러리인 numpy와 통합하여, 강력한 “스프레드시트” 처리 기능을 제공 인덱싱, 연산용함수, 전처리함수 등을 제공함 데이터처리 및 통계분석...
[부스트캠프 AI Tech / Day8] Math_AI 딥러닝 학습방법 이해하기
[DAY 8] 딥러닝 학습 이전 강의: 데이터를 선형모델로 해석하는 방법 Easy Ver. Hard Ver. min식을 최소화 시키는 $\beta$ 찾기 현재강의: 신경망(Neural Network) ⬅ 비선형모델 신경망...
[부스트캠프 AI Tech / Day7] Today
피어세션 정리 질문 경사하강법, 그레디언트 벡터 구할 때,행렬의 인덱스 서로 바뀌어서 나옴? 직접해보기 minibatch / SGD np.inner / dot intercept / 상수항 추가 / Full Rank XX ? 기댓값 / 평균, 추정값의 기댓값 이야기(feat. 책) 프...
[부스트캠프 AI Tech / Day7] Math_AI 경사하강법(매운맛)
[DAY 7] Gradient Descent - Hard 선형회귀 복습 선형회귀: n개의 데이터로 이루어진 상황에서 데이터를 가장 잘 표현하는 모델을 찾는 것 무어-펜로즈: 정답에 근사한 값을 사용해서, 선형모델의 계수를 쉽게 찾을 수 있음 경사하강법 sklearn linear regression...