본문 바로가기

카테고리 없음

Mathematics for Machine Learning: Linear Algebr 1주차

1.  solving linear equation 

 

머신러닝에서 쓰이는 모델들에 적합한 그래프를 찾기위해 

실제 정답 모델과, 예측한 그래프 간의 차이를 나타낸 그래프를

"residual" 그래프라고 한다. 

"residual" 이 최대한 없도록 평균과, 표준편차를 조절해 가장 정답 데이터에 근접한 분포를 찾아야 한다. 

 

내가 푼 예제에서는 normal distribution 예시만 나왔지만, possion uniform 

등 다른 분포에 대해서도 "residual" 개념을 적용해 정답 모델에 

가장 가까운 분포를 구할 수 있을 것 같다.

그러한 분포에는 뭐, 키에 따른 몸무게 분포 이런 예시가 있을 수 있다. 

 

수학적으로 새롭게 아는 내용은 없는듯

 

 

--오답 정리--

Exploring parameter space

1. 

특정 데이터 분석을 통해 얻은 통계자료가 전체 데이터 (사람) 에 대해서도 적용 할 수 있을 거라는 

"성급한 일반화의 오류" 를 범한 예시라고 할 수 있다. 

이 데이터에서 160 이하의 키를 가진 사람이 없는 것 맞지만, 우리가 수집한 데이터가, 전체 사람에 대한 것이 아니기 때문에 항상 수집한 데이터가, 어떤 방법으로 어떤 표본 ( 지역, 나이, 개수) 을 얻은것인지를 명확하게 인지해야 

오류를 범하지 않고, 유의미한 데이터로써의 가치를 지닌다고 생각한다. 

2. vector