페드로 도밍고스 지음/ 비즈니스북스
머신러닝에 대한 다양한 관점에서 시작한다.
저자의 궁극적인 의도는 하나의 마스터 알고리즘을 개발하기 위함이지만
그러기 위해서는 기존의 다양한 관점들을 살펴볼 필요가 있다.
파이썬, spark, 머하웃 등을 공부하며, 어쩌면 돌아온 이 길에서
쉬어가는 코너로... 좀더 넓은 안목으로 머신러닝에 대한 여러 관점을 볼 수 있었다. 수식없이...
어쩌면 수식없이, 그림도 거의 없이
글로만 머신러닝을 설명하고 있어서 답답한 부분도 있지만...
새롭게 알게된 것도 많이 있다.
일단 빠르게 1독을 목표로 읽었고, 다시 한번 읽어야 겠다^^;;
간단히 정리해본다
------------------------------------------------------------------------------------------------------------------------------------
5가지 관점. 그리고 선생님 없이...
저자는 위트가 넘친다. ^^;; 쉬운 설명과 적절한 번역이 돋보인다. 어쩜 철학책 같은 느낌도 난다.
1.기호
당신은 합리주의자인가, 경험주의자인가?
흄, 세상에 공짜는 없다.
머신러닝에서 가장 중요한 문제인 과적합(overfitting) 혹은 실제로 존재하지 않는 환각 유형과 만날 것이다. - 115p
우리가 전에 본 적이 없는 경우에도 일반화 하는 것이 머신러닝이 푸는 문제다. - 119p
규칙 모음
컴퓨터는 궁극적으로 특수 재능을 지닌 학습장애인이다. - 133p
좋은 머신러닝은 무지와 환각 사이에 난 좁은 길을 영원히 걸어야 한다. - 133p
데이터 마이닝이란 데이터가 자백할 때까지 고문하는 것을 의미한다고 말할 정도다. -135p
의사결정트리, 분할정복알고리즘
분류기
지수함수 - 조합확산
편중과 분산
오컴의 면도날
귀납법=역연역법
뺄셈은 덧셈의 역
적분은 미분의 역
덧셈-------> 정수 발견(음수 없이는 덧셈이 항상 역을 갖지 못하기 때문에)
곱셈-------> 유리수
제곱-------> 복소수
병목현상
2.연결
신경망, 퍼셉트론
역전파
기울기 하강
딥러닝
다층퍼셉트론
3.진화
유전알고리즘
4.베이즈
P(A|B) = P(A) * P(B|A) / P(B)
예제로 들었던,,, 자가 에이즈 확률 측정 샘플은 굉장히 신선했다.
사전확률, 사후확률
나이브 베이즈 분류기
MCMC 마르코프 연쇄 몬테카를로
5.유추
유사성
최근접 이웃 알고리즘 kNN
차원의 저주
가중치 kNN
SVM, 마진
6. 선생님 없이
비지도학습
k-means
군집화
EM 알고리즘
차원축소
PCA 자율학습, ex)칵테일 파티
강화학습
> 나중에 다시 1독하면서, 다시 정리해야징...