본문 바로가기
Artificial Intelligence/Machine Learning

머신러닝 알고리즘 cheet sheet

by dohk325 2018. 12. 23.
반응형

                                                                                                                                                         

                                                                                                                                                                                                                   

                                                                                                                                                         

                                                                                                                                                                                                              

                                                                                                                                                                                                              

몇몇 데이터 과학자들은 “최고의 알고리즘을 찾는 단 하나의 확실한 방법은 모든 알고리즘을 시도해보는 것”이라고 말한다.
 
알고리즘을 선택할 때에는 언제나 정확성, 학습 시간, 사용 편의성을 고려해야 한다. 많은 경우 정확성을 최우선으로 둔다. 반면 초급자는 가장 잘 알고 있는 알고리즘에 초점을 맞추는 경향이 있다.
 
데이터 세트가 제공됐을 때 가장 먼저 고려해야 할 것은 ‘어떤 결과가 나올 것인지에 상관없이 어떻게 결과를 얻을 것인가’이다. 초급자일수록 실행하기 쉽고 결과를 빨리 얻을 수 있는 알고리즘을 선택하기 쉽다. 프로세스의 첫 단계에서는 괜찮을 수 있겠지만 일부 결과를 얻었고 데이터에 익숙해진 후라면 정교한 알고리즘을 사용하는 데 시간을 더 많이 할애해야 한다. 그래야만 데이터를 더욱 잘 이해하고, 결과를 개선시킬 수 있다.
 

치트 시트 사용 방법
 
 
우선 차트에 나오는 경로(path)와 알고리즘 레이블(label)을 다음과 같이 읽는다.
 
If <path label> then use <algorithm>
 
(만약 <경로 레이블>이면 <알고리즘>을 사용한다)
 
예를 들어보자.
 
If you want to perform dimension reduction then use principal component analysis.
 
(차원 축소를 수행하고 싶으면 주성분 분석을 사용한다.)
 
If you need a numeric prediction quickly, use decision trees or logistic regression.
 
(신속한 수치 예측이 필요하면 의사결정 트리 또는 로지스틱 회귀를 사용한다.)
 
If you need a hierarchical result, use hierarchical clustering.
 
(계층적 결과가 필요하면 계층적 클러스터링을 사용한다.)
 
 
한 개 이상의 줄기(branch)가 적용될 때도 있고, 또 때로는 하나도 완벽하게 들어맞지 않을 것이다. 이 경로들은 통상적인 경험에 비춘 권고 사항이며, 일부는 정확하지 않다
반응형