time series data를 predict하는 모델을 만들 때, xgboost가 적합하지 않은 이유
xgboost는 기본적으로 tree-based 모델이다. tree-based 모델들이 가진 단점은 training dataset에서 발견된 값 중 최대값 이상의 값(또는 최소값 이하의 값)을 extrapolate(추론)/predict(예측)할 수 없다는 점이다. 구글 검색 결과, 해결책으로 제시되는 방법은, 먼저 trend를 remove하거나(즉 detrend화 하거나), series를 stationary하도록 만든 다음 xgboost를 활용해야 한다. xgboost 외에 고려할만한 머신러닝 모델은 무엇이 있을까? 김영송, 양성민, 조서형, 최재혁, "시계열 데이터 분류를 위한 기계 학습 모델 설계 및 성능 비교, “ 2017년 한국통신학회 하계종합학술발표회에 따르면, 시계열 데이터의 처리 및 예측을 위..
2018. 12. 23.