'데이터' 태그의 글 목록

배열이란, 데이터 하나하나를 인덱스(index)에 대응시킨 데이터 구조다. 이 때, 배열에 저장되는 데이터들은 동일한 종류의 데이터들이 저장된다. 인덱스에 따라 데이터가 순차적으로 나열된다는 특징이 있으며, 인덱스를 이용해 곧바로 데이터에 접근할 수 있다. 순서가 중요한 데이터를 배열에 담는 것이 유용할 것이다. 순서가 중요한 데이터의 대표는 string이다. ‘computer’라는 단어를 배열에 저장한다고 할 때, c-o-m-p-u-t-e-r의 순서로 저장되는 것이 옳다. 이럴 경우 배열이 적합하다. 각각의 배열 요소에는 인덱스가 붙는데, c는 인덱스 0, o는 인덱스 1과 같은 식으로 인덱스가 부여된다. 파이썬에서는 list가 배열로서 기능한다. 파이썬의 list는 배열 자료구조 그 자체라고 보기는 ..

모델을 학습시킨다는 것은 단순히 말하자면 라벨이 있는 데이터로부터 올바른 가중치와 편향값을 학습(결정)하는 것이다. 지도 학습에서 머신러닝 알고리즘은 다양한 예를 검토하고 손실을 최소화 하는 모델을 찾아봄으로써 모델을 만들어내는데, 이 과정을 경험적 위험 최소화라고 한다. 손실은 잘못된 예측에 대한 벌점이다. 즉, 손실은 한 가지 예에서 모델의 예측이 얼마나 잘못되었는지를 나타내는 수다. 모델의 예측이 완벽하면 손실은 0이고 그렇지 않으면 손실은 그보다 커진다. 모델 학습의 목표는 모든 예에서 평균적으로 작은 손실을 갖는 가중치와 편향의 집합을 찾는 것이다. 예를 들어 그림 3에서 왼쪽은 손실이 큰 모델이고 오른쪽은 손실이 작은 모델이다. 그림에 관해 다음 사항을 참고한다. 빨간색 화살표는 손실을 나타낸..

잡음 제거와 비슷한 효과를 볼 수 있도록 하는 과정으로, 변형된 데이터들의 대표값들만 취해 성능을 높이는 과정이다.

정규화(Normalization)를 하면, 데이터들의 특성이 모두 비슷해지기 때문에, dropout을 할 필요가 없어진다고 한다.

티스토리툴바