본문 바로가기
Project/Artificial Intelligence

[Project] Raspberry Pi 3와 TensorFlow 그리고 Inception V3를 이용하여 거리에 따른 사람 인식 프로젝트 진행 상황..

by dohk325 2017. 10. 4.
반응형

                                                                                                                                                         

                                                                                                                                                                                                                   

                                                                                                                                                         

                                                                                                                                                                                                             

                                                                                                                                                                                                          

약 한 달 전에 KISTI에 계신 박사님 중 한 분으로부터 거리에 따른 사람 인식에 관련된 과제를 받아 진행한 적이 있다. 생각보다 쉬울 줄 알고 시작했지만, 생각보다 쉽지 않았다. 직접 만든 모델을 쓰는 대신에 Inception 모델을 그대로 가져다 썼다. 

먼저 라즈베리파이에 텐서플로우와 openCV등을 설치한 후, 라즈베리파이를 통해 찍은 이미지 데이터들을 바탕으로 아래의 예제대로 진행했다.

 

아래의 내용은 그동안의 결과물을 문서화하여 정리한 것이다.

 

 

예제

 

준비

파일과 동일한 폴더에 학습할 폴더 생성
$ mkdir dataset

 

학습한 결과를 저장할 폴더 생성
$ mkdir restoreOutput

 

학습에 필요한 라벨명으로 디렉토리 생성
$ cd dataset

$ mkdir critical

$ mkdir warning

$ mkdir normal

 

학습에 쓰일 이미지 데이터들을 각 폴더에 배치(jpg, png)



본 예제에서 제공하는 데이터셋의 개수는 다음과 같다.
critical: 337장
normal: 150장
warning: 188장
총 675장 

학습(Training) 시작
$ python3 retrain.py --image_dir=./dataset/image/ \
--output_graph=./restoreOutput/output_graph.pb \
--output_labels=./restoreOutput/output_labels.txt

 

training 과정 중에는 반복적으로 output이 발생하는데, 매번 training accuracy, validation accuracy 그리고 cross entropy를 출력하게 된다. 
training accuracy는 현재 학습에 사용된 이미지를 얼마나 올바른 class로 라벨링하였는지를 나타내는 비율을 말한다. validation accuracy는 training에 쓰인 batch set이 아닌 다른 set의 이미지들을 랜덤하게 가져온 뒤, 그 이미지들에 대한 정확도를 측정한 것을 의미하며, 오버피팅(overfitting) 여부를 알아내기 위하여 쓰인다. (즉 training accuracy는 오로지 학습한 이미지 자체에만 기반을 두고 있기 때문에 training data에 섞여있을 noise들에 대해서 과적합(overfit)하도록 학습했을 것이다. 그러나 모델의 진정한 성능 측정치는 모델이 학습한 데이터에 대해서가 아니라 모델이 학습하지 않은 데이터에 대해서 성능을 측정함으로써 얻을 수 있으며 이 값을 validation accuracy라고 한다.) training accuracy와 validation accuracy에 의한 오버피팅 여부 확인에 대해서는 ‘오버피팅’섹션에서 다룸

 

학습(Training) 결과

30분 정도의 학습이 끝나면 “restoreFolder"내에 .pb파일과 라벨링 정보가 들어있는 .txt 파일이 생성됨 


pb파일과 txt파일에 원하는 이름을 부여하려면

—output_graph=./restoreOoutput/NAME.pb \
—output_labels=./restoreOoutput/NAME.txt



원하는 이름을 부여할 경우, 테스트용 코드(realtime_caputure.py)에서도 수정 필요

Tensorboard 실행

텐서보드로 트레이닝 결과를 관찰하기 위해서는

tensorboard --logdir training_summaries & python3 retrain.py …

에 이어서

--summaries_dir=training_summaries/basic

입력 후 localhost:6006으로 접속



 
오버피팅(Overfitting) 확인


training accuracy가 validation accuracy보다 지속적으로 높게 나타난다면, 오버피팅되었음을 의미한다.



현재 데이터셋은 오버피팅되어 있다. 따라서 data augmentation이 필요하다.
(단, 테스트를 수행할 때마다 결과는 달라질 수 있다.)

Cross entropy는 loss function으로서, 학습 과정이 잘 수행중인지를 관찰할 수 있게 해주는 지표다. training을 수행한 이유가 바로 loss function인 Cross entropy를 줄이기 위한 것인데, 텐서보드를 통해 관찰한 loss function 그래프가 downwards한 경향을 보인다면, learning이 잘 되고 있으며 학습과정 중에 마주치는 왠만한 noise는 무시하고 있기 때문에 generalization되었다고 할 수 있다.

 

그 외

현재 기본적으로 iteration은 4000으로 설정되어 있기 때문에, 트레이닝 시간을 줄이기 위하여 다음의 명령어를 덧붙일 수 있음

--how_many_training_steps=500

 

각 스텝별로 training set으로부터 랜덤으로 10장의 이미지를 선택하여 학습을 한다. 이 때 back propagation 과정을 통해 final layer에 있는 가중치들을 업데이트한다. 즉 학습시에 예측한 결과 클래스와 ground truth 클래스를 비교하는 과정을 통해 final layer의 가중치 값을 더 적절하게 조정하게 된다. 

학습(Training) 결과

본 명령어를 돌린 후 가장 마지막의 결과로 출력되는 것은 training과 validation에 쓰인 data와는 별도로 분리된 데이터로 최종적으로 test를 수행한 test accuracy가 결과로 나온다. 이 결과값은 학습이 끝난 해당 모델이 낼 수 있는 가장 좋은 값이다. 보통 90%~95% 가량이 나온다. 





테스트(Testing) 준비

학습이 끝난 후 생성된 .pb파일과 .txt파일은 realtime_capture.py와 함께 라즈베리파이에 옮겨져야 함 


테스트(Testing) 시작

라즈베리파이상에서 다음의 명령어를 입력하여 카메라로 입력을 받은 결과로 테스트를 수행 

$ python3 realtime_capture.py



테스트(Testing) 결과

카메라 앞에서 최초의 움직임이 있을 경우, .pb파일과 .txt파일을 로드한 후,
촬영된 이미지에 대한 테스트 결과 출력 


 

 

Reference

https://github.com/samjabrahams/tensorflow-on-raspberry-pi 
https://codelabs.developers.google.com/codelabs/tensorflow-for-poets/?utm_campaign=chrome_series_machinelearning_063016&utm_source=gdev&utm_medium=yt-desc#4 
https://www.tensorflow.org/tutorials/image_retraining

반응형