딥러닝4 강화학습(Reinforcement Learning) 정리노트-DQN 본 자료는 김성훈 교수님의 모두를 위한 강화학습을 기반으로 작성되었습니다. 별도의 목차가 없습니다. 한 호흡에 읽어야 해서 부담스러울수도 있습니다. Agent는 자신이 할 수 있는 여러 Action들 중 하나의 Action을 선택하고, 그 선택을 Environment에게 넘긴다. Agent로부터 Action을 넘겨받은 Environment는 그 Action에 대하여 두 가지 결과물을 내는데, 일단, Action의 결과인, 어떤 상황으로 변했는지에 해당하는 state 정보를 넘긴다. 그리고, 넘겨받은 Action을 평가한 점수인 reward를 넘긴다. Environment는 openAI gym에서 제공하는 Environment을 사용하게 되는데, environment는 우리가 직접 만들 수도 있다. ope.. 2019. 8. 28. 인공지능, 머신러닝, 딥러닝 용어 비교 ‘인공지능’이라는 용어를 처음 만들어낸 사람은 스탠퍼드대학교의 컴퓨터 과학자 존 매카시다. 1956년 관련 학회에서 인공지능을 “지능적인 기계(지능을 가진 기계), 특히 지능적인 컴퓨터 프로그램을 만드는 과학 기술”로 정의했다. 그럼 지능이란 뭘까. 객체의 특징을 이해하고 이를 기반으로 객체를 인식하거나 인간의 추론과 유사한 판단을 해낼 수 있는 능력. 즉 인공지능은 인간의 사고를 똑같이 구현하는 것을 폭넓게 지칭한다. 머신러닝이란 인공지능의 일부분. 대량의 데이터(판단의 근거, 지능의 원천)를 처리하고 학습할 수 있는 알고리즘을 구현함으로써 미리 프로그램되지 않은 부분에 대해서도 예측과 결정(곧 판단)을 내릴 수 있게 하는 인공지능 구현 방식이다. (판단을 내릴 수 있는 능력이 곧 지능) 즉 기존의 예.. 2018. 12. 23. 머신러닝과 딥러닝의 주요한 차이 머신러닝과 딥러닝의 주요한 차이는 도메인 knowledge의 필요 유무다. 머신러닝의 경우엔 도메인 지식이 필요한데, 이는 feature를 사람이 직접 설정해주어야 하기 때문이다. 2018. 12. 23. 라즈베리파이 카메라-사람 간 거리 인식 프로젝트 정리 환경 Raspberry Pi 3 OS: Raspbian 8.0 (“Jessie”) Python version : 3.4.2 TensorFlow version : 1.1.0 openCV : 3.2.0 설치과정 $ sudo su - $ apt-get update $ apt-get install python3-matplotlib $ apt-get install python3-scipy $ apt-get install python3-numpy $ pip3 install --upgrade pip $ reboot Installing TensorFlow $ sudo apt-get install python3-pip python3-dev $ wget https://github.com/samjabrahams/tensor.. 2018. 12. 17. 이전 1 다음