티스토리 뷰

[Machine Learning 이란]


머신러닝을 그대로 풀이해보면 기계학습입니다. AI(인공지능)의 근간이 되죠.

예전부터 우리는 생각하는 기계에 대해서 관심이 많았습니다. 그리고 기계가 인간을 점령(?)하는 영화도 많이 보셨을 겁니다.

"기계가 인간처럼 생각한다."

알파고가 이세돌과의 대국에서 승리한 순간에 이런 생각은 그리 이상한 생각이 아니었죠.


기계를 왜 학습시켜야 하는가?

이 질문은 인간이 "사고력"을 갖게 되는 과정을 그대로 가져왔다는 점에서 의미 있습니다.


우리가 기억하지 못할 만큼의 어린 시절을 기억해 봅시다(?)

네. 그냥 주변의 갓난 아기들을 생각해보죠.

갓난 아기들은 공원에 있는 네발로 걸어다니는 동물을 "개"라고 인식하지 못합니다.

하지만 충분히 학습된 아기들은 귀여운 손가락으로 그 동물을 가르키며 "개!!" 라고 말하죠.


그 아기는 충분한 경험과 학습을 통해 그 동물이 개라는 걸 알 수 있습니다.

집에서 부모가 다양한 개사진을 보여주며 개라고 학습을 시켰을 수도 있고, 바깥으로 산책을 나갔을 때 개를 볼 때마다 부모가 "저건 개야"라고 학습시켰을 수도 있죠.

이 아기는 시간이 지날수록 많은 개를 볼 것이고(경험) 개같이 생기지 않은 개(욕 아닙니다)도 개인지 고양이인지 판단할 수 있는 사고력을 갖게 됩니다.

그리고 20살이 지난 뒤에는 사람도 개가 될 수 있다는 걸 알게 되겠죠.


이게 인간의 학습과정입니다. 대부분의 학습에는 "경험"을 기반으로 합니다.

기계학습도 마찬가지입니다.

기계가 개사진을 보고 개라고 판단할 수 있는건 그만큼의 다양한 개를 봤기 때문입니다.


개소리가 길어졌습니다.


Machine Learning은 이러한 학습과정을 토대로 3가지 부류로 나뉩니다.

[그림1] Supervised(지도), Unsupervised(비지도), Reinforcement(강화) 학습으로 나뉘는 Machine Learning



지도학습은 답(머신러닝에서는 Label이라고 합니다.)이 주어진 상태에서 학습하는 방법입니다. 위의 예시처럼 개를 보고 개라고 알려주는 부모가 있는 셈이죠.

정답이 있기 때문에 기계가 얼마나 정확한지 측정할 수 있습니다.

이러한 학습이 사용되는 방법론은 Convolutional Neural Network와 Recurrent Neural Network가 있습니다. (몰라도 나중에 알게 됩니다.)

지도학습은 Regression(회귀) 와 Classification(분류)로 나뉩니다.

  • Regression(회귀) : 연속적인 데이터의 특징(feature)을 기반으로 값을 예측. 공부한 시간만큼 성적이 나오는 사람의 데이터가 있다고 치자. 1시간 공부하면 20점, 2시간 공부하면 40점이 나오는 사람이 3시간을 공부하면? 60점이 나온다고 예측할 수 있다.

  • Classification(분류) : 어떤 데이터를 특징(feature)에 따라 분류. 분류는 이진분류와 다중분류로 나눌 수 있다. 시험성적 데이터가 있을 때, 기준에 따른 시험 통과/낙제 로 나뉠 때는 이진분류, 기준에 따라 등급 A,B,C,D,F를 나눌 때는 다중분류로 생각하면 된다.



비지도학습은 답이 주어지지 않은 상태에서 학습하는 방법입니다. 주로 클러스터링 하는데 사용되는데 데이터의 특징(feature : 머신러닝에서 자주 사용되는 단어), 패턴등을 나눌 때 사용됩니다. 개와 새와 사람 사진들이 무작위로 퍼져 있을 때, 비슷한 특징들을 묶어서 클러스터링 해주죠. (답을 알지 못하지만 다리4개, 다리2개, 날개2개 와 같은 feature에 따라 클러스터링 합니다)



강화학습은 당근과 채찍을 주는 학습법입니다. "시행착오"를 통해 당근을 얻을 확률이 높은 방향으로 행동하고 채찍을 얻을 확률이 높은 방향으로는 움직이지 않죠. 대표적으로 알파고가 이 방법론을 통해 학습했습니다. 시행착오를 강화학습을 통해 반복적으로 경험합니다.










'Data Science > Machine Learning' 카테고리의 다른 글

Logistic Regression으로 당뇨병환자 예측  (0) 2018.11.14
Logistic Regression  (0) 2018.11.09
Multi-Variable Linear Regression  (0) 2018.11.07
Linear Regression  (0) 2018.11.03
Tensorflow(텐서플로우) 설치  (0) 2018.03.27
댓글
최근에 올라온 글
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
공지사항
최근에 달린 댓글