HeYStRanGeR
article thumbnail

 

(2022.03.25)

기계학습 들으면서 정리하기 1탄

Lecture1_ML 내용 정리


 

ML 기초 지식

 

인공지능, 머신러닝, 딥러닝의 관계

 

 

기존의 문제 해결 방법: 인간이 기계에게 하나하나 지시하는 것

 - 새로운 문제해결이 불가능

 

머신러닝: 문제를 해결하는 일반적인 방법을 가르쳐줌

 - 새로운 문제 해결이 가능

 - 단순 지시가 아님

 

데이터가 입력되고 패턴(규칙)이 분석되는 과정 --> 학습

 

파라미터를 변경하여 동작이 결정되는 프로그램 --> 모델

더 좋은 동작이 나오도록 파라미터를 변경하는 것 --> 학습

 

머신러닝은

1) 파라미터에 따라 동작하는 알고리즘을 선택하고,

2) 이 알고리즘에 데이터를 제공해서 알고리즘이 더 나은 동작을 하도록 파라미터를 수정하는 것

이라고 정리해볼 수 있음.

 

 

Tom Mitchell 

작업 T (task) : 컴퓨터 프로그램이 T에 속한 작업을 수행

성능 P (probability) :  경험 E에 따라 성능 P가 개선된다면,

경험 E (experience) : 프로그램은 T 와 P 에 대해 경험 E로부터 학습한다고 말할 수 있음.

 

 

 

 

머신러닝의 방법

 

지도학습(supervised learning

 - 컴퓨터는 인간(교사)에 의해 데이터와 label 을 제공받음. (label=정답의 역할)

 - 입력-출력 매핑하는 일반적 규칙 학습

 

비지도학습(unsupervised learning)

 - 외부에서 label이 주어지지않고, 학습 알고리즘이 스스로 입력으로부터 구조를 발견함.

 - 군집화: 주어진 데이터를 특정에 따라 둘 이상의 그룹으로 나누는 것

 

강화학습(reinforcement learning)

 - 대표적 예시로는 알파고

 - 학습 수행하고 행동하는 agent환경과 상호작용한 후, 보상에 따라 행동을 결정하는 policy를 바꾸는 방식

 - 강아지(agent)가 훈련(환경)과 상호작용하며, 간식(보상)을 통해 행동을 결정(policy)

 

준지도학습(semi-supervised learning)

 - 일부 데이터에만 label 부여 --> label이 아예 없는 것보단 학습의 정확도 높음

 - 일부 데이터의 label로 준지도학습 방식의 훈련을 수행한 뒤, label 없는 데이터(대다수)에 대해 학습 수행

 

weakly-supervised learning)

 - 데이터에 label 부여 but, noise 있음 (대충 label 부여한 것임)

 

데이터 수를 예로 들어 비교

 

 

 

머신러닝의 핵심 문제는 알고리즘데이터임. (+목표함수)

1) 데이터 관련 문제 --> 학습 데이터가 충분하지 않을 경우, 머신러닝은 좋은 성적을 낼 수 없음.

 - 데이터 편향: 너무 적은 수 or 표집 방법 wrong (골고루 추출하지 못함)

 - 부정확성: label이 잘못된 것(noise --> weakly-supervised learning)

 - 무관성: 데이터의 특성이 학습하려는 문제와는 다른 것(cat&dog 문제인데 tiger가 있는 경우)

 

728x90
profile

HeYStRanGeR

@HeYStRanGeR

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!