(2022.03.25)
기계학습 들으면서 정리하기 1탄
Lecture1_ML 내용 정리
ML 기초 지식
기존의 문제 해결 방법: 인간이 기계에게 하나하나 지시하는 것
- 새로운 문제해결이 불가능
머신러닝: 문제를 해결하는 일반적인 방법을 가르쳐줌
- 새로운 문제 해결이 가능
- 단순 지시가 아님
데이터가 입력되고 패턴(규칙)이 분석되는 과정 --> 학습
파라미터를 변경하여 동작이 결정되는 프로그램 --> 모델
더 좋은 동작이 나오도록 파라미터를 변경하는 것 --> 학습
머신러닝은
1) 파라미터에 따라 동작하는 알고리즘을 선택하고,
2) 이 알고리즘에 데이터를 제공해서 알고리즘이 더 나은 동작을 하도록 파라미터를 수정하는 것
이라고 정리해볼 수 있음.
Tom Mitchell
작업 T (task) : 컴퓨터 프로그램이 T에 속한 작업을 수행
성능 P (probability) : 경험 E에 따라 성능 P가 개선된다면,
경험 E (experience) : 프로그램은 T 와 P 에 대해 경험 E로부터 학습한다고 말할 수 있음.
머신러닝의 방법
지도학습(supervised learning
- 컴퓨터는 인간(교사)에 의해 데이터와 label 을 제공받음. (label=정답의 역할)
- 입력-출력 매핑하는 일반적 규칙 학습
비지도학습(unsupervised learning)
- 외부에서 label이 주어지지않고, 학습 알고리즘이 스스로 입력으로부터 구조를 발견함.
- 군집화: 주어진 데이터를 특정에 따라 둘 이상의 그룹으로 나누는 것
강화학습(reinforcement learning)
- 대표적 예시로는 알파고
- 학습 수행하고 행동하는 agent가 환경과 상호작용한 후, 보상에 따라 행동을 결정하는 policy를 바꾸는 방식
- 강아지(agent)가 훈련(환경)과 상호작용하며, 간식(보상)을 통해 행동을 결정(policy)
준지도학습(semi-supervised learning)
- 일부 데이터에만 label 부여 --> label이 아예 없는 것보단 학습의 정확도 높음
- 일부 데이터의 label로 준지도학습 방식의 훈련을 수행한 뒤, label 없는 데이터(대다수)에 대해 학습 수행
weakly-supervised learning)
- 데이터에 label 부여 but, noise 있음 (대충 label 부여한 것임)
머신러닝의 핵심 문제는 알고리즘과 데이터임. (+목표함수)
1) 데이터 관련 문제 --> 학습 데이터가 충분하지 않을 경우, 머신러닝은 좋은 성적을 낼 수 없음.
- 데이터 편향: 너무 적은 수 or 표집 방법 wrong (골고루 추출하지 못함)
- 부정확성: label이 잘못된 것(noise --> weakly-supervised learning)
- 무관성: 데이터의 특성이 학습하려는 문제와는 다른 것(cat&dog 문제인데 tiger가 있는 경우)
'Computer Science > Machine Learning' 카테고리의 다른 글
[ML] Numpy 활용 (0) | 2022.03.26 |
---|---|
[ML] 과적합 & 과소적합 (0) | 2022.03.26 |
[ML] Gradient Descent : 경사하강법 (0) | 2022.03.26 |
[ML] 기계학습에 필요한 수학 기초 지식 (0) | 2022.03.26 |
[Artificial Intelligence] PyTorch 기초 (0) | 2022.03.21 |