[머신러닝] 머신러닝 입문 올인원 :: 1강 회귀_Notation

2024. 4. 21. 13:41메타코드/머신러닝


 

오늘은 회귀에 대해 배우기 전에 용어 정리를 한다. 

 

1강 회귀 :: Notation

 

 

회귀 vs 분류

 

♣회귀

입력값 : 연속값,이산값 등 모두 가능.

출력값 : 연속값

모델 형태 : 일반적인 함수 형태->머신러닝 모델

 

♣ 분류

입력값 : 연속값,이산값 등 모두 가능.

출력값 : 이산값

모델 형태 : 이진 분류라면 시그모이드 함수, 다중분류라면 소프트맥스 함수 꼭 포함 (일반적인 함수에 추가)

 

클래스가 2개인 것을 이진 분류. 클래스가 다중인 것을 다중분류

 

데이터 용어

데이터의 용어에 대해 배운다.

 

데이터는 피처와 라벨로 구성된다. 에측하고 싶어하는 목표가 라벨. 피처는 주어진 데이터를 말한다.

피처는 독립변수이고 라벨은 종속 변수이다.

라벨은 y로 표기하고,피처는 x로 표기한다.

라벨의 유무로 지도학습, 비지도학습 분류한다. 라벨이 이산값이면 분류, 라벨이 실수형태로 표현되면 회귀 문제이다.

 

피처.(항목이란 뜻을 내포)

N : 데이터의 개수.  D : 피처의 개수

->행렬을 표현할 때 사용

 

모델의 용어

모델의 용어에 대해 배운다.

 

♣ 파라미터.

정의한 모델(함수)가 가지고 있는 학습이 가능한 파라미터(가중치)

일차함수를 예를 들면.기울기, 절편를 파라미터라고 표현함.

weight의 w를 따서 w로 표현. 피처가 여러개 있을때 어느 피처에 더 가중치를 줄지를 정한다.

 

♣ 하이퍼 파라미터

인간이 정해햐하는 변수들

학습률, 배치크기 등을 말한다.

 

인공지능이나 머신러닝은 아직가지 완벽하지 않다. 완벽하지 않다는 것은 전문가가 주어야 하는 데이터, 모델정의, 하이퍼 파라미터 정의를 주어야 한다는 것을 의미한다. 이런 것들을 자동으로 하기위해 autoML 이라는 자동으로 머신러닝이 알아서 학습될 수 있도록 도와주는 연구분야가 활발한다.

 

모델의 용어

 

♣ input

모델에 입력되는 값으로 데이터의 피처부분. 전문가가 준 데이터들 중에서 피처부분만 입력값으로 사용한다.

 

♣ output

모델로부터 축력되는 예측값. 즉 라벨을 의미.

 

머신러닝 규칙: 정답지를 머신에게 주면 안된다. 데이터가 주어지면 학습에 필요한 학습데이터, 평가를 위한 평가(test)데이터로 나누어져 있다. 학습을 할 때는 평가데이터를 사용하면 절대 안된다. 학습데이터 안에서는 y(라벨)을 머신에게 주면 안된다.

인간이 모델에게 예측값을 받아서 비교를 하여 오류값을 머신에게 넘겨주고, 머신을 그걸로 다시 학습을 한다.

 

♣ 선형 모델 

선형모양의 모델. 파라미터를 선형 결합식으로 표현 가능한 모델.

선형 결합식 -> 각 피처에 대한 가중치값을 정의하고 데이터와 파라미터의 관계가 일차식으로 결합된 형태를 가지고 있을때 선형회귀라고 표현. 

 

♣ 비선형 모델

선형결합식으로 표현 불가능한 모델

 

 

회귀에 본격적으로 배우기전에 알아야 할 기본 용어들에 대해 배웠다. 용어까지 자세하게 알 수 있어서 좀 더 쉬운 이해가 가능할 것 같다.

 

 

 

이미지를 눌러 머신러닝 배우러 가기