본문 바로가기

기계학습 - 오일석5

1.7 기계 학습 유형 지도 학습: 입력 데이터와 각 데이터의 클래스가 동시에 주어지는 것  비지도 학습: 입력데이터만 주어지는 것  강화 학습: 행동에 대한 보상으로 적절한 목표로 나아게 만드는 것  준지도 학습: 입력 데이터와 일부 입력 데이터에 대한 클래스만 주어지는 것 2024. 12. 24.
1.5 모델 선택 ❓모델의 용량이란? 모델의 용량이란 학습능력과 구조, 표현력, 일반화 능력 등을 의미한다. 따라서 모델의 용량이 작다는 것은 모델이 복잡한 패턴나 관계를 학습하는 것을 어려워하고, 단순한 구조를 가지는 것을 의미한다. 또한 모델의 용량이 크다는 것은 모델이 복잡한 패턴나 관계를 학습할 수 있고, 복잡한 구조를 가지는 것을 의미한다. 과소 적합과 과잉 적합위의 그림에서 1차, 2차는 모델의 용량이 작아서 직선 또는 2차원 곡선의 데이터만 수용할 수 있다. 이러한 경우를 과소 적합이라고 한다. 12차는 모델의 용량이 너무 커서 아주 작음 잡음까지 수용해버린다. 따라서, 훈련집합에는 완벽하게 모델이 대응할 수 있지만, 새로운 테스트 집합이 들어오면 아래와 같이 대응하지 못하게 된다. 이러한 경우를 과잉 적합이.. 2024. 12. 24.
1.4 간단한 기계 학습의 예 위의 그림은 직선 모델을 사용해서 회귀 문제를 푸는데, 이러한 기계 학습 알고리즘은 선형 회귀라고 한다.  선형 회귀는 직선 모델을 사용하기 때문에 추정해야 할 매개변수는 w, b이다. 이 매개변수를 묶어서 θ(세타)라고 하고 아래 처럼 표기한다. θ = (w₁, b₁)ᵀ    처음에는 난수로 w와 b를 결정하지만, 점점 개선해서 θ₁를 θ₂로 개선하고, θ₂를 θ₃로 개선하여 최적의 매개변수인 θ ^(세타 햇)에 도달해야 한다. 이렇게 개선을 하기 위해서는 동력이 필요한데 수학에서는 이를 목적 함수라고 한다. 이 목적 함수를 수식으로 나타내면 아래와 같다. 위의 식을 해석해보면, (예측 함수 - 실제 목표 값)²의 평균을 의미한다. 즉, 예측 함수의 평균 제곱의 오차를 의미한다.   따라서, 우리의 목.. 2024. 12. 24.
1.2 특징 공간에 대한 이해 💡 특징 공간: 데이터의 특성을 나타내는 변수들로 이루어진 공간2차원 특징 공간1차원 특징 공간과 다르게 2차원 특징 공간은 두개의 x축을 통해서 y축을 예측하는 것이다. 따라서, 2차원에서의 특징 벡터 x는 (x₁, x₂)ᵀ 방식으로 표현할 수 있다. 이를 바탕으로 키, 몸무게에 대한 장타율을 나타내면 아래와 같다.   다차원 특징 공간2차원 뿐만 아니라 그 이상 차원에서도 특징 벡터를 표현할 수 있는데 다차원에서의 특징 벡터 x는 (x₁, x₂, x, x, ..., xd)ᵀ 방식으로 표현할 수 있다.     특징 공간 변환과 표현 학습위와 같이 직선으로 분류할 수 없던 특징 공간을 분류할 수 있게 변환하는 것이 특징 공간 변환이라고 한다. 이렇게 변환을 통해서 좋은 특징 공간을 자동으로 찾아내는 것.. 2024. 12. 23.
1.1 기계 학습이란 💡 기계학습: 임의의 입력 값(x)에 대한 결과(y)를 예측하는 것  회귀와 분류회귀란? 입력데이터 x를 기반으로 출력 데이터 y를 가질 수 있는 연속적인 수치 값(실숫값)을 예측하는 데 사용한다.예를 들면, 주택 크기에 따라 집값을 예측하는 것이다.  분류란? 입력 데이터 x를 기반으로 출력 데이터 y가 어떤 이산적인(연속적이지 않은) 클래스 값을 가지는지 예측하는데 사용된다.예를 들면, 사진 속 동물이 개, 고양이, 새 중에 무엇인지 분류하는 것이다.    기계 학습에서의 x와 y기계 학습에서 x는 특징을 나타내고, y는 목표값을 나타낸다. 물론, x와 y는 스칼라가 아니라 벡터이다. 즉, 여러 개이다.따라서, 이런 집합을 훈련 집합이라고 부르고 아래와 같이 표기한다.    모델을 수식(직선)으로데.. 2024. 12. 23.