회귀2 [딥러닝을 이용한 자연어 처리 입문] 선형 회귀와 로지스틱 회귀 선형 회귀 1. 선형 회귀 1) 단순 선형 회귀 분석 y=wx+b w: 가중치(weight) b: 편향(bias) 2) 다중 선형 회귀 분석 y=w_1*x_1+w_2*x_2+...+w_n*x_n+b 2. 가설(hypothesis) 세우기 -x와 y의 관계를 유추하기 위해 수학적으로 식을 세워보게 되는데 머신러닝에서는 이러한 식을 가설이라고 함 3. 비용함수(cost function): 평균 제곱 오차(Mean Squared Error, MSE) - w와 b를 찾기 위해서 실제값과 가설로부터 얻은 예측값의 오차를 계산하는 식을 세우고, 이 식의 값을 최소화하는 최적의 w와 b를 찾아냄 - 이때 실제값과 예측값에 대한 오차에 대한 식을 목적 함수(objective function, 함수의 값을 최소화하거나 .. 2023. 4. 16. [딥러닝을 이용한 자연어 처리 입문] 머신 러닝 오늘은 머신 러닝에서 나오는 기본적인 개념에 대해서 알아보고자 함 모델 성능 평가 - 머신 러닝 모델의 성능을 평가하기 위해서는 분석 전에 데이터를 훈련용, 검증용, 테스트용으로 분리함 - 훈련용 데이터는 머신 러닝 모델을 학습하는 용도이며, 테스트 데이터는 학습한 머신 러닝 모델의 성능을 평가하기 위한 용도임 - 검증용 데이터는 모델이 훈련 데이터에 과적합이 되고 있는지 판단하거나 하이퍼파라미터를 조정하기 위한 용도로 사용됨(하이퍼파라미터란 모델의 성능에 영향을 주며, 사람이 값을 지정하는 변수임) - 검증용 데이터를 이용하여 하이퍼파라미터를 결정하는 과정을 튜닝한다고 표현함 분류와 회귀 - 머신 러닝 모델을 이용하여 스팸 메일 분류/과학, 영어, IT, 학습지, 만화라는 레이블이 붙어있는 5개의 책장.. 2023. 4. 6. 이전 1 다음