본문 바로가기

데이터사이언스/머신러닝10

로지스틱 회귀분석 (Logistic Regression) 1. 분류 (Classification) 개요 회귀분석은 target value가 수치형 변수이다. 로지스틱 회귀분석은 Y 값에 수치형 값이 나타나긴 하지만 특정한 값을 예측하는 것이 아니라 classification 문제를 풀어준다. 대부분 2 분류 문제를 풀어준다. Supervised Learning의 일종으로 입력 데이터에 존재하는 Feature 값들과 label 값의 class 간의 관계를 학습하여 새로 관측된 데이터의 class를 예측하는 문제를 풀어준다. 다음과 같은 영역에 활용할 수 있다. 이메일 Spam 분류 고객 이탈 방지 어느 고객이 떠날 것인가? -> 떠날 위기에 있는 고객들 대상으로 고객 유지 마케팅 수행 이동통신회사, FedEx, 체이스은행, 위키피디아 등등 HR 직원 행동 예측 .. 2023. 4. 16.
머신러닝 선형회귀분석 (Linear Regression) 머신러닝 분야에서의 회귀분석에 대해 알아본다. 여기서 말하는 회귀분석은 선형회귀분석을 말한다. 1. 회귀분석 (Regression) 통계학과 머신러닝에서의 선형회귀분석은 동일한 용어를 사용하긴 하지만 접근하는 방식이나 관점이 약간 다르다. 회귀분석이란 한 변수를 다른 변수 / 변수들의 함수 관계로 표현하는 것을 말한다. 선형회귀분석(Linear Regression)은 독립변수 X로 종속변수 Y를 설명할 때 이 관계가 선형인 경우를 말한다. 물론 독립변수 X는 여러 개일 수 있다. 선형관계를 가지고 데이터를 분석한다. 통계학에서는 어떤 통계학적인 설정이나 가정이 전제가 되어야 한다. 통계학의 회귀분석에서도 4가지 가정이 전제가 되어야 한다. 선형성이 있느냐? 오차가 정규성이 있느냐? 등분산이냐? 독립이냐?.. 2023. 4. 15.