머신러닝 3

AI 머신러닝 선형회귀 Linear regression SSE SSR SST 결정계수 Rsquared 독립변수 종속변수

안녕하세요. ​제가 알고 있는 지식을 소소하게 공유 해보고자 합니다. [선형회귀]​ 선형회귀는 Linear Regression 입니다. 가장 기본이라고 볼 수 있는 지도 학습 알고리즘 중 하나 입니다. 지도 학습 알고리즘은 정답(레이블링) 데이터가 있는 것을 사용하는 알고리즘을 입니다. 즉, 정답지가 있는 데이터를 통해 값을 예측하고 알고리즘을 평가합니다. 선형회귀는 예측하고자 하는 목표 값이 수치형 데이터 일 때 사용 됩니다. 예로 온도 / 키 / 몸무게 / 집 값 등 수치형 데이터들을 대표적으로 생각해 볼 수 있습니다. 관련 변수들이 존재하고 해당 변수들을 통해 함수적 관련성을 밝혀 나갈 수 있도록 수학적 모형을 가정 한 후 학습 데이터를 통해서 알맞은 변수 값을 추정해 나갑니다. ​ 조금 더 살펴보..

카테고리 없음 2022.12.12

머신러닝 AI 데이터 전처리 스케일링(scaling) 이상치(outlier) 이산형화(discretize) 범주형(명목형, 순서형)

안녕하세요. ^^ 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. ​ 데이터 전처리 : AI 프로젝트 진행 시 70% ~ 80% 업무 범위를 차지한다고 이야기 하는 그 유명한 데이터 전처리 이다. 데이터 다루는 업무에서 데이터 전처리는 반드시 거쳐야 하는 과정 이다. 모델 성능에 큰 영향을 미치기 때문에 결과와 직접적으로 연관이 있으며, 분석 그리고 인사이트와도 연관되어서 중요하게 다뤄지는 과정 이다. ​ 그렇다면 데이터 전처리는 어떤 것을 의미할까요? 아래 정리해보았습니다. ​ 데이터전처리 케이스 1. 데이터 빠진 부분 처리 (결측값) 2. 중복으로 들어간 데이터 처리 3. 특이한, 비정상 데이터가 들어가 있는 경우 처리 4. 그 외 데이터를 정제해서 모델 학습에 적합한 형태로 바꿔주는 단..

카테고리 없음 2022.10.31

AI 머신러닝(MachineLearning) 딥러닝(DeepLearning) 데이터 전처리에(DataPreprocssing) 대하여

[인공지능] : AI (Artificial Intelligence) 사람의 지능에 초점을 맞춰서 인공적으로 지능을 구현하기 위한 학문 분야이다. 즉, 인공적으로 사람의 지능을 구현하기 위한 학문 분야를 뜻 한다. 머신러닝과 딥러닝을 포함하는 큰 개념이다. ​ [머신러닝] : 머신러닝, Machine Learning 기본적으로 데이터로 부터 학습하는 방식으로 인공적으로 사람의 지능을 구현하기 위한 방법 중 하나이다. 즉, 데이터로 부터 컴퓨터가 학습하고 일정한 패턴을 찾아내 해당 결과를 바탕으로 특정 행위를 하거나 결과를 예측하는 것 이다. 일정한 패턴을 찾아내는 것을 Feature extraction 이라고 한다. ​아래와 같은 순서로 동작 한다. 1) 데이터를 전처리 한다. 2) 데이터를 통해 일정한 ..

카테고리 없음 2022.10.28