반응형

머신러닝 2

Python 머신러닝 피처 엔지니어링(Feature Enginerring) 개념 기초 정리

이 글은 머신러닝 피처 엔지니어링(Feature Enginerring) 개념과 방법 기초 정리를 담고 있습니다. Python 피처 엔지니어링(Feature Enginerring) 개념 특성 공학으로도 불림. 알고리즘(모델) 성능 향상을 위해, 원본으로부터 Feature(x, 독립 변수)를 (재)구성. 테이블의 기존 컬럼을 바탕으로 새 컬럼 추가 혹은 컬럼 제거. 타깃 변수와 의미 있는 변수를 선택하는 과정. 때문에 데이터 도메인 지식, 즉 전문성이 많이 필요한 과정이다. Python 피처 엔지니어링(Feater Enginerring) 방법 피처 엔지니어링에는 여러 방법이 있는데, 그중 몇 가지만 추려보자. Feature Encoding 모델 학습을 위해 모델에 맞는 Feature로 변환. 범주형 변수(문..

PYTHON/Python 2024.04.04

Python 머신러닝 피처 스케일링과 min-max 정규화 기초 정리

이 글은 Python 머신러닝 피처 스케일링과 min-max 정규화 개념 기초 정리를 담고 있습니다. 피처 스케일링(Feature scaling) 과적합 방지를 위해, 독립변수(x, Feature)의 범위 값 조정. 이로써 모델 성능 향상 가능. 경사 하강법(Gradient Descent) 기반 알고리즘은 x값이 경사하강법 단계 크기에 영향을 크게 미침. 따라서 피처 스케일링 적용 필요. ex. Linear Regression, Logistic Regression, Neural Network... 점들 간 거리 기반 알고리즘(Distance Based Algorithms)도 피처 스케일링 적용 필요. ex. KNN, K-means, SVM min-max 정규화(Min-max normalization) (..

PYTHON/Python 2024.03.28
반응형
top