Normalization
정규화
- 머신러닝에 사용될 서로 다른 Feature들을 같은 범위로 통일시키는 작업을 의미한다.
Mechanism (원리)
\(\large{X_{new_i} = {X_i - \mathrm{min}(X_i) \over \mathrm{max}(X_i) - \mathrm{min}(X_i)}}\)
- 정규화의 통계학적인 원리는 아래 포스트를 참조하자.
* Normalization (정규화) (URL)
Implementation (구현)
* Python Scikit-Learn Library (파이썬 사이킷런 라이브러리) (URL)
* Python 3 (using Scikit-Learn Library)
# normalization.py
from sklearn.preprocessing import MinMaxScaler
def get_normalization(x_train, x_test):
scaler = MinMaxScaler()
x_train_sc = scaler.fit_transform(x_train)
x_test_sc = scaler.transform(x_test)
return x_train_sc, x_test_sc