import numpy as np
import pandas as pd
"""
Costruiamo un dataframe sul quale lavorare
"""
df=pd.DataFrame({
"A":pd.Series([2.,np.nan,-40,29]),
"B":pd.Categorical([np.nan,"cane","gatto","topo"]),
"C":np.random.randint(100,size=4),
"D":np.random.randint(300,size=4),
"E":pd.date_range("20190406",periods=4)
})
df
"""
Normalizzazione la colonna "D" usando il metodo
SIMPLE FEATURE SCALING:Xnew=Xold/Xmax
"""
df["D"]=df["D"]/df["D"].max()
df
"""
Normalizzazione la colonna "C" usando il metodo
MIN-MAX :Xnew=(Xold-Xmin)/(Xmax-Xmin)
"""
df["C"]=(df["C"].min())/(df["C"].max()-df["C"].min())
df
"""
Normalizzazione la colonna "A" usando il
Z-METHOD :Xnew=(Xold-Xmin)/(Xmax-Xmin)
"""
df["A"]=(df["A"]-df["A"].mean())/df["A"].std()
df