import numpy as np
import pandas as pd
"""
Costruiamo un dataframe sul quale lavorare
"""
df=pd.DataFrame({
"A":pd.Series([2.,np.nan,-40,29]),
"B":pd.Categorical([np.nan,"cane","gatto",""]),
"C":np.array([59]*4,dtype="int32"),
"D":np.random.randint(12,size=4),
"E":pd.date_range("20190406",periods=4)
})
df
"""
È possibile cancellare la riga in corrispondenza
di NaN nella colonna "B".
Con l'opzione inplace=True la modifica è
permanente
df.dropna(subset=["B"],axis=0,inplace=True)
"""
df.dropna(subset=["B"],axis=0)
"""
Calcolare la media di una colonna
"""
mean=df["D"].mean()
mean
"""
Rimpiazzare il valore NaN col valore medio
"""
df["A"].replace(np.nan,mean)