"""
Importare la libreria pandas e assegnarel
l'etichetta che si vuole, per esempio pd.
D'ora in poi digitando pd sulla riga di comando
richiamerà la libreria
"""
import pandas as pd
"""
Come esempio si può importare una tabella
contenente moltissimi dati riguardanti le vendite di
automobili. Si assegna un indirizzo. In questo caso
si tratta di un indirizzo internet.
"""
url="https://archive.ics.uci.edu/ml/machine-learning-databases/autos/imports-85.data"
"""
Ora si crea il DATAFRAME. Gli si assegna un'etichetta. Una qualunque va bene
in questo caso usiamo df
Il file che si carica è una tabella scritta in formato csv e lo si carica senza
l'intestazione, cioé senza la prima riga di etichette
"""
df=pd.read_csv(url,header=None)
"""
Si possono stampare anche un numero limitatto di righe.
Per esempio 5
"""
df.head(15)
"""
È possibile inserire una stringa contenente le etichette
per ogni colonna.
"""
headers=["simbolo","norm-loss","marca","carburante","asp","n_di_porte","stile","trazione","lo_motore","ruote","lunghezza","larghezza","altezza","freno","tipo_motore","n_cicli","forma_motore","iniezione","bore","stroke","comp-ratio","horsepower","peak-rpm","city-mpg","high-mpg","prezzo"]
"""
Si assegna alle colonne la stringa appena costruita
e si stampano le prime 5 righe
"""
df.columns=headers
df.head(5)
"""
Ora si può stabilire dove salvare il file creando la path.
Occorre aggiungere il parametro r per una questione legata
al corretto utilizzo dei caratteri.
In questo caso si è scelto di salvare nel formato csv. Volendo
si può salvare anche in formato excel usando:
path=r'D:\Google Drive\scuola\PYTHON\auto.xlsx'
df.to_excel(path)
"""
path=r'D:\Google Drive\scuola\PYTHON\auto.csv'
df.to_csv(path)
"""
È possibile ottenere informazioni globali contenute
nel dataframe. Nell'ultima colonna ci sono le informazioni
relative al formato del dato; intero (int64), virgola mobile (float64)
stringa (object)
"""
df.info()
"""
È inoltre possibile ottenere una statistica globale
del dataframe
"""
df.describe()