Come pulire i dati in un file CSV

Indipendentemente dalle dimensioni del tuo business, ci sono aspettative crescenti che sarai esperto di dati. Mentre i big data vengono pubblicizzati a livello aziendale, la realtà dei freelancer e dei microimprenditori è che è necessario sporcarsi le mani giocando con i dati in alcune fasi del lavoro dei propri clienti.

Che si tratti del trasferimento di parole chiave in un foglio di calcolo, la pianificazione di tweet, la sincronizzazione di dati tra app aziendali, la gestione di elenchi di contatti o l'importazione di dati in un'infografica, è necessario sapere come pulire i dati da un foglio di calcolo e organizzarli in un formato che l'app o il software online può leggere.

La buona notizia è che essere in grado di gestire i dati e spostarli tra le app è un'abilità commerciabile in sé e con alcuni trucchi, puoi anche risparmiare un sacco di tempo: tempo che potresti spendere per un lavoro più redditizio.

Risorse Tutorial

Per completare questo tutorial, avrai bisogno di:

  • una connessione internet
  • un account di posta elettronica
  • un account Google (gratuito)
  • Microsoft Excel (opzionale)
  • dati che vuoi pulire (vedi sotto per altri esempi)

Che cos'è un file CSV?

Un file CSV è un file "Valore separato da virgola". Questo tipo di file prende tutti i tuoi dati e inserisce le intestazioni di ogni colonna nella prima riga, quindi elenca tutti i tuoi dati nelle righe successive, con tutti i dati non numerici racchiusi tra virgolette ("come questo"), seguito da una virgola.

Un file CSV può essere letto in molti tipi di app e programmi software. Alla sua base è un file di testo. Prende tutti i tuoi dati e li analizza (cioè li suddivide nelle sue unità di dati), in modo che tu possa reinserire i dati in un'altra app.

Ad esempio, ecco i dati dello Strumento per le parole chiave di Google per la parola chiave "File CSV":

Ed ecco un esempio di come appare in un formato CSV:

Perché ripulire i dati?

Sempre più spesso, i clienti si aspettano che tu sia in grado di gestire i dati quando lavori con loro. Ad esempio, un libero professionista che lavora alla scrittura di contenuti SEO per un cliente potrebbe mostrare un elenco di quali parole chiave long-tail vengono utilizzate in ogni articolo del blog programmato per la produzione e di aggiungere queste parole chiave a un foglio di calcolo o a un calendario di contenuti. Come produttore di contenuti freelance, ci si aspetta che produca immagini accattivanti per accompagnare i tuoi articoli. Puoi aggiungere semplici infografiche ai tuoi contenuti ripulendo un file CSV delle tue statistiche di ricerca e quindi importarlo in uno schema o in uno strumento di infografica.

Mentre i big data e gli opendata continuano a diventare più comuni, puoi aumentare rapidamente il valore delle tue offerte di servizi aziendali e ridurre il carico di lavoro sapendo come spostare i dati in giro.

Se gestisci una microimpresa che fornisce servizi di social media, potresti aspettarti di mostrare al cliente una settimana di tweet in anticipo, e poi essere in grado di programmarli su Twitter a intervalli regolari durante la settimana. Oppure potresti essere in grado di sviluppare un servizio aziendale in cui aiuterai un cliente a mantenere sincronizzati i dati dei contatti tra la loro email, le campagne di marketing e il software di gestione delle relazioni con i clienti (CRM).

Forse la tua azienda è cresciuta abbastanza da voler iniziare a utilizzare un'app di fatturazione e contabilità piuttosto che un foglio di calcolo. Puoi ripulire un file CSV di tutti i tuoi vecchi dati finanziari in modo che vengano importati facilmente nell'app di fatturazione senza avere un sacco di rientro dei dati da fare.

Mentre i big data e gli opendata continuano a diventare più comuni, puoi aumentare rapidamente il valore delle tue offerte di servizi aziendali e ridurre il carico di lavoro sapendo come spostare i dati. Essere esperti di dati è un'abilità molto richiesta e può aiutarti a ritagliarsi una proposta di valore unica. La pulizia dei file CSV è fondamentale per sfruttare al meglio tutte queste opportunità.

1. Creazione di un file CSV da un foglio di calcolo

Passaggio 1: Apri il tuo file di foglio di calcolo

Un file CSV è semplicemente un file di foglio di calcolo salvato in un formato di testo in modo che possa essere spostato in un altro programma software o applicazione o strumento basato su cloud. Quindi, per prima cosa, dovrai aprirlo nel tuo foglio di calcolo.

Se stai usando Excel, apri il file di dati che vuoi spostare (File> Apri ... ). Se non disponi di Excel, puoi registrarti a Google Drive con i dettagli del tuo account Google. Google Drive offre un set di strumenti online basato su cloud che include uno strumento per fogli di calcolo. Dopo esserti iscritto, apri il foglio di lavoro in Google Drive.

Lo stesso foglio di calcolo in Excel (a sinistra) e Google Drive (a destra).

Passaggio 2: verifica le nozioni di base sui file

In Excel, assicurati di avere solo un foglio di lavoro nel foglio di lavoro. I fogli di lavoro sono visualizzati nella parte inferiore di Excel. Normalmente vengono chiamati Sheet1, Sheet2, ecc. Assicurarsi che ci sia solo un foglio. Se nella cartella di lavoro è presente più di un foglio, fare clic sulla scheda per ciascun foglio aggiuntivo e accertarsi che non vi siano dati su queste pagine. Quindi fare clic con il tasto destro sulle schede per il Foglio 2 e così via ed eliminare ogni foglio aggiuntivo.

Passaggio 3: Salva come file CSV

In Excel, ora selezionare File> Salva come ... . Scegli un nome per il tuo file e seleziona valori separati da virgola sotto il menu a discesa Formato.

In Google Drive, seleziona File> Scarica come ... . Selezionare valori separati da virgola dalla seconda casella del menu e salvare sul disco rigido.

2. Creazione di un file CSV da dati in un'applicazione online o Webtool

Quando i dati vengono archiviati in un'app online (come FreshBooks, l'app di fatturazione e contabilità per le piccole imprese) o lo strumento del sito web (come lo Strumento per le parole chiave di Google AdWords), è necessario utilizzare le funzioni di importazione dell'app o dello strumento per salvare i dati in un formato di file CSV.

Passaggio 1: nella tua app online, cerca un'opzione di esportazione dei dati

Se desideri creare un file CSV utilizzando i dati in un'app online, cerca un'opzione di menu che ti consenta di esportare i dati dall'app.

In FreshBooks, ad esempio, questo si trova sotto il Il mio account menu. Dopo aver fatto clic su Il mio account appare un menu di secondo livello, dove è possibile selezionare Importa ed esporta.

Ora seleziona File separati da virgola (CSV) accanto a Esporta clienti, fatture, personale e fogli di lavoro.

Altre app basate su cloud possono organizzare le loro opzioni in modo diverso. Se non c'è un'opzione in "Account", cercare un menu "Impostazioni" o un'opzione del menu "Dati". Dovresti essere in grado di individuare un'opzione di menu simile che ti consenta di salvare i dati archiviati online in un file CSV.

Passaggio 2: in uno strumento basato sul Web, cercare un'opzione del menu "Salva come CSV"

Per uno strumento web, cerca un'opzione di menu "Salva". Ad esempio, nello Strumento per le parole chiave di Google AdWords, c'è un Salva tutto pulsante sopra l'elenco di idee per le parole chiave. Clicca su Salva tutto per salvare una copia di tutte le parole chiave dalla tua ricerca.

Ora fai clic sul Scaricare pulsante. Selezionare Tutti i risultati di ricerca. Apparirà una finestra di dialogo che ti offrirà la possibilità di salvare in formato CSV. Clic Scaricare per confermare. A seconda della dimensione del file, potrebbe essere necessario un po 'di tempo per essere preparato.

Infine, ti verrà offerta una finestra di dialogo per indicare dove desideri salvare il file.

Altri strumenti online funzionano in modo simile.


3. Pulizia di un file CSV

Ora che hai un file CSV, dovrai pulirlo e assicurarti che sia leggibile ovunque tu voglia inviarlo. In alcuni casi, potresti voler semplicemente usarlo in un foglio di calcolo.

In altri casi, potrebbe essere necessario pulire il file CSV in modo da poterlo quindi importare in un'altra app o strumento online basata su cloud.

Passaggio 1. Excel: importa il tuo file CSV in un foglio di calcolo

In Excel, crea una nuova cartella di lavoro. Quindi selezionare il Importare opzione dal File menu.

Apparirà una finestra di dialogo. Assicurarsi File CSV è selezionato e fare clic su Importare pulsante.

Ora puoi selezionare il tuo file CSV da dove l'hai salvato.

Passaggio 2. Excel: conferma che i dati sono "delimitati"

In Excel, ti verrà chiesto di confermare che i tuoi dati sono delimitato. Cioè, il tuo file CSV è pieno di dati separati solo da una virgola. Excel dovrebbe essere in grado di dire automaticamente che questo è corretto. Ora fai clic sul Il prossimo pulsante.

Passaggio 3. Excel: conferma le colonne dei dati

In Excel, verrà ora visualizzata un'anteprima di come i dati verranno ordinati in colonne, in base al fatto che i dati sono separati da virgole e gli elementi di testo possono essere racchiusi tra virgolette. Controlla l'anteprima dei dati e seleziona o deseleziona le opzioni del delimitatore e le opzioni del qualificatore di testo fino a quando l'anteprima riflette come ti aspetti che i dati siano visualizzati. Nella maggior parte di questi casi, questo verrà scelto automaticamente. Ad esempio, Excel saprà che tutti i dati di testo hanno un qualificatore di testo di virgolette, quindi ti farà sapere che prevede di rimuovere le virgolette quando importa i dati. Quando sei soddisfatto di come verranno importati i dati, fai clic su Il prossimo pulsante.

Passaggio 4. Excel: conferma i tipi di dati

In Excel, ti verrà chiesto di selezionare il tipo di dati in ogni riga. Selezionare Generale per tutte le colonne ora (personalizzeremo ogni colonna di dati dopo che è stata importata). Ricontrolla le impostazioni avanzate per garantire che i tuoi dati riflettano le convenzioni standard per i numeri a migliaia e per le posizioni decimali.

Ad esempio, se si utilizza un'origine dati USA, viene generalmente utilizzata una virgola per separare migliaia (ad esempio "1.000") e un punto completo rappresenta i punti decimali. È il contrario in Europa! Quindi, a seconda dell'origine dati originale, potrebbe essere necessario modificare queste impostazioni.

Ora fai clic sul finire pulsante per importare i dati CSV nel foglio di calcolo di Excel.

Passaggio 5. Excel: scegliere Dove importare i dati

Infine, in Excel, ti verrà chiesto dove vuoi importare i dati. Se hai aperto una nuova cartella di lavoro al punto 1 sopra, seleziona il Foglio esistente già scelto per te, quindi fai clic su ok.

Passaggio 6. Google Drive: importa il tuo file CSV in un nuovo foglio di calcolo

In Google Drive, puoi eseguire i passaggi precedenti 1 - 5 nella finestra di dialogo. Innanzitutto, crea un nuovo foglio di lavoro dal menu File. Ora scegli Importare dal menu File.

Apparirà una finestra di dialogo. Seleziona il tuo file CSV dal tuo disco rigido.

Ora seleziona Sostituisci foglio di calcolo, come abbiamo già aperto un nuovo foglio di calcolo.

Verifica che l'anteprima mostri come vuoi che i tuoi dati siano distribuiti in colonne. Nella maggior parte dei casi, questo verrà automaticamente impostato correttamente. In caso contrario, modifica il "carattere separatore" in "tab" o "virgola" per vedere se i dati vengono ora visualizzati correttamente nelle colonne.

Clicca il Importare pulsante per procedere.

Passaggio 7. Riordinare le colonne

Poiché puliremo i fogli di calcolo dei dati, sarà più semplice farlo se riuscirai a visualizzare tutti i tuoi dati in colonne pulite. Regola la larghezza delle colonne per mostrare meglio i dati. Sposta il cursore tra le lettere delle colonne nella parte superiore di Excel o Google Drive finché il cursore non diventa un simbolo di movimento della larghezza e allunga la larghezza della colonna in modo che i tuoi dati siano più facili da leggere.

Passaggio 8. Controlla la riga dell'intestazione

Ora controlla che la prima riga abbia le intestazioni di colonna corrette. Quando importi alcuni dati da alcune fonti, potresti avere le date lungo la colonna sinistra (l'asse y) e i valori lungo il resto della riga, a partire dalla seconda colonna (l'asse x). Quindi la prima colonna sull'asse x verrà lasciata vuota.

Per esempio:

In questo caso, inserisci una descrizione (per ora) per la prima colonna, ad esempio "Data" o "Mese".

Se stai utilizzando i tuoi dati CSV in un foglio di calcolo, puoi anche impostare la prima riga come intestazioni di colonna. Questo è utile se si lavora con grandi set di dati in cui è possibile scorrere verso il basso e non essere in grado di vedere la riga dei titoli.

In Excel, clicca su Layout di pagina sotto il File menu. Scegliere Foglio dal menu nella finestra di dialogo popup e fare clic sulla riga nel foglio di calcolo per le intestazioni di colonna. Ora dovrebbe essere indicato nella casella righe da ripetere in alto di solito come $ 1: $ 1.

In Google Drive, seleziona Blocca la riga dal vista menu e selezionare Blocca 1 riga per indicare la riga dell'intestazione.

Passaggio 9. Conferma quali dati sono necessari

Se stai pulendo questi dati perché lo trasferirai in un altro strumento o app online, verifica i requisiti per l'importazione dei dati nell'app di destinazione (consulta la sezione Esempi di utilizzo nella sezione 3. Spostamento dei dati, di seguito).

Se stai pulendo il tuo file CSV per condividerlo in un foglio di lavoro, conferma con il tuo cliente quali dati vogliono che tu sia in grado di mostrare.

Passaggio 10. Eliminare i dati non necessari

Nota: potresti voler salvare una copia del foglio di lavoro prima di iniziare a cancellare i dati, nel caso in cui cambi idea o ne avessi bisogno in seguito.

Ora rimuovi le colonne che non ti serviranno. Ad esempio, se desideri importare la ricerca per parole chiave in un calendario di contenuti, potresti essere interessato solo alle colonne di parole chiave e al volume di ricerca mensile locale.

È possibile eliminare le colonne non necessarie facendo clic sulla lettera dell'intestazione della colonna fino a quando l'intera colonna non viene ombreggiata. Ora scegli Elimina dal modificare menu (in Excel) o Elimina colonna dal menu Modifica (in Google Drive).

Passaggio 11. Assicurati che le colonne della data siano nel formato data corretto

Di nuovo, controlla dove importerai i dati per qualsiasi requisito (vedi la sezione 3 casi utente di seguito).

Se i dati del file CSV includono le date, seleziona la colonna con le date.

In Excel, selezionare Cellule ... dal Formato menu. Ora seleziona Numero dal menu della riga superiore e Data dal menu di sinistra. Scegli il menu della data che corrisponde ai requisiti di importazione o seleziona la versione più leggibile per te e il tuo cliente, se stai semplicemente importando i dati nei tuoi fogli di calcolo personali.

In Google Drive, seleziona la colonna e fai clic sul pulsante che legge 123 nella barra degli strumenti. Scegli un formato data dall'elenco o seleziona altri formati per visualizzare un menu aggiuntivo di opzioni di formato data.

Se il tuo file CSV richiede delle ore da includere con le date, assicurati che siano nel formato giusto (hh: mm o hh: mm: ss).

Se il tuo file CSV richiede date e orari in colonne separate, copia l'intera colonna, quindi formatta la prima colonna in formato solo data e la seconda colonna in formato solo ora. Il resto dei dati verrà automaticamente rimosso.

Passaggio 12. Assicurati che tutti i numeri siano uniformi

Qualsiasi colonna con dati numerici è meglio formattata rimuovendo i mille separatori in modo che i numeri appaiano come 23000 ad esempio e non 23.000.

In Excel, seleziona la colonna, quindi scegli di nuovo Cellule ... dal menu Formato. Scegliere Numero dal menu orizzontale, e Numero dal menu di sinistra. Assicurarsi Usa il separatore 1000 è deselezionato.

Google Drive insiste sull'utilizzo di migliaia di separatori. Ciò non influirà sulle importazioni CSV, ma potrebbe essere fonte di confusione se i tuoi clienti sono europei. Fare clic sulla colonna per selezionarla, selezionare il Formato opzione di menu e fare clic su Numero, quindi selezionare Normale.

Passaggio 13. Aggiungi le colonne di cui hai bisogno

Controlla l'elenco dei dati che ti servono creati al passaggio 9. Aggiungi colonne al tuo foglio di calcolo per ognuna di queste. Alcuni strumenti online richiedono inoltre che i dati vengano ordinati in un modo particolare (ad esempio, la pianificazione dei tweet potrebbe richiedere un ordine specifico per i dati del file CSV). In questo caso, sposta ora le colonne in modo che corrispondano all'ordine di importazione preferito in cui verranno inviati i dati.

Ora assicurati che le intestazioni delle colonne corrispondano esattamente a ciò che la tua destinazione di importazione si aspetta. Non utilizzare virgole invertite in questa fase per intestazioni o dati di testo nelle colonne.

Passaggio 14. Incorporare dati puliti nei fogli di lavoro

In alcuni casi, ad esempio la pulizia dei dati relativi alle parole chiave, potrebbe non essere necessario aggiungerli a qualsiasi origine di destinazione, ad eccezione di un calendario di contenuti. Salva una copia del foglio di lavoro come file di backup, quindi seleziona le colonne che desideri spostare nel calendario dei contenuti. Copia ora queste colonne e incollale nel foglio di calcolo di destinazione.

Passaggio 15. Salvare i dati puliti come file CSV pronti per l'importazione in uno strumento online

Se la destinazione finale per i dati puliti è di aggiungerla a un altro programma, ora sei pronto per salvare questo foglio di lavoro come file CSV in modo da poterlo importare in un'app o in un webtool online.

Ripeti la sezione 1 Creando nuovamente un file CSV da un foglio di calcolo.


4. Spostare i dati da un file CSV in un'applicazione online o in uno strumento Web

In molti casi, dovrai portare i tuoi dati in un'altra app online o webtool per completare il tuo lavoro.

Per assicurarti che i tuoi dati possano essere letti dall'app a cui stai aggiungendo, controlla i requisiti per quali colonne e dati devono essere inclusi.

Cerca un'opzione di menu come "Account", "Impostazioni" o "Dati" e rivedi le informazioni sui dati di importazione. In alternativa, controlla la sezione della guida dell'app / strumento web. Cerca quali intestazioni di colonna è necessario utilizzare e il formato richiesto per ogni colonna di dati. Ad esempio, se aggiungi dati a un calendario di Google, ti occorrono colonne per Data di inizio, Ora di inizio, Data di fine, Ora di fine, Oggetto e (come opzione) Luogo.

D'altra parte, se stavi importando i dati sul tuo progetto in un'app di monitoraggio del tempo come Toggl, vogliono una colonna per l'ora di inizio, ma invece di End Time, devi avere una colonna per la Durata dell'attività, in cui indicherai quanto tempo è stato speso per l'attività piuttosto che per l'ora di fine.

Ogni app online e webtool potrebbe essere leggermente diversa, quindi essere in grado di pulire i dati in file CSV significa acquisire familiarità con la documentazione utente e le guide online per importare i dati.

Quali sono i tuoi bisogni di dati?

Quali sono le tue attuali esigenze di dati? Hai usato file in formato CSV per spostare dati importanti per la tua azienda da un'applicazione all'altra? Fateci sapere i vostri progetti di dati nei commenti qui sotto.