Una delle esigenze più comuni quando si devono elaborare ampi set di dati con un foglio elettronico consiste nella rimozione dei duplicati.
Fare pulizia in un foglio Excel è spesso essenziale in qualunque attività lavorativa. La buona notizia è che Excel offre tre strumenti per eliminare i duplicati: è possibile utilizzare quello che si preferisce anche se ci sono comunque alcune differenze tra l’uno e l’altro.
Il primo metodo che vi proponiamo si basa sull’utilizzo della funzione Rimuovi duplicati di Excel, il secondo sulla funzione UNICI
, il terzo su Power Query.
Un aspetto importante da tenere a mente prima di cominciare a lavorare sui dati è che sia Rimuovi duplicati che la funzione UNICI
non sono case sensitive ovvero non fanno differenza tra maiuscole e minuscole.
Viceversa il metodo basato sull’utilizzo di Power Query è case sensitive.
Va detto inoltre che se si decidesse di conservare il set di dati di partenza creandone una copia priva di duplicati, il pulsante Rimuovi duplicati non offrirà un insieme di dati dinamico: se si apportassero cioè delle modifiche ai dati di partenza quelli elaborati con la rimozione dei duplicati rimarranno invariati.
La funzione UNICI
usa invece un approccio dinamico: se cambiano i dati di partenza quelli elaborati verranno aggiornati in tempo reale.
Power Query utilizza invece un approccio “semi-dinamico” con l’aggiornamento dei dati privi dei duplicati che deve essere esplicitamente richiesto dall’utente.
Eliminare i duplicati da Excel con il pulsante Rimuovi duplicati
La combinazione di tasti CTRL+A
può essere utilizzata in Excel per selezionare le righe e le colonne da elaborare.
Spostandosi in un’area libera del foglio elettronico e premendo CTRL+V
è possibile copiare lo stesso insieme di dati.
Con un clic sul menu Dati quindi sul pulsante Rimuovi duplicati apparirà una finestra di dialogo simile a quella in figura.
Cliccando su OK si otterrà un nuovo set di dati depurato delle righe che contengono esattamente gli stessi valori (verrà conservata un’unica occorrenza).
Gli utenti abbonati a Office 365 oppure coloro che usano un account Microsoft gratuito possono ricorrere a Excel Web per rimuovere i duplicati con la funzione UNICI
.
Basta portarsi in un’area libera del foglio di calcolo quindi digitare =UNICI(
nella casella fx per l’inserimento delle formule.
Specificando l’area contenente i dati di partenza, alla pressione del tasto Invio Excel provvederà a rimuovere automaticamente tutti i duplicati presenti.
Si dovranno in questo eventualmente ripristinare le corrette formattazioni per i dati e la riga di intestazione.
Per eliminare i duplicati con Power Query si deve invece cliccare su Dati nella barra dei menu di Excel quindi sul pulsante Da tabella.
Nel caso in cui i dati d’interesse non fossero inseriti nel foglio Excel come tabella si dovrà crearne una.
Alla comparsa dell’editor di Power Query basta tenere premuto il tasto MAIUSC
quindi cliccare sull’intestazione dell’ultima colonna a destra in modo che tutte le colonne risultino selezionate.
Cliccando sull’intestazione di una colonna qualsiasi si dovrà selezionare il comando Rimuovi duplicati. Al termine dell’operazione di eliminazione dei duplicati Power Query mostrerà Rimossi duplicati nel riquadro Passaggi applicati a destra.
Cliccando su Chiudi e carica, Chiudi e carica in… si dovrà selezionare l’opzione Nel foglio di lavoro esistente quindi specificare la cella a partire dalla quale devono essere incollati i dati (aiutarsi con il piccolo pulsante per selezionare la cella di partenza).
Nel caso in cui si apportassero variazioni ai dati di partenza basterà fare clic sul pulsante Aggiorna per effettuare una nuova elaborazione e togliere i duplicati.
Per risolvere il problema derivante da dati che contengono combinazioni differenti di maiuscole e minuscole è possibile normalizzare il contenuto delle celle con Power Query.
Basta cliccare due volte sul nome della tabella nella colonna di destra, selezionare Modificato tipo nel riquadro Passaggi applicati quindi usare la scheda Trasforma e poi il pulsante Formato per normalizzare i dati.