Logiciel

Comment supprimer les doublons dans Excel ?

Guide pratique pour détecter et supprimer les doublons dans Excel : méthodes intégrées, formules, Power Query et bonnes pratiques pour préserver vos données.

Comment supprimer les doublons dans Excel ?
Source : lokace.fr
Sommaire

Pourquoi supprimer les doublons dans Excel ?

Les doublons faussent les analyses, augmentent la taille des fichiers et peuvent conduire à des décisions erronées (calculs, tableaux croisés, envois en masse). Avant toute suppression, procédez à une sauvegarde ou travaillez sur une copie du fichier.

À retenir : Toujours faire une copie de vos données avant toute suppression automatique et documenter la règle utilisée pour définir un doublon.

Méthodes rapides (pas à pas)

1) Outil « Supprimer les doublons » (ruban Données)

  • Sélectionnez la plage ou placez-vous dans un tableau structuré.
  • Onglet Données > Supprimer les doublons.
  • Cochez une ou plusieurs colonnes à comparer (par exemple Nom + Date de naissance).
  • Validez : Excel affiche le nombre d’enregistrements supprimés et le nombre restants.

Avantage : très rapide. Attention : suppression irréversible si pas de sauvegarde.

2) Filtre avancé pour extraire les valeurs uniques

  • Sélectionnez la plage.
  • Données > Avancé (Filtre avancé).
  • Choisissez « Copier vers un autre emplacement » et cochez « Uniquement les enregistrements uniques ». Indiquez la destination.

Utilité : obtenir une copie épurée sans modifier l’original.

3) Fonction UNIQUE() (Excel moderne)

  • Dans une cellule vide : =UNIQUE(A2:A100)
  • Pour plusieurs colonnes : =UNIQUE(A2:C100)

Utilité : crée dynamiquement une liste de valeurs uniques; la feuille source reste intacte.

4) Formules pour identifier les doublons (avant suppression)

  • Marquer les doublons dans une colonne auxiliaire :
    • =SI(NB.SI($A$2:$A$100;A2)>1;“Doublon”;"")
  • Obtenir le 1er doublon seulement :
    • =SI(NB.SI($A$2:A2;A2)>1;“Doublon”;“Unique”)

Méthode utile pour réviser manuellement avant suppression automatisée.

5) Mise en forme conditionnelle (visuelle)

  • Sélectionnez la colonne > Accueil > Mise en forme conditionnelle > Règles de mise en surbrillance > Valeurs en double.

Permet de repérer visuellement les doublons, utile en relecture avant action.

6) Power Query (pour jeux de données volumineux ou répétitifs)

  • Données > Obtenir et transformer (Power Query) > Charger la table.
  • Dans l’éditeur : Sélectionner les colonnes > Accueil > Supprimer les doublons > Fermer & Charger.

Avantage : transformation reproductible et traçable via l’étape Power Query.

7) Tableau croisé dynamique (TCD) pour synthétiser

  • Insérer > Tableau croisé dynamique > glisser la colonne concernée en lignes.
  • Les TCD vont naturellement regrouper les valeurs uniques et permettre des comptages.

Utile pour analyser la fréquence avant suppression.

Tableau synthétique des méthodes

MéthodeAvantage principalInconvénient / Remarque
Supprimer les doublons (Données)Rapide, intégréAction destructive sans copie
Filtre avancéCopie les valeurs uniquesProcessus manuel
UNIQUE()Dynamique, non destructifDisponible dans versions récentes d’Excel
NB.SI / formulesContrôle fin avant suppressionRequiert colonnes auxiliaires
Mise en forme conditionnelleVisualisation immédiateNe supprime pas
Power QueryReproductible et performantCourbe d’apprentissage
Tableau croisé dynamiqueAnalyse et agrégationNe produit pas une table plate sans manipulation

Bonnes pratiques avant de supprimer des doublons

  • Faire une copie de la feuille/fichier (sauvegarde).
  • Standardiser les données (trim, casse, formats de date) : utiliser RECHERCHE/SUBSTITUE, MISE EN FORME et SUPPRESPACE().
  • Définir précisément la règle de doublon (colonnes à comparer, normalisation).
  • Documenter l’étape (commentaire, feuille dédiée) ou enregistrer la requête Power Query.
  • Vérifier les résultats sur un échantillon avant suppression massive.

Astuces pratiques

  • Pour ignorer les espaces : utiliser =SUPPRESPACE(A2) dans une colonne temporaire avant comparaison.
  • Pour comparer plusieurs colonnes sans les modifier : créer une clé concaténée =SUPPRESPACE(A2)&”|“&SUPPRESPACE(B2).
  • Pour conserver l’occurrence la plus récente : trier par date (décroissant) puis utiliser « Supprimer les doublons » en gardant la première occurrence.

Quand ne pas supprimer automatiquement

  • Si vous avez des identifiants uniques qui semblent identiques mais correspondent à entités distinctes (ex. plusieurs commandes d’un même client).
  • Si vous n’avez pas normalisé les formats (accents, majuscules, espaces) : vous risqueriez de perdre des données valides.

Actions concrètes recommandées

  1. Dupliquer la feuille : clic droit > Déplacer ou copier > créer une copie.
  2. Normaliser les colonnes clés (SUPPRESPACE, MAJUSCULE/MINUSCULE si nécessaire).
  3. Identifier les doublons avec NB.SI et vérifier manuellement les cas sensibles.
  4. Appliquer la méthode choisie (UNIQUE, filtre avancé, Power Query ou Supprimer les doublons).
  5. Conserver un journal des opérations (feuille « Nettoyage ») indiquant la méthode et la date.

Questions fréquentes

Quelle méthode choisir pour un grand fichier plusieurs milliers de lignes ?

Power Query est recommandé : il gère de grandes tables, conserve l’historique des transformations et permet d’automatiser le nettoyage.

La fonction UNIQUE supprime-t-elle les doublons dans la feuille d’origine ?

Non : UNIQUE crée une nouvelle plage dynamique avec les valeurs uniques, la source reste inchangée.

Comment conserver la ligne la plus récente quand plusieurs lignes sont doublons ?

Trier d’abord par date décroissante puis utiliser Supprimer les doublons en conservant la première occurrence ou faire la sélection via Power Query.

Peut-on annuler une suppression de doublons ?

Oui si vous annulez immédiatement (Ctrl+Z) ; si vous avez fermé le fichier, seule une sauvegarde permet de restaurer l’état précédent.

Comment identifier les doublons partiels (ex. mêmes noms mais adresses différentes) ?

Créer des règles de correspondance (concaténation de colonnes, fonctions de recherche ou usage de Power Query pour jointures approximatives) puis examiner manuellement les cas ambigus.

Partager