Sommaire
Pourquoi supprimer les doublons dans Excel ?
Les doublons faussent les analyses, augmentent la taille des fichiers et peuvent conduire à des décisions erronées (calculs, tableaux croisés, envois en masse). Avant toute suppression, procédez à une sauvegarde ou travaillez sur une copie du fichier.
À retenir : Toujours faire une copie de vos données avant toute suppression automatique et documenter la règle utilisée pour définir un doublon.
Méthodes rapides (pas à pas)
1) Outil « Supprimer les doublons » (ruban Données)
- Sélectionnez la plage ou placez-vous dans un tableau structuré.
- Onglet Données > Supprimer les doublons.
- Cochez une ou plusieurs colonnes à comparer (par exemple Nom + Date de naissance).
- Validez : Excel affiche le nombre d’enregistrements supprimés et le nombre restants.
Avantage : très rapide. Attention : suppression irréversible si pas de sauvegarde.
2) Filtre avancé pour extraire les valeurs uniques
- Sélectionnez la plage.
- Données > Avancé (Filtre avancé).
- Choisissez « Copier vers un autre emplacement » et cochez « Uniquement les enregistrements uniques ». Indiquez la destination.
Utilité : obtenir une copie épurée sans modifier l’original.
3) Fonction UNIQUE() (Excel moderne)
- Dans une cellule vide : =UNIQUE(A2:A100)
- Pour plusieurs colonnes : =UNIQUE(A2:C100)
Utilité : crée dynamiquement une liste de valeurs uniques; la feuille source reste intacte.
4) Formules pour identifier les doublons (avant suppression)
- Marquer les doublons dans une colonne auxiliaire :
- =SI(NB.SI($A$2:$A$100;A2)>1;“Doublon”;"")
- Obtenir le 1er doublon seulement :
- =SI(NB.SI($A$2:A2;A2)>1;“Doublon”;“Unique”)
Méthode utile pour réviser manuellement avant suppression automatisée.
5) Mise en forme conditionnelle (visuelle)
- Sélectionnez la colonne > Accueil > Mise en forme conditionnelle > Règles de mise en surbrillance > Valeurs en double.
Permet de repérer visuellement les doublons, utile en relecture avant action.
6) Power Query (pour jeux de données volumineux ou répétitifs)
- Données > Obtenir et transformer (Power Query) > Charger la table.
- Dans l’éditeur : Sélectionner les colonnes > Accueil > Supprimer les doublons > Fermer & Charger.
Avantage : transformation reproductible et traçable via l’étape Power Query.
7) Tableau croisé dynamique (TCD) pour synthétiser
- Insérer > Tableau croisé dynamique > glisser la colonne concernée en lignes.
- Les TCD vont naturellement regrouper les valeurs uniques et permettre des comptages.
Utile pour analyser la fréquence avant suppression.
Tableau synthétique des méthodes
| Méthode | Avantage principal | Inconvénient / Remarque |
|---|---|---|
| Supprimer les doublons (Données) | Rapide, intégré | Action destructive sans copie |
| Filtre avancé | Copie les valeurs uniques | Processus manuel |
| UNIQUE() | Dynamique, non destructif | Disponible dans versions récentes d’Excel |
| NB.SI / formules | Contrôle fin avant suppression | Requiert colonnes auxiliaires |
| Mise en forme conditionnelle | Visualisation immédiate | Ne supprime pas |
| Power Query | Reproductible et performant | Courbe d’apprentissage |
| Tableau croisé dynamique | Analyse et agrégation | Ne produit pas une table plate sans manipulation |
Bonnes pratiques avant de supprimer des doublons
- Faire une copie de la feuille/fichier (sauvegarde).
- Standardiser les données (trim, casse, formats de date) : utiliser RECHERCHE/SUBSTITUE, MISE EN FORME et SUPPRESPACE().
- Définir précisément la règle de doublon (colonnes à comparer, normalisation).
- Documenter l’étape (commentaire, feuille dédiée) ou enregistrer la requête Power Query.
- Vérifier les résultats sur un échantillon avant suppression massive.
Astuces pratiques
- Pour ignorer les espaces : utiliser =SUPPRESPACE(A2) dans une colonne temporaire avant comparaison.
- Pour comparer plusieurs colonnes sans les modifier : créer une clé concaténée =SUPPRESPACE(A2)&”|“&SUPPRESPACE(B2).
- Pour conserver l’occurrence la plus récente : trier par date (décroissant) puis utiliser « Supprimer les doublons » en gardant la première occurrence.
Quand ne pas supprimer automatiquement
- Si vous avez des identifiants uniques qui semblent identiques mais correspondent à entités distinctes (ex. plusieurs commandes d’un même client).
- Si vous n’avez pas normalisé les formats (accents, majuscules, espaces) : vous risqueriez de perdre des données valides.
Actions concrètes recommandées
- Dupliquer la feuille : clic droit > Déplacer ou copier > créer une copie.
- Normaliser les colonnes clés (SUPPRESPACE, MAJUSCULE/MINUSCULE si nécessaire).
- Identifier les doublons avec NB.SI et vérifier manuellement les cas sensibles.
- Appliquer la méthode choisie (UNIQUE, filtre avancé, Power Query ou Supprimer les doublons).
- Conserver un journal des opérations (feuille « Nettoyage ») indiquant la méthode et la date.
Questions fréquentes
Quelle méthode choisir pour un grand fichier plusieurs milliers de lignes ?
Power Query est recommandé : il gère de grandes tables, conserve l’historique des transformations et permet d’automatiser le nettoyage.
La fonction UNIQUE supprime-t-elle les doublons dans la feuille d’origine ?
Non : UNIQUE crée une nouvelle plage dynamique avec les valeurs uniques, la source reste inchangée.
Comment conserver la ligne la plus récente quand plusieurs lignes sont doublons ?
Trier d’abord par date décroissante puis utiliser Supprimer les doublons en conservant la première occurrence ou faire la sélection via Power Query.
Peut-on annuler une suppression de doublons ?
Oui si vous annulez immédiatement (Ctrl+Z) ; si vous avez fermé le fichier, seule une sauvegarde permet de restaurer l’état précédent.
Comment identifier les doublons partiels (ex. mêmes noms mais adresses différentes) ?
Créer des règles de correspondance (concaténation de colonnes, fonctions de recherche ou usage de Power Query pour jointures approximatives) puis examiner manuellement les cas ambigus.