Enlever des doublons sur Excel : éviter les pièges qui font perdre des données

La commande « Supprimer les doublons » d’Excel supprime des lignes entières sans jamais fusionner les données complémentaires. Elle conserve la première occurrence et efface les suivantes, même si ces lignes contiennent un email, un téléphone ou une information unique absente ailleurs. Enlever des doublons sur Excel sans précaution préalable revient à accepter une perte silencieuse de données.

Caractères invisibles et formats mixtes : le faux négatif lors du dédoublonnage Excel

Avant toute opération pour enlever des doublons sur Excel, nous recommandons un audit des cellules-clés. Le problème le plus fréquent ne vient pas de la méthode de suppression, mais de ce qu’Excel considère comme « identique ».

A lire en complément : Quelle formule Excel à soustraire ?

Des espaces insécables, des retours chariot ou des formats mixtes (texte et numérique sur une même colonne) empêchent la commande native et Power Query de repérer correctement les doublons. Le résultat : une base faussement « nettoyée » où des doublons subsistent sans alerte.

Nettoyer avant de dédoublonner

La fonction SUPPRESPACE retire les espaces en trop, mais elle ne suffit pas toujours. Les caractères invisibles (tabulations, retours à la ligne insérés par un copier-coller depuis un CRM ou un export CSV) passent à travers.

A lire aussi : Protéger ses données : Solutions efficaces pour sécuriser son ordinateur

  • Appliquer SUPPRESPACE sur la colonne-clé, puis vérifier avec la fonction NBCAR que toutes les cellules d’un même identifiant renvoient la même longueur
  • Forcer le format de la colonne entière en « Texte » ou en « Nombre » selon la nature de la donnée, jamais laisser un mélange des deux
  • Sur des exports volumineux, passer par Rechercher/Remplacer (Ctrl+H) pour cibler le caractère de retour à la ligne (Alt+010 dans le champ de recherche) et le supprimer

Ce nettoyage prend quelques minutes. Il évite de relancer le dédoublonnage trois fois en se demandant pourquoi des lignes « identiques » persistent.

Homme comparant des feuilles Excel imprimées pour identifier et supprimer des doublons dans un bureau à domicile

Power Query pour dédoublonner sans écraser la source

Power Query travaille sur une copie de la source et charge le résultat dans une nouvelle feuille. C’est la différence fondamentale avec la commande native, qui modifie le tableau en place et ne propose aucun retour arrière fiable (le Ctrl+Z fonctionne uniquement dans la session active).

Depuis Excel 2021 et Microsoft 365, Power Query est installé par défaut. Nous observons que la majorité des utilisateurs continuent d’utiliser la commande « Supprimer les doublons » par habitude, sans savoir que l’outil de requête est déjà accessible dans l’onglet Données.

Étapes concrètes dans Power Query

Sélectionner le tableau, cliquer sur « À partir d’un tableau/plage » dans l’onglet Données. L’éditeur Power Query s’ouvre avec une prévisualisation complète.

Faire un clic droit sur l’en-tête de la colonne-clé, puis « Supprimer les doublons ». Power Query conserve la première ligne de chaque groupe, comme la commande native, mais la source reste intacte. Vous pouvez comparer ligne par ligne avant de valider le chargement.

L’avantage décisif : la requête est rejouable. Si le fichier source évolue (ajouts mensuels, imports réguliers), un simple « Actualiser » relance le nettoyage sans intervention manuelle. Pour un fichier de prospection ou un CRM maison sur Excel, c’est la seule approche qui tient dans la durée.

Fusionner au lieu de supprimer : le piège des données complémentaires

Le vrai risque quand on enlève des doublons sur Excel n’est pas de supprimer une ligne en trop. C’est de supprimer une ligne qui contenait une information absente de la ligne conservée.

Prenons un cas courant : deux lignes pour le même contact, l’une avec l’adresse email, l’autre avec le numéro de téléphone. La commande « Supprimer les doublons » garde la première et supprime la seconde. Le numéro de téléphone disparaît sans aucun avertissement.

Détecter les lignes à fusionner avant suppression

Nous recommandons d’identifier d’abord les groupes de doublons avec une formule NB.SI sur la colonne-clé. Toute cellule renvoyant une valeur supérieure à 1 signale un doublon potentiel.

Ensuite, trier le tableau par cette colonne pour regrouper visuellement les doublons. Avant de supprimer, vérifier si les colonnes secondaires (email, téléphone, adresse, notes) contiennent des valeurs différentes d’une ligne à l’autre. Si c’est le cas, la bonne opération n’est pas la suppression mais la consolidation manuelle ou assistée par formule.

Sur des volumes importants, Power Query permet de grouper par clé et d’agréger les colonnes secondaires (première valeur non vide, concaténation). C’est plus technique, mais c’est le seul moyen d’éviter la perte de données complémentaires sur des bases de plusieurs milliers de lignes.

Vue par-dessus l'épaule d'une femme utilisant la fonction de suppression des doublons dans Excel sur un ordinateur portable dans un café

Validation des données : empêcher les doublons à la saisie

Nettoyer une base existante ne règle pas le problème à la source. Sans garde-fou, les doublons réapparaissent dès l’import ou la saisie suivante.

La validation des données Excel permet de bloquer l’ajout d’un doublon au moment de la saisie. La méthode repose sur une règle personnalisée à base de NB.SI appliquée à la colonne-clé.

  • Sélectionner la plage de cellules concernée (colonne entière ou plage définie)
  • Aller dans Données, puis Validation des données, puis Personnalisé
  • Entrer la formule =NB.SI($A:$A;A2)=1 (adapter la référence de colonne et la première cellule)
  • Configurer un message d’erreur explicite pour que l’utilisateur comprenne pourquoi la saisie est refusée

Cette validation ne protège pas contre les imports en masse (un copier-coller de plusieurs lignes contourne la règle). Pour les fichiers alimentés par des exports réguliers, combiner validation des données et nettoyage Power Query reste la stratégie la plus fiable.

La commande native « Supprimer les doublons » a sa place pour un nettoyage ponctuel sur un petit tableau sans données complémentaires à préserver. Pour tout le reste, travailler sur une copie via Power Query, auditer les caractères invisibles et poser une validation en amont protège réellement contre la perte de données. Le réflexe à perdre, c’est de cliquer sur « Supprimer les doublons » sans avoir vérifié ce que chaque ligne contient d’unique.

Les plus plébiscités

4 Min Read Bureautique

Quelle est la différence entre informatique et bureautique ?

Bureautique et informatique sont deux thèmes qui peuvent prêter à confusion. Pourtant, à y voir de

3 Min Read Informatique

Comment se connecter à Argos ?

Argos 2.0 est un espace numérique de travail conçu par l'académie de Bordeaux qui est dédié