Postman Efficiency Analysis

A Data Science Portfolio Project

Une Aventure de Data Science sur Deux Roues

A laptop with an open screen displaying dashboard analytics featuring charts, graphs, and numerical data related to sales and subscriptions. The interface is predominantly dark-themed with sections highlighting key performance metrics. The device shown is a MacBook Pro, indicated by the keyboard layout and branding.
A laptop with an open screen displaying dashboard analytics featuring charts, graphs, and numerical data related to sales and subscriptions. The interface is predominantly dark-themed with sections highlighting key performance metrics. The device shown is a MacBook Pro, indicated by the keyboard layout and branding.

- Optimisation de la Distribution Postale : La Science des Données sur le Terrain -

Après avoir obtenu un Master en enseignement des mathématiques et un certificat en gestion de données et statistiques appliquées aux États-Unis, j'ai fondé une petite entreprise de conseil en données.

Objectif du Projet

Transformer mon travail quotidien de facteur en une étude de cas axée sur les données. Plus précisément :

  • Mesurer et décomposer le temps et l'effort consacrés à différentes tâches de distribution.

  • Identifier les goulets d'étranglement logistiques.

  • Proposer des stratégies d'optimisation.

  • Démontrer mes compétences en narration de données et en visualisation.

Données Collectées

Cependant, en m'installant en France, j'ai dû trouver une nouvelle voie pour rester actif intellectuellement et physiquement — je suis devenu facteur.

Efficacité : 74 %

Temps Total Quotidien : ~10,7 heures
Temps de Travail Prévu : 8 heures

Conclusion : Déficit de temps constant de près de 2,7 heures/jour

Minutes/Jour

Affecté à un quartier dense de Strasbourg avec 1 780 boîtes aux lettres desservant plus de 5 000 résidents et bureaux, j'ai réalisé que ma routine quotidienne était une simulation vivante d'optimisation logistique, de gestion du temps et de défis concrets en science des données.

Projets Optimisés Applications en Science des Données :

1. Suivi du Temps + Simulation

J'ai construit un modèle de simulation utilisant Python et Pandas pour simuler les durées des tâches, optimiser l'allocation du temps et valider les données par rapport aux résultats réels.

2. Stratégies d'Optimisation des Tâches

  • Distribution groupée : En regroupant les bâtiments adjacents et en les desservant un jour sur deux, j'ai simulé une réduction de 15 à 18 % du temps de déplacement global.

  • Modèle "Reporter les non-prioritaires" : Les lettres et les prospectus publicitaires peuvent être retardés d'un jour sans impact sur la qualité du service.

  • Emballage intelligent : Le chargement prédictif utilisant la fréquence des adresses et l'historique des livraisons a réduit le temps de "recherche sur le vélo" de 25 %.

3. Nettoyage et Ingénierie des Données

  • Modélisation des types de boîtes aux lettres, des retards de livraison et de la logique de nouvelle tentative en utilisant des heuristiques simples.

  • Nettoyage et imputation des journaux de temps manquants pour les itinéraires en utilisant l'estimation et la détection d'anomalies.

Insights :

  • Boîtes aux lettres non conformes (920/1780) gaspillent 22 minutes/jour !

  • Si la communauté religieuse ne signe pas les lettres suivies, je perds 50 minutes et fais face à des superviseurs grincheux.

  • Mon vélo = 🚲, 💪 : 7 rechargements/jour, 1500 kg de courrier/semaine. Pas besoin de salle de sport.

    Questions de Recherche :

    Un postier, c’est un peu comme un robot logistique humain… mais qui doit aussi sourire, se rappeler 5000 noms et pédaler sous la pluie avec 20 kilos de publicité. Pourquoi ne pas en faire un projet data sérieux ?

    • Comment optimiser un système logistique rigide où l’on ne peut pas modifier l’itinéraire?

    • Peut-on regrouper les livraisons standards tous les deux jours sans affecter le service?

    • Quel est l’impact réel des boîtes aux lettres non conformes sur la productivité?

    • Quels bâtiments « coûtent » le plus cher en temps (hauteur, accès, signature)?

    • Comment assurer la livraison quotidienne du courrier suivi et des journaux tout en groupant les lettres ordinaires ?

    • Regroupement par Lot Intelligent :
      Distribuer chaque jour les lettres suivies et les journaux ; alterner les courriers standards et publicités tous les deux jours.
      👉 Résultat : 20 à 30 % de temps économisé.

      Itinéraires par Carte de Chaleur :
      Prioriser le chargement matinal vers les boîtes aux lettres les plus denses avec peu d’escaliers.

      Détection Prédictive d’Absence :
      Utiliser l’historique pour éviter les tentatives dans les logements où les gens ne signent presque jamais.

      Application de Chronométrage des Portes :
      Prototype mobile pour enregistrer le temps d’ouverture par bâtiment afin de réorganiser les tournées.

    Optimisations Proposées

    Clustering des livraisons standards tous les deux jours (hors recommandés & presse) Regroupement par rue / cage d’escalier pour réduire les allers-retours

    Automatisation de la planification avec des scripts Python et Google Maps API

    Prévision de la charge selon météo, jour férié, nombre de colis/journaux

    Analyse par Heatmap des zones à forte densité de colis recommandés

    Simulation de trajets alternatifs avec algorithmes de type TSP (Traveling Salesman Problem)

    Stack Technique :

  • Python : pandas, NumPy, matplotlib, seaborn

  • Nettoyage des Données : scripts Python personnalisés

  • Simulation & Modélisation : simulations d'événements discrets

  • Visualisation : Plotly Dash, Chart.js (pour l'intégration web)

  • Hébergement : Pages Hostinger

Résultat :

Efficacité :98 %

Ce projet démontre que la science des données peut être appliquée à tout système réel, même à la distribution postale. J'ai transformé un travail ordinaire en une étude de cas extraordinaire en recherche opérationnelle, en heuristiques d'apprentissage automatique et en optimisation sous contraintes.