R-ladies meeting

Retour d'expérience : compétition Kaggle avec R

Intervenant(s)
Mercedes Sgobba
Informations pratiques
28 novembre 2017
19h-21h
Lieu

Salle Langevin , 29 rue d'Ulm, 75005 Paris

Mercedes Sgobba, une de nos membres, nous a gentiment proposé de nous présenter son expérience d'utilisation de R dans le cadre d'une compétition Kaggle.

Il y a environ un an, le Groupe Bimbo a lancé une compétition Kaggle pour améliorer son activité.

Le Groupe Bimbo est la plus grande boulangerie au monde.

Description de la compétition :

Le Groupe Bimbo voudrait comprendre la consommation journalière de pain/produits de boulangerie au Mexique où les produits sont vendus dans les rayons de plus d’1 million de points de ventes.

A date, les commandes quotidiennes sont calculées à la main par le personnel de livraison. Certains de ces produits ont une ‘shelf life’ d’une semaine au max. Il s’agira développer un modèle de prévision de la demande.

Points clés : 74 millions d’observations, long travail de traitement de la donnée et jonction de plusieurs fichiers, élimination de duplicata, transformation en facteurs, ACP & Corrélation de variables, plusieurs exemples de visualisations avec R, découverte de fraude et construction d’un modèle de prévisions de la demande via un algorithme, comparaison de modèles (régression linaire, random forest..).

 

En savoir plus