Order-from-noise

Order-from-noise

Big Data : Cause Killer

Le Big Data : Cause Killer

Pompiers incendiaires

Le taux de corrélation entre le retour des cigognes en Alsace et l'arrivée de nouveaux nés est si élevé - de l'ordre de 0,7 points - qu'il est facile d'en déduire que ces emplumés apportent les bébés. Le bon sens et notre expérience démentent ici le sérieux d'une telle relation de causalité. Il serait évidemment fallacieux sinon ridicule de soutenir que la survenue des cigognes a quelque chose à voir avec l'évolution du taux de natalité. Bien que l'évolution conjointe de deux variables nous entraîne à voir une relation de causalité, cette dernière relève bien souvent de la pure coïncidence ; de même qu'un taux de corrélation faible n'exclut pas que deux variables exercent une influence l'une sur l'autre, une forte corrélation peut aussi être due à un troisième critère commun : Le taux d'urbanisation causée par la croissance de la population suffit à multiplier les chances pour que nos cigognes trouvent de nouvelles cheminées pour nicher.

 

Ces considérations trompeuses sont pourtant très répandues et font les délices du site américain "Spurious Correlations" - Corrélation Spécieuses -¹. On y apprend que le taux de corrélation entre le nombre de divorces dans l'état du Maine et celui de la consommation de margarine per capita s'établit à 0,99 points. Vous apprendrez également, que sur une période identique de 10 ans, le taux de corrélation entre la consommation de fromage et le nombre de personnes mortes étranglées par leur drap de lit est de 0,94 points, que le taux de corrélation entre la consommation de Mozzarella et le nombre de personnes reçues au Doctorat de Génie Civil dépasse les 0,90 points. Cet abus de raisonnement, résumé par l'expression latine Cum hoc ergo propter hoc  - avec ceci, donc à cause de ceci  - n'aurait rien de navrant s'il ne portait pas en germe la possibilité de décisions fâcheuses. Nous pourrions alors nous désoler qu'un capitaine des pompiers, observant une liaison forte entre le nombre de camions mobilisés lors d'interventions et l'importance des dégâts liés au feu, décide de bloquer la caserne sous prétexte que la sortie des pompiers aggrave les conséquences d'un incendie. Cet exemple prête à rire, mais sommes nous bien sûrs que ce qui guide nos politiques RH soit exempt de telles illusions ? L'interprétation hâtive de certaines corrélations ne met-elle pas la DRH sous l'emprise de relations de cause à effet parfaitement erronées ?

 

Des vessies pour des lanternes

 

La recherche des conditions d'une plus grande performance des entreprises et de tout ce qui y conduit secrète son lot de curiosités. La motivation des salariés entraine la hausse des profits de l'entreprise. Si le lien de cause à effet suggéré n'est pas totalement faux, il n'est pas garanti. Ne serait-ce pas plutôt la santé de l'entreprise qui conduit les salariés à se montrer plus motivés ? La gestion des talents est à l'origine de la performance des entreprises ! Or, ne serait-ce pas sa performance qui autorise l'entreprise à se payer les moyens d'une politique de rémunération attractive pour attirer ou retenir les talents. Combien de DRH sont aujourd'hui conseillées pour orienter leurs politiques sur la foi de telles inversions. Des pratiques RH se maintiennent même en dépit de toute corrélation avérée. Prenons l'entretien classique de recrutement² auquel 100% des entreprises recourent. Cette méthode de sélection entretient l'idée d'une corrélation entre certains critères de compétences que valide la déclaration d'expériences passées et la performance future d'un candidat. Or, la validité prédictive d'un entretien - i.e capacité à prédire la performance sur le long terme du candidat - atteint péniblement 0,20 points. Puisque la variance expliquée par un indice est la corrélation au carré - r² coefficient de détermination - le résultat de ces interviews n'expliquerait que 4% de la variation des performances ultérieures qui reste donc à 96 % totalement inexpliquée. L'intérêt de l'entretien de recrutement de face à face est illusoire² et même si nous en multiplions le nombre. Sa portée prédictive est tout juste égale à celle d'un tirage à pile ou face. Hume disait que la causalité ne faisait pas partie de la nature et n'était probablement rien d'autre "qu'un besoin de l'esprit humain" - Traité de la nature humaine - Notre obsession pour la recherche de causes est omniprésente mais pourrait bien être reléguée au second plan par l'avènement du Big Data.

 

Big Data : cause Killer

 

Avec le Big Data les corrélations seront bientôt tout autour de nous. Avec son déploiement nous ferons l'économie d'une recherche des causes. Non parce que nous nous serions soudainement départis de notre obsession, mais bien parce que nous ne pourront plus avoir accès aux causes. Les milliards de séries de données analysées conduiront à devoir changer de paradigme : l'importance quantitative entraînera un changement qualitatif dans notre façon d'extraire de nouvelles connaissances et donc de prendre des décisions. Notre compréhension du réel ne fera plus appel au pourquoi et nos interrogations causales seront remplacées par une attitude contemplative d'un résultat dont nous ne pourrons retracer les tenants mais seulement les aboutissants.

 

La recherche de la cause coute chère, prend du temps, mobilise des ressources et c'est bien là toute la suprématie du Big Data. Le Big Data permettra de recruter plus vite, des profils différents, de prédire le Turnover, de prévenir les crises et bien évidemment de avec moins de ressources RH. Exit les Recruteurs, bienvenu au Data Scientist ! Nous ne rechercherons plus à comprendre les raisons qui expliquent l'absentéisme mais nous nous contenterons de prédire quand et comment ce taux évoluera à l'aide de corrélations qui "marchent". Des menaces planent car les risques de discriminations existent. En effet, privés des causes qui expliquent la sélection, comment certifier que le choix du candidat a été fait sur la base de critères strictement en lien avec les besoins de l'emploi et des aptitudes nécessaires à la tenue du poste³ ? Comment opposer aux candidats non retenus qu'ils n'ont fait l'objet d'aucune discrimination ? Autant de problèmes auxquels les DRH devront demain se confronter.

 

 


¹http://tylervigen.com/spurious-correlations

²http://www.theguardian.com/lifeandstyle/2015/nov/22/why-job-interviews-are-pointless

³Rapport Lyon-Caen - La documentation Française - Paris 1992 - p.61



24/02/2016
0 Poster un commentaire
Ces blogs de Politique & Société pourraient vous intéresser

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 20 autres membres