Puzzles & casse-tête en bois gratuits à fabriquer, construire soi-même

Pourcentages, manipulation des chifres et le paradoxe de simpson

Un raisonnement mathématique est toujours présumé rigoureux et logiquement exact. Or ce n'est pas toujours le cas et les exemples sont nombreux où de grands mathématiciens, faisant confiance à leurs intuitions, ont publié des démonstrations, étayées par de longs raisonnements, qui semblaient vraies mais qui par la suite se sont révélées fausses à cause d'une faille de raisonnement qui peut provenir par exemple d'une évidence qui n'a pas été correctement traitée.

 

L'exemple le plus courant et classique qui illustre ce fait pour un collégien, est la division lorsqu'elle concerne un terme qu'on oublie de vérifier. Car pour que la division soit possible et valide, il doit être vérifié que ce terme est différent de 0.

Ou encore certains cas n'ont pas été envisagés et la démonstration n'est pas complète. Il suffit qu'une personne trouve un seul contre exemple pour infirmer une proposition tenue pour vrai.

Les failles et complétudes sont les cauchemars des théoriciens.

 

 

Mais certaines évidences le sont beaucoup moins dans les faits. La manipulation des nombres , des statistiques, des pourcentages (pourtant apparemment plus simples) comportent d'innombrables exemples d'erreurs courantes quelques fois volontaires.

L'exemple le plus connu: le pâté d'alouette qui est un mélange de 50% de cheval et 50% d'alouette avec 1 cheval pour 1 alouette montre bien le fonctionnement du détournement commercial d'une annonce en pourcentage sans préciser sur quelle caractéristique porte le pourcentage.

 

Vos étiquettes de produits quand elles donnent une formule en %, sont-elles en pourcentage de poids ou de volume parce que les chiffres ne sont pas les mêmes en fonction des densités?

En poids sec ou humide? il faut donc plusieurs précisions avant de conclure et les précisions ne sont pas sur l'étiquette...

 

Ce genre de détournement est quotidien dans la publicité et la soi-disant communication (qui par définition est l'art de cacher la vérité):

"utilisez mon produit il y a 95 % de satisfaits!" oui mais 95% de quoi ? De ceux qui ont été interrogés et justement on a exclus les cas de ceux qui ont développés une allergie, parce que par définition ils ne doivent pas utiliser le produit. Comment le savoir d'avance avant de tester un nouveau produit?

C'est comme les trains de la SNCF 90% des trains sont à l'heure oui mais un train supprimé n'est pas en retard il est considéré à l'heure puisque supprimé! Allez faire comprendre au voyageurs en panne sur le quai, que son train supprimé, lui il est à l'heure, et qu'à la limite en période de grêve aucun train ne circule mais tous sont à l'heure...

 

Un autre exemple si vous posez la question autour de vous:

"quel est le pourcentage de taxes sur l'essence en France?"

La réponse tombe immédiatement: 76 % et dans la tête des personnes qui vous répondent pour 1€ d'essence achetée il y a 76 centimes de taxes et 24 centimes d'essence parce que ce taux est annoncé et répété inlassablement dans les médias et par les membres du gouvernement. C'est le pourcentage sur le prix final.

Mais en réalité si pour 24 centimes d'essence on paie 76 centimes de taxes c'est qu'on est taxé à 76/24=316.66 % sur le prix initial, on a plus de trois fois plus de taxes que d'essence dans son réservoir.

En fait l'essence ne serait pas si cher si elle n'était pas surtaxée inutilement.

En même temps les produits de luxe comme l'or, le caviar et les diamants ne sont taxés actuellement et pour raisons européennes qu'à 25% de TVA du prix d'achat initial parce que 33% a été jugé trop élevé par la cour européenne.

 

Moralité l'essence est taxée douze fois plus pour les pauvres que l'or et les diamants pour les riches.

 

Quand on pense que les sans-culotte ont coupé des têtes pour protester contre la dîme et la gabelle! L'impôt sur le sel et la corvée d'entretien des routes alors que nous sommes aujourd'hui taxés pour notre essence et en plus prélevés à l'utilisation des autoroutes privatisés, par des sociétés qui se sont vus concédés des autoroutes qui ont été construites avec nos impôts!!

On voit l'intérêt de présenter un calcul de pourcentage de taxes pour l'essence sur le prix final plutôt que sur le prix initial.

 

Et représentez-vous que Versailles a été construit avec les taxes sur le sel, maximum 10g par habitant et par jour et qu'aujourd'hui c'est l'essence que l'on consomme à raison de  2.26 Kg par jour soit 226 fois plus, multiplié par  l’augmentation du nombre d’habitants depuis 1789 soit 2.25.

La république peut se construire 226*2.25= plus de 500 palais de Versailles rien qu'avec la taxe sur le pétrole.

 

Un chateau de Versaille pour chaque député pendant qu'un roi-président traite les cheminots de privilégiés pour supprimer leur régime spéciale de retraite mais en conservant le régime spéciale de retraite des ministres et des présidents successifs!!

 

N'oublions pas de relire  la constitution Française et sa  version actualisée qui donne au peuple le droit de prendre les armes contre un gouvernement inique...

 

Personne au gouvernement ne voit une contradiction dans le calcul de "l'age d'équilibre" des retraites qui va fluctuer selon des calculs non justifiés et surtout non prévisibles pour gérer le futur en proposant un calcul basé sur un avenir incertain et non défini sans y voir sa propre incompétence.

mais les gilets jaunes et les futurs retraités (les jeunes en somme) ont bien compris l'arnaque.

 

 

J'apprécie tout particulièrement les démonstrations d'Albert Jacquard, un généticien. Mais il manipulait les statistiques et les pourcentages et il donne deux exemples remarquables de simplicité et de clarté sur les dangers de la manipulations des nombres.

 

Le premier montre la différence fondamentale entre une cause et une conséquence avec un exemple évident:

Si vous faites des statistiques sur le nombre de semaines de vacances passés aux sports d'hivers prises par les parisiens en fonction de l'arrondissement où ils habitent en notant seulement le nombre de semaine de vacances en montagne et l'arrondissement du foyer vous allez assez facilement conclure qu'en habitant le 15° ou le 16° on prend plus de vacances que si l'on habite le 18° ou le 20°.

Prenez un foyer du 20° obligez-le à déménager dans le 16°; comment peut-on croire qu'on va lui donner la possibilité de prendre une semaine de plus pour ses vacances de sports d'hivers? C'est pourtant un raisonnement qui est très courant dans le milieu politique pour justifier des mesures basés sur des corrélations et non pas des conséquences.

Je peux trouver des raisonnements de ce calibre quasi quotidiennement à la Télé et dans la presse à sensation.

 

Le deuxième exemple est encore plus perturbant Albert Jacquard l'intitule les pièges de l'analyse des variations  (dans son livre "moi et les autres" encadré N°3 Page 40) je l'ai juste actualisé pour l'année et mis en €):

 

 En 2013, j'ai acheté chez mon libraire 20 livres de poches à 10€ et 20 livres d'art à 100€, soit une dépense totale de 2 200€.

En 2014, le prix des livres de poche a augmenté et atteint 15€, en revanche celui des livres d'art est revenu à 90€. J'achète 60 livres de poche et 15 livres d'art soit une dépense totale de 2 250€

Dans l'augmentation du prix de ma dépense (+50€) quelle est la part due à la variation des prix et celle due à la variation des quantités?

 

Répondre semble facile:

- Si les prix étaient restés ceux de 2013 pour 2014 le changement des quantités aurait entrainé une dépense de: (60*10)+(15*100)=2100€

donc une diminution de 100€

-Si les quantités étaient restées celles de 2013 pour 2014 le changement de prix aurait entrainé une dépense de: (20*15)+(20*90)=2100€

donc une diminution de 100€

 

Prises séparément les variations des prix et des quantités auraient provoquées une diminution de ma dépense et pourtant prises simultanément ces variations donnent une augmentation de 50€.

 

Une conclusion à l'opposée de l'intuition et de la logique et pourtant tout à fait calculable et démontrable. Comment cela est-il possible?

La réponse à cette question est une démonstration assez longue et se nome le paradoxe de Simpson.

 

Pris parmi des dizaines d’autres, voici trois cas réels où le paradoxe de Simpson a produit des surprises et a contraint à analyser plus finement ce que des manipulations statistiques imprudentes faisaient apparaître.

1) Aptitudes en progrès pour tous, mais dont la moyenne est stable.
Aux États-Unis, au cours des années 1981-2002, la moyenne des notes obtenues par les élèves soumis au test linguistiqueSAT (Scholastic Aptitude Test) a été stable,avec un résultat toujours proche de 504 points. Pourtant,durant cette période,la moyenne pour le test mesuré séparément par groupe ethnique s’est accrue dans chaque groupe d’au moins huit points.
Gerald Bracey, de l’Université George Mason, a étudié cet étrange phénomène et a conclu qu’on était là en présence d’un cas du paradoxe de Simpson. La clef de l’explication se trouve dans le fait que pendant la période considérée,le nombre d’élèves blancs soumis au test a proportionnellement décru, et que la proportion d’élèves appartenant à des minorités (réussissant en général moins bien le test linguistique) a augmenté,conduisant au total à une stagnation des résultats globaux qui, pourtant, progressaient dans chaque catégorie.


2) Mauvais taux de mortalité dans chaque tranche d’âge, mais globalement bons.

En 1986, Joel Cohen, de l’Université Rockefeller à New York, a identifié un cas réel de paradoxe de Simpson dans le domaine de la démographie. Il s’est intéressé à la mortalité au Costa Rica et en Suède (connue pour son excellente espérance de vie). Sans surprise, il a trouvé qu’en 1960,le taux de mortalité des femmes dans toute tranche d’âge fixée était supérieur au Costa Rica, comparé au taux équivalent en Suède. Pourtant, le taux de mortalité général des femmes au Costa Rica était inférieur à celui de la Suède.
L’explication est encore liée au paradoxe de Simpson, et elle provient de la structure différente des populations. La population du Costa Rica est beaucoup plus jeune en moyenne que celle de la Suède, et donc les jeunes classes d’âge (qui ont un faible taux de mortalité) pèsent plus dans la moyenne pour le Costa Rica que pour la Suède, conduisant à un taux de mortalité global assez faible au Costa Rica, malgré un taux assez mauvais dans chaque tranche d’âge.


3)En roulant plus vite, vous aurez moins d’accidents.

Gary Davis, de l’Université du Minnesota, étudiait en 2004 la relation entre le nombre d’accidents piéton véhicule et la vitesse moyenne des véhicules en divers endroits d’une ville. Il proposa une modélisation de cette relation qu’il voulait utiliser pour évaluer l’intérêt de limiter plus sévèrement la vitesse autorisée des véhicules. De façon inattendue, le modèle montrait qu’en faisant passer la limite de 30 miles par heure à 25, le nombre d’accidents augmenterait. Là encore, bien que pour chaque type de sites,le nombre d’accidents diminuait quand la vitesse limite était réduite, une agrégation malheureuse des données (qui ne prenait pas en compte que le nombre d’accidents était bien plus rares dans les zones résidentielles) engendrait une conclusion absurde

 

 La meilleure explication du paradoxe que j'ai pu lire est celle de  Jean-Paul Delahaye dans le magasine pour la science de juillet 2013 p80 à 85 (http://www.lifl.fr/~delahaye/pls/236.pdf). Qui finalement conclue en démontrant  que dans la plus-part des cas l'intuition est juste et que pour quelques cas rares (soit 8 cas sur 65 536) mais possibles, le paradoxe de Simpson fera que la logique est en contradiction avec l'intuition.

En gros il suffit de choisir deux populations (même en quantités égales) qui ont des propriétés opposées et/ou corrélées avec des causes (indirectes ou non révélées) pour voir apparaître des conclusions apparemment saugrenues.

Donc lorsqu'on tire des conclusions sur les statistiques et l'analyse de variations il faut vérifier que l'on ne rentre pas dans un de ces cas exceptionnels du paradoxe de Simpson ce qui complique beaucoup une démonstration initialement simple et intuitive, habituellement acceptée sans ces précautions. A l'inverse un manipulateur mal intentionné peut volontairement entrainer un public non averti à admettre des assertions fausses par une démonstration apparemment logique et mathématique.

 

Pour débusquer le paradoxe de Simpson il faut un mathématicien de haut vol doublé d'un spécialiste de la discipline étudiée! Or les études de tous poil ne sont jamais confiées à ces personnes, on se contente des spécialistes du domaine technique qui justement peuvent tomber (volontairement ou non) dans le domaine du paradoxe quand ça les arrangent.

 

 

C'est un cas particulièrement fréquent dans la publicité et les présentations de résultats d'essais clinique par les laboratoires pharmaceutiques de l'efficacité des médicaments (par exemple pour l'efficacité par rapport aux placébos) alors qu'ils sont souvent tout à fait conscients de leur trucage volontaire ou plus rarement retenu accidentellement parce qu'il va un sens favorable.

 

 

 Pour mieux illustrer ce propos en utilisant les exemples donnés dans cet article choisissons (ou si cela arrive fortuitement) cent hommes qui habitent le 15° ou le 16° arrondissement de Paris et cent Femmes qui habitent aussi Paris mais dans le 18° ou le 20°, mais si  vous ne faites  état dans la présentation de l'étude que du seul fait d'être Parisien sans préciser l'arrondissement:

si vous présentez le nombre de semaines de vacances passés aux sport d'hivers il va immédiatement apparaitre dans votre étude qu'à Paris les hommes vont plus  souvent aux sports d'hivers que les femmes.  Mais est-ce directement lié au sexe?

 

Bien évidemment non, mais la démonstration fausse peut être tentée par un manipulateur selon ses intérêts.

 

Ce genre de manipulation est couramment pratiquée intentionnellement par les révisionnistes, racistes, religieux,  politiques, marchants, journalistes et communicants de tout poil pour vous amener à douter de vos propres convictions pour adopter des conclusions contraires à la réalité. Savoir les débusquer et les contredire n'est jamais facile et demande toujours un effort de réflexion, d'analyse des conditions initiales et du raisonnement dans tous ses détails. C'est loin d'être le soucis de nos journalistes toujours en recherche de sensationnel lorsqu'ils rapportent de telles inepties colportées par des marchants de tous poils.

Remplacez les semaines de vacances par une réaction à un médicaments le sexe par une sensibilité à une maladie et concluez en fonction de vos intérêts.

Amusez-vous à relever les erreurs dans les conclusions des manipulations des chiffres de nos hommes politiques et nos publicitaires dans nos sources d'informations quotidiennes (télé, journaux, etc...) et le peu de précautions de nos "journalistes" (On devrait d'ailleurs plutôt dire des "commentateurs" ou "présentateurs" quand ils n'ont jamais sorti leurs fesses de leur fauteuil).

 
 Le  paradoxe de Simpson en 14 minutes par sciences étonnantes
Le  paradoxe de Simpson en 9 minutes par Arte

 

C'est pour cela qu'un nouveau théorème ou une nouvelle démonstration avant d'être adoptée est soumise à un comité indépendant de l'auteur qui évalue les conclusions et la démonstration afin de vérifier la possibilité d'une faille dans la démonstration et les cas sont nombreux où même une intuition exacte a due être complétée, quelque fois à plusieurs reprises, avant d'être considérée comme complète et démontrée.

 

Une autre vidéo sur les petits soucis dans l'utilisation des statistiques avec un " simple tableau excels".

Où on découvre que  le but de la recherche peut être influencé par la manière dont on organise les données au départ.

 

 

On sait depuis  Kurt Gödel que:

Une théorie suffisante pour faire de l'arithmétique est nécessairement incomplète, au sens où il existe dans cette théorie des énoncés qui ne sont pas démontrables et dont la négation n'est pas non plus démontrable : c'est-à-dire qu'il existe des énoncés que l'on ne pourra jamais déterminer en restant dans le cadre de la théorie. Sous le même genre d'hypothèses sur les théories considérées, le second théorème affirme qu'il existe un énoncé exprimant la cohérence de la théorie – le fait qu'elle ne permette pas de démontrer tout, et donc n'importe quoi – et que cet énoncé ne peut pas être démontré dans la théorie elle-même. À cause des hypothèses des théorèmes, toute théorie qui prétend formaliser l'ensemble des mathématiques, comme la théorie des ensembles, est concernée.

 

Une heure quinze de débat sur le  théorème d’incomplétude de Godel (revenez plus tard ici si vous êtes mordu des maths)

 

 

 

Un exemple d'exagération d'un présentateur de la télévision:

Dès le premier vol de Dennis Tito passager payant le 25 avril 2001 dans l'espace pour 20 millions de dollars de l'époque, on peut l'entendre conclure sans rire "le tourisme de l'espace se démocratise".

 

 



17/01/2014
0 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 194 autres membres