www.cmathematique.com



Page d'accueil - Cmathematique.com Consultez notre plan du site Écrivez-nous Obtenez de l'aide
forum bottin
Grands dossiers mathématiques Archives des chroniques Liens en math Coin culturel des mathématiques
   Liste des grands dossiers       Grille horaire   

Consultez l'horaire de diffusion

Diffuseurs de l'émission :

TFO
  
Canal Savoir


Kiosque en math
Kiosque en mathConsultez le kiosque des mathématiques de l'Agence Science-Presse.Vous y découvrirez une foule de références utiles sur le grand univers des mathématiques.


Concours mathématique
ConcoursParticipez au concours de Cmathematique.com
Relevez le défi et résolvez le problème du mois. Les meilleures solutions seront publiées sur le site. Concours du mois : les polygones "arithmétiques".


Sondage à propos de Cmathématique
Aidez-nous à mieux cerner vos besoins en répondant à ce sondage.


Capsules mathématiques
Capsules mathématiquesLes capsules mathématiques proposent des approfondissements sur des concepts en math dont il est question dans les grands dossiers.


Formation en ligne
Formation en ligneLe but de cette section est de vous donner des occasions ou des outils pour que vous puissiez trouver des réponses à vos interrogations au niveau de l'enseignement collégial des sciences.


Boutique
BoutiqueLes séries 1 et 2 de l'émission "C'est mathématique" sont maintenanten vente sur vidéocassettes.
Inscrivez-vous à notre liste d'envoi

Envoyez cette page à un ami


Capsule La mathématique des sondages d'opinion

Lors du recensement 2001, 20 % des 12 000 000 de ménages consultés ont répondu au questionnaire complet qui était fort élaboré. La question qui se pose naturellement est la suivante : si on avait demandé à tous les ménages de répondre au questionnaire complet aurait-t-on obtenu des informations plus précises sur la population canadienne? La réponse qui nous semble la plus sensée est qu'en négligeant 4 ménages sur 5 on a certainement perdu des informations importantes. Or, la réponse du statisticien est qu'on n'a rien perdu du tout! Nous allons expliquer, dans la présente capsule pourquoi il en est ainsi. Nous verrons aussi que ce n'est pas tellement le nombre de personnes interrogées qui est important mais plutôt la façon de choisir les individus composant l'échantillon.

1000 Québécois c'est le Québec!

Imaginons que suite au recensement canadien de 2001 le gouvernement du Québec ait décidé de profiter de l'existence d'une liste à jour de tous les habitants du Canada pour procéder à une expérience sans précédent qui lui permettrait de savoir à quoi ressemble réellement la population des gens du Québec ayant plus de 16 ans et cela en interrogeant seulement 1000 personnes.

Notons d'abord que mille québécois sur 7 millions c'est très peu en pourcentage : 1000/7 000 000 = 1/7000 ce qui représente entre 1/100 ième de 1 % et 2/100 de 1 %. C'est bien loin du 20 % de la population lors du recensement mais nous allons voir que c'est déjà suffisant pour affirmer certaines choses sur l'ensemble des québécois. Mais comment, à partir de la liste du recensement, choisir au hasard 1000 québécois?

Disons pour l'instant que pour qu'un échantillon de 1000 personnes soit réellement aléatoire, tout québécois doit avoir la même chance que tout autre de faire partie de cet échantillon. Ce principe est facile à énoncer mais il n'est pas facile à mettre en Œuvre. Voyons comment cela pourrait être fait à partir de la liste des personnes recensées au Québec.


1) On construit un programme informatique qui assignera à chaque québécois recensé au Canada un nombre entre 1 et 10 000 000 comme par exemple 3 766 940;
2) On construit un programme informatique qui choisira au hasard des nombres entre 1 et 10 000 0000;
3) Pour chaque nombre choisit au hasard on vérifie s'il correspond à une personne recensée ayant 16 ans ou plus;
4) On continue ainsi à construire l'échantillon jusqu'à ce que l'on ait 1000 personnes de sélectionnées.

Afin d'inciter les mille personnes sélectionnées à répondre à un questionnaire élaboré, le gouvernement du Québec aurait pu décider de les réunir dans différentes régions du Québec pour une grande fête. Cette réunion permettrait aussi d'expliquer le sens de ce sondage. Par exemple, dans la grande région de Montréal, la fête réunirait environ 500 personnes. Peut-on imaginer à quoi ressemblerait cette foule?

Même dans les lieux publics, la foule présente à un moment donné n'est jamais parfaitement diversifiée. Dans un avion, un train ou encore une station de métro, bien que l'échantillonnage soit très varié, celui-ci ne représente jamais parfaitement toute la population : par exemple, les personnes qui ne voyagent jamais ne seront pas représentées. On n'a jamais l'occasion, dans la vie normale, de rencontrer un échantillon aléatoire de 1000 personnes.

Dans notre échantillon idéal, il y aurait presque autant d'hommes que de femmes. Environ les deux tiers parleraient français. Il y aurait quelques personnes de races diverses. Une majorité de gens jeunes mais aussi beaucoup de gens âgés. Mais pourquoi peut-on affirmer que les conclusions basées sur cet échantillon de 1000 personnes seraient significatives pour l'ensemble du Québec? C'est cette question qui est au cŒur du concept de sondage et à laquelle il n'est pas facile d'y répondre. Pour y arriver, sans entrer dans tous les détails mathématiques requis, nous allons utiliser un exemple qui, à première vue, vous semblera bien loin de la question posée. Mais nous verrons par la suite que cet exemple est pertinent pour comprendre les sondages.

Si je lance une pièce de monnaie 10 fois de suite, combien de côté Face peut-on obtenir? Ce sera nécessairement 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 Face. Et quelle est la probabilité que ce soit zéro Face? Pour que cet événement survienne, on doit obtenir dix fois Piles en dix lancers. La probabilité d'obtenir 10 Pile de suite est égale à : 1/2 x 1/2 x ... x 1/2 = (1/2)^10 = 0,000 076 c'est-à-dire un peu moins d'une chance sur mille.

Pour bien comprendre ce dernier calcul, il peut être utile de penser au lancer d'une pièce deux fois au lieu de dix fois. Dans ce cas, il n'y aurait que quatre résultats possibles : (pile, pile), (pile, face), (face, pile) et (face, face) et, admettant que tous ces résultats sont équiprobables, la probabilité de deux piles serait égale à ½ x ½ = ¼.

Quelle est maintenant la probabilité d'obtenir exactement une fois Face en dix lancers. Intuitivement on sent que cette probabilité sera supérieure à celle d'obtenir zéro Face car le Face pourrait survenir à n'importe quel moment. Remarquez qu'il y a dix façons différentes d'obtenir ce résultat. Nous pouvons obtenir Face au premier lancer, au deuxième, au troisième et ainsi de suite. Et quelle est la probabilité d'obtenir l'un de ces résultats ? Chacun de ces résultats a une probabilité égale à (½)^10. Comme il y a dix façons différentes d'obtenir un Face en dix lancers la probabilité de cet événement sera 10 x (½)^10 = 0,009 76. Par des calculs semblables on pourrait calculer la probabilité d'obtenir exactement deux Face en dix lancers, la probabilité de trois Face et ainsi de suite. Le tableau ci-dessous résume ces différentes probabilités.

Nombre de Face
en dix lancers
Probabilité
0 0,000976
1 0,00976
2 0,04392
3 0,11712
4 0,20495
5 0,24595
6 0,20495
7 0,11712
8 0,04392
9 0,00976
10 0,000976

Voici un graphique illustrant ces résultats :

On remarque dans ce graphique que la hauteur de chaque rectangle est proportionnelle à la probabilité qu'a cet événement de survenir.

En examinant le tableau précédent on peut répondre à certaines questions. On peut, par exemple, se demander qu'elle est la probabilité d'obtenir quatre, cinq ou six Face en dix lancers. Il suffit d'additionner les probabilités respectives de ces résultats : 0,20496 + 0,24595 + 0,20496 = 0,65587.

Si on cherche maintenant la probabilité d'obtenir 60 % de Face ou moins en dix lancers il suffira d'additionner les sept premiers résultats dans le tableau précédent. On obtient alors 0,827646.

Pourrait-on maintenant calculer la probabilité d'obtenir 60 % ou moins de Face en 20 lancers? En 30 lancers? En 300 lancers? Nous ne ferons pas ces calculs mais nous allons résumer les résultats que l'on obtiendrait dans le tableau ci-dessous.

Nombre de lancers Probabilité d'obtenir
60 % de Face ou moins
10 0,827
20 0,870
50 0,919
60 0,939
70 0,952
80 0,963
90 0,971
100 0,977
200 0,998
300 0,999
500 0,9999
1000 0,99999

Voici un graphique illustrant ces résultats :

Si on regarde le tableau et/ou le graphique ci-haut, que constate-t-on? Cela saute aux yeux : plus le nombre de lancers est grand, moins on a de chances de dépasser les 60 % de Face. Pour mille lancers, on aurait moins d'une chance sur un million d'obtenir plus de 60 % de Face. Tout cela est lumineux mais quel est le lien avec les sondages? Nous y arrivons justement?

Imaginons qu'une question du questionnaire à laquelle auraient répondu nos mille personnes de l'échantillon soit la suivante : Possédez-vous un lien Internet à la maison?
Imaginons maintenant que 610 personnes sur 1000 aurait répondu oui à cette question. Imaginons maintenant l'hypothèse suivante : Dans l'ensemble du Québec il n'y a que 50 % des québécois qui sont branchés à Internet à la maison.

À la lumière des résultats du sondage, prenez quelques instants pour réfléchir à cette hypothèse en vous demandant si elle est vraie ou fausse. Vous aurez probablement fait le raisonnement suivant : si effectivement il n'y avait que 50 % de gens branchés alors chaque personne de notre échantillon avait une chance sur deux de répondre oui à la question (c'est exactement comme le jeu de Pile ou Face). Dans ces conditions, il y aurait moins d'une chance sur un million que 610 personnes répondent oui à la question!
Ainsi, en affirmant que dans la population québécoise il y a plus de 50 % de gens branchés à la maison on aurait une chance infime de se tromper.

Voyez-vous qu'à partir d'un petit échantillon aléatoire on peut arriver à dire des choses sur la population entière?

Bien entendu les statisticiens arrivent à dire des choses bien plus précises à partir de leurs sondages mais pour cela ils sont obligés d'utiliser des résultats mathématiques que nous ne développerons pas ici. Nous n'avons fait que donner un exemple simple de ce que l'on appelle l'inférence statistique. Nous donnons ci-dessous, sans justification cette fois, un exemple de résultat plus précis.

Reprenons le même exemple en supposant que 600 personnes ait répondu oui à la question. On pourrait alors affirmer, avec seulement 5 chances sur 100 de se tromper, que dans la population entière il y a entre 57 % et 63 % des gens qui possèdent un lien Internet à la maison. Par ailleurs, si on désire une plus grande certitude l'intervalle va grandir. Ainsi, on pourrait affirmer, avec seulement 1 chance sur 100 de se tromper, que dans la population entière il y a entre 55 % et 65 % des gens qui possèdent un lien Internet.

Une autre façon d'augmenter la précision de notre estimation du pourcentage de personnes dans la population entière possédant un lien Internet serait d'augmenter la grandeur de l'échantillon. Ainsi, si l'échantillon comprenait 10000 personnes et si 6000 personnes d'entre elles avaient affirmé posséder une connexion Internet, on aurait alors 5 chances sur 100 de se tromper en affirmant qu'il y a, dans la population entière, entre 59 % et 61 % qui possèdent un lien Internet.

Terminons cette capsule en disant ceci : La statistique est un ensemble d'outils mathématiques qui permettent d'avoir une maîtrise sur des phénomènes, malgré la variabilité qui leur est inhérente? Nous traiterons de cette notion de variabilité dans une autre capsule mathématique.




Ce site est la propriété de
Collaboration Réalisation et hébergement
Net Communications Inc.
Production
Avec l'aide financière du une initiative de Vidéotron.

© 2001 - 2004 Téléfiction Productions Inc. Tous droits réservés