Articles voisins
Recherche Encarta
Rechercher dans Encarta des informations sur statistiques

Résultats avec Windows Live® Search

Afficher tous les résultats dans le contenu
Résultats avec Windows Live® Search

statistiques

Article
Médias
Tableau de répartition d’effectifTableau de répartition d’effectif
Plan de l'article
1

Présentation

statistiques, branche des mathématiques qui a pour objet la collecte, le traitement et l’analyse de données numériques relatives à un ensemble d’objets, d’individus ou d’éléments.

La statistique constitue un outil précieux pour l’expérimentation de projets, la gestion des entreprises ou encore l’aide à la décision. Une recherche statistique se décompose en quatre étapes : la définition et la collecte des données, leur présentation en tableaux, leur analyse, et enfin la comparaison des résultats avec des lois statistiques connues.

2

Historique

Au IIe millénaire av. J.-C., les Chinois étudient déjà les chiffres de leurs productions agricoles, tandis que les Égyptiens organisent des recensements de leur population. La Bible mentionne également dans le Livre des Nombres et dans le Livre des Chroniques des travaux statistiques. Dans l’Antiquité, Grecs et Romains recueillent des données chiffrées relatives à la population. Le gouvernement de Rome procède en particulier au premier recensement de l’histoire à grande échelle, répertoriant aussi la richesse de ses territoires.

Le Moyen Âge connaît très peu de recensements. Au viiie siècle, Charlemagne commande des relevés des propriétés ecclésiastiques. Quelque trois siècles plus tard, Guillaume Ier le Conquérant ordonne en 1086 le recensement de toutes les terres anglaises. Les informations recueillies à cette occasion sont consignées dans un recueil cadastral, le Domesday Book.

Au début du xvie siècle, on commence à tenir en Angleterre un registre des décès et des naissances. En France, les intendants Sully, Colbert et Vauban commandent de nombreux inventaires et enquêtes. En 1662, l’Anglais John Graunt constate une certaine constance dans le rapport du nombre de naissances féminines à celui des naissances masculines. Cette observation est le prélude aux développements du xviiie siècle qui voient les statistiques servir de base à des prévisions. Mais c’est seulement au xixe siècle qu’on découvre que la théorie des probabilités constitue une aide précieuse à la méthode statistique. Ce rapprochement, déjà perçu par Laplace, est l’œuvre d’Adolphe Quételet, statisticien belge qui est à l’initiative du premier congrès international de statistiques en 1853. Dès lors, la statistique se développe dans la plupart des sciences, donnant notamment naissance à la mécanique statistique.

Aujourd’hui, les statistiques sont considérées comme des outils fiables qui peuvent fournir une représentation et une interprétation de données économiques, politiques, sociales, psychologiques, biologiques ou physiques. Elles permettent de mettre en corrélation de telles données et de les analyser. Le travail du statisticien ne se limite plus, en effet, à recueillir des données et à les présenter sous forme de tableaux ou de graphiques comme autrefois. Désormais, il consiste principalement à interpréter l’information. Par ailleurs, l’élaboration de la théorie des probabilités a considérablement élargi le champ des applications statistiques. Les probabilités permettent, par exemple, de vérifier la fiabilité des conclusions statistiques, ou encore d’indiquer la nature et le nombre de données nécessaires à la résolution d’un problème particulier.

3

Méthodes statistiques

3.1

Définition et collecte des données

Le point de départ d’une analyse statistique est constitué d’ensembles de nombres, obtenus en comptant ou en mesurant les éléments faisant l’objet de l’étude. Lors de la collecte de données statistiques, il convient donc, en premier lieu, de s’entourer de précautions afin de s’assurer de l’exhaustivité et de la justesse des informations recueillies.

Le premier problème auquel est confronté le statisticien est de définir la nature et la quantité des données à recueillir. Lorsque, par exemple, il souhaite réaliser un sondage d’opinion, il n’est pas aisé de sélectionner un échantillon susceptible de représenter la population dans son ensemble.

Pour établir une loi physique, biologique ou sociale, le statisticien a la possibilité de commencer par étudier un ensemble de données, qu’il modifiera peu à peu en fonction de l’expérience acquise. Ainsi, lors des premières études sur la croissance démographique, on prévoit l’évolution de la taille de la population en calculant le nombre de naissances excédentaires par rapport aux décès sur une période donnée. Mais on s’aperçoit bien vite que le nombre de décès n’entre pas en ligne de compte. On calcule alors l’évolution de la croissance démographique en se fondant sur le nombre de naissances survenues en un an parmi 1 000 individus. Lorsque les prévisions obtenues par cette méthode ont débouché sur des conclusions erronées, on comprend qu’il existe d’autres facteurs qui limitent la croissance démographique. En effet, le nombre de naissances possibles dépend davantage du nombre de femmes et du nombre total d’habitants ; par ailleurs, les femmes ne peuvent enfanter que pendant une partie de leur vie. Aujourd’hui donc, pour calculer l’évolution démographique, on se fonde sur le nombre de naissances survenues au sein d’un groupe de 1 000 femmes en âge de procréer. Par ailleurs, on peut affiner la valeur prévisionnelle de cette donnée de base en la combinant à d’autres données, comme celle relative au pourcentage de femmes sans enfant.

Lorsque le statisticien a défini la nature et le nombre des données à recueillir, il peut alors procéder à leur recensement. Cette collecte s’effectue en général par sondage, par mesures, ou encore par échantillonnage. Les données recensées peuvent faire, par mesure de sécurité, l’objet d’une vérification partielle.

3.2

Représentation des données

Les données recueillies sont alors classées et rangées dans des tableaux de façon à permettre une analyse et une interprétation directes. Prenons l’exemple d’un ensemble de notes obtenues par une classe de 30 élèves lors d’un examen, ces notes étant notées sur 100. Commençons par ranger ces notes dans l’ordre croissant : 30, 35, 43, 52, 61, 65, 65, 65, 68, 70, 72, 72, 73, 75, 75, 76, 77, 78, 78, 80, 83, 85, 88, 88, 90, 91, 96, 97, 100, 100. Cette suite permet de voir au premier coup d’œil que le maximum obtenu est 100, le minimum 30 et que l’étendue, qui correspond à la différence entre les deux valeurs extrêmes, est de 70.

En statistique, on appelle effectif le nombre d’éléments du même type. Dans le cas présent, un effectif représente donc le nombre d’élèves qui ont eu la même note. Reportons alors ces notes sur un graphique des effectifs cumulés, qui illustre le nombre de notes inférieures ou égales à une valeur donnée, où les notes sont indiquées sur l’axe horizontal tandis que le nombre cumulé des notes est reporté sur l’axe des ordonnées. À droite de cet axe est précisé le pourcentage correspondant par rapport à l’effectif total. Chaque point du graphique représente, par conséquent, le nombre ou le pourcentage d’élèves qui ont obtenu une note inférieure ou égale à une valeur donnée. Ainsi, le point A correspond au nombre de notes inférieures ou égales à 72. Si l’on observe l’axe vertical, on voit immédiatement qu’il y a 12 notes dans ce cas, soit 40 p. 100 des notes au total.

Un quartile est l’une des 3 valeurs qui divisent la répartition des données en quatre parties égales. Le quartile inférieur est la plus basse de ces valeurs, le quartile supérieur la valeur la plus élevée. Ici, le quartile inférieur représente donc la note correspondant à 25 p. 100 de l’effectif total. Il vaut 65, ce qui signifie qu’un quart des élèves a obtenu une note inférieure ou égale à 65.

Considérons à présent l’ensemble des notes obtenues par 10 groupes de 30 élèves à quatre épreuves, soit au total 1 200 notes. Le nombre de données est alors trop élevé pour être facilement représenté sur un graphique. Les statisticiens répartissent donc les données en groupes plus adaptés, appelés classes. Par exemple, on peut répartir les 1 200 notes en dix classes, comme dans la colonne (a) du tableau de répartition des effectifs. La colonne (c) contient le nombre de valeurs contenues dans une classe, nombre appelé effectif de la classe. Ainsi, la valeur située en haut de cette colonne (c) indique qu’il y a 20 notes comprises entre 0 et 10, les nombres qui définissent l’intervalle de chaque classe étant ses bornes. Il est pratique de choisir ces bornes de sorte que les classes soient toutes de même amplitude et que leurs milieux soient des nombres entiers, appelés centres. Une note limite comme 90 est située à la fois dans la classe 80-90 et dans la classe 90-100. La fréquence relative, illustrée par la colonne (e), représente le rapport de l’effectif d’une classe sur le nombre total de données (ici, 1 200 notes). L’effectif cumulé, reporté dans la colonne (d), correspond au nombre d’élèves ayant eu des notes inférieures ou égales à la borne supérieure de la classe correspondante. Par conséquent, on obtient le nombre d’élèves ayant eu des notes égales ou inférieures à 30 en additionnant les fréquences de la colonne (c) pour les trois premières classes, ce qui fournit un total de 53. La fréquence relative cumulée, colonne (f), est le rapport de l’effectif cumulé au nombre total de notes.

On peut représenter graphiquement les données du tableau de répartition des effectifs sur un histogramme ou à l’aide d’un polygone des effectifs cumulés. Un histogramme est constitué d’une série de rectangles dont les bases sont égales à l’amplitude des classes et dont les hauteurs sont proportionnelles aux effectifs de chaque classe. Un polygone des effectifs cumulés s’obtient en reliant par des segments les milieux des bases supérieures des rectangles d’un histogramme des effectifs cumulés.

3.3

Analyse des données

Page précédente
|
Page suivante
Rechercher dans tout le texte de l'article
Afficher cet article au format imprimable
Envoyer




© 2008 Microsoft