Modèle urne pour anniversaire

Ce modèle de base de l`urne Pólya a été enrichi et généralisé à bien des égards. Nous revenons maintenant au problème plus général de la répartition du nombre de valeurs d`échantillonnage distinctes et de la répartition du nombre de valeurs d`échantillonnage exclues. Pour (i in D ), Let (Y_i ) dénote le nombre de fois que (i ) se produit dans l`exemple: [Y_i = # left{j in {1, 2, ldots, n }: X_j = iright} = sum_{j = 1} ^ n bs{1} (X_j = i) ] Rappelez-vous que (var (U) = sum_{i = 1} ^ m sum_{j = 1} ^ m cov (I_i , I_j) ). L`utilisation des résultats ci-dessus sur la covariance des variables d`indicateur et la simplification donne la variance de (U ). En outre, (var (V) = var (U) ) depuis (U + V = m ). Ceci suit immédiatement la définition de la distribution multinomiale, puisque ((X_1, X_2, ldots, X_n) ) est une séquence indépendante, et (x_i ) est distribué uniformément sur ( {1, 2, ldots, m } ) pour chaque (i ). Dans les statistiques, un modèle d`urne de Pólya (également connu sous le nom de régime d`urne de Pólya ou tout simplement comme urne de Pólya`s), nommé d`après George Pólya, est un type de modèle statistique utilisé comme cadre d`exercice mental idéalisé, unifiant de nombreux traitements. Pour (j in {0, 1, ldots, m } ), Let (I_j = bs{1} (Y_j = 0) ), la variable d`indicateur de l`événement qui (j ) n`est pas dans l`exemple. Notez que le nombre de valeurs de population manquantes dans l`échantillon peut être écrit comme la somme des variables d`indicateur: [u = sum_{j = 1} ^ m I_j ] étant donné que les échantillons sont distribués uniformément, (p (u = j) = # {u = j }/m ^ n ) et ainsi le résultat découle de l`exer précédent e.

la distribution du nombre de valeurs exclues peut également être obtenue par un argument de récursivité. La partie (a) découle de l`exercice précédent et de la représentation (U = sum_{j = 1} ^ n I_j ). La partie (b) suit la partie (a) depuis (U + V = m ). L`événement complémentaire (B ^ c ) se produit si et seulement si le vecteur de résultat (bs{X}) forme une permutation de taille (n ) à partir de ( {1, 2, ldots, m } ). Le nombre de permutations est (m ^ {(n)} ) et bien sûr le nombre d`échantillons est (m ^ n ). Notez que, dans un certain sens, le modèle de l`urne de Pólya est le «contraire» du modèle d`échantillonnage sans remplacement, où chaque fois qu`une valeur particulière est observée, il est moins susceptible d`être observé à nouveau, alors que dans un modèle d`urne de Pólya, une valeur observée est plus susceptible d`être observée d encore. Dans ces deux modèles, l`acte de mesure a un effet sur le résultat des mesures futures. (À titre de comparaison, lorsque l`échantillonnage avec remplacement, l`observation d`une valeur particulière n`a aucun effet sur la probabilité d`observer cette valeur à nouveau.) Notez également que dans un modèle d`urne de Pólya, les actes successifs de mesure au fil du temps ont de moins en moins d`effet sur les mesures futures, alors que dans l`échantillonnage sans remplacement, le contraire est vrai: après un certain nombre de mesures d`une valeur particulière, cette valeur sera ne jamais être revu.

admin