Procédure Poisson

Une procédure de Poisson est un modèle de progression d’une occasion discrète où le temps normal entre les occasions est connu, mais où la planification minutieuse des occasions est arbitraire. L’apparition d’une occasion est autonome par rapport à l’occasion précédente (le temps d’attente entre les occasions est sans mémoire). Par exemple, supposons que nous revendiquions un site dont notre arrangement de transport de substance (CDN) nous fait savoir qu’il descend tout ce qui est considéré une fois tous les 60 jours, cependant une déception n’influence pas la probabilité de ce qui suit. Tout ce que nous savons, c’est le délai normal entre les déceptions. C’est une procédure de Poisson qui ressemble à cela :

Le point important est que nous connaissons le temps normal entre les occasions, mais qu’elles sont arbitrairement séparées (stochastique). Nous pouvons avoir des déceptions consécutives, mais nous pouvons également passer beaucoup de temps entre les déceptions en raison du caractère aléatoire de la procédure.

Une procédure de Poisson répond aux critères qui l’accompagnent (en réalité, de nombreuses merveilles affichées sous forme de formulaires de Poisson ne répondent pas précisément à ces critères) :

Les occasions sont libres les unes des autres. L’événement d’une occasion n’influence pas la probabilité qu’une autre occasion se produise.

Le taux normal (nombre de fois par période) est constant.

Deux occasions ne peuvent pas se produire simultanément.

Le dernier point – les occasions ne sont pas synchrones – implique que nous pouvons considérer chaque sous-intervalle d’une procédure de Poisson comme un préliminaire de Bernoulli, c’est-à-dire soit un triomphe soit une déception. Avec notre site, l’ensemble de la période intermédiaire pourrait être de 600 jours, mais chaque sous-période intermédiaire – à un moment donné – notre site s’arrête ou ne s’arrête pas.

Les cas normaux de formes de Poisson sont les clients appelant un centre d’assistance, les invités sur un site, la pourriture radioactive dans les molécules, les photons atterrissant dans un télescope spatial, et l’évolution d’un coût de stock. Les formes de Poisson sont pour la plupart liées au temps, mais elles n’ont pas besoin de l’être. Dans le cas du stock, nous pouvons connaître l’évolution normale chaque jour (occasions par temps), mais nous pourrions également avoir une procédure de Poisson pour le nombre d’arbres dans une section de terrain (occasions par territoire).

(Un exemple souvent donné pour une Procédure de Poisson est celui des apparences de transport (ou des trains ou maintenant des Ubers). Néanmoins, il ne s’agit pas d’une véritable procédure de Poisson, car les comparutions ne sont pas exemptes les unes des autres. En tout état de cause, les cadres de transport qui ne se déroulent pas dans les délais prévus, qu’un transport soit en retard ou non, influencent l’heure d’apparition du transport suivant. Jake VanderPlas a un article incroyable sur l’application d’une procédure de Poisson aux temps d’apparition des transports qui remue de préférence avec des informations inventées plutôt que des informations vraies).

Transport de poissons

La procédure de Poisson est le modèle que nous utilisons pour décrire des événements qui se produisent au hasard et qui, sans l’apport de quiconque, n’ont pas une valeur déraisonnable. Nous avons besoin de la Dispersion de Poisson pour accomplir des choses intrigantes comme trouver la probabilité de diverses occasions dans un laps de temps ou trouver la probabilité d’attendre un certain temps jusqu’à l’occasion suivante.

La capacité de masse de la probabilité de diffusion du poison donne la probabilité d’observer k occasions dans un laps de temps donné, compte tenu de la durée de la période et des occasions normales par temps :

Ce paramètre est quelque peu embrouillé, et les occasions/temps * durée sont normalement rationalisés en un paramètre solitaire, λ, lambda, le paramètre de taux. Avec cette substitution, le travail sur la probabilité de la circulation de Poisson n’a actuellement qu’un seul paramètre :

Le lambda peut être considéré comme le nombre normal d’occasions dans l’intervalle. (Nous appellerons cela une période intérimaire pour rappeler que nous n’avons pas besoin de délai, nous pourrions utiliser la région ou le volume en fonction de notre procédure de Poisson). J’aime bien calculer le lambda pour me rappeler que le paramètre de taux est un élément à la fois des occasions normales par temps et de la durée du délai, mais vous le considérerez le plus souvent comme étant directement au-dessus.

En changeant le paramètre du taux, λ, nous modifions la probabilité de voir différentes quantités d’occasions en une seule fois. Le graphique ci-dessous représente la capacité de masse de probabilité de l’appropriation de Poisson, indiquant la probabilité que diverses occasions se produisent dans une période intermédiaire avec divers paramètres de taux.

Le nombre de fois où il est probable qu’il y ait eu un écart entre les deux courbes est le paramètre de taux. Cela est de bon augure, car le paramètre de taux est le nombre normal d’occasions dans l’intervalle et, de cette façon, lorsqu’il s’agit d’un nombre entier, le paramètre de taux sera le nombre d’occasions ayant la meilleure probabilité.

Lorsqu’il ne s’agit pas d’un nombre entier, la probabilité la plus élevée d’un certain nombre d’occasions sera le nombre le plus proche du paramètre de taux puisque la circulation de Poisson est caractérisée pour un nombre discret d’occasions. L’idée discrète de la circulation de Poisson est en outre la raison pour laquelle il s’agit d’une capacité de masse de probabilité et non d’un travail d’épaisseur. (Le paramètre de taux est en outre la moyenne et le changement de la circulation, qui ne doivent pas être des nombres entiers).

Nous pouvons utiliser la capacité de masse du Poisson Conveyance pour découvrir la probabilité d’observer à diverses occasions un intervalle créé par une procédure de Poisson. Une autre utilisation de la condition de travail en masse – comme nous le verrons plus tard – consiste à découvrir la probabilité de rester en attente pendant un certain temps entre deux occasions.

Un modèle qui fonctionne

Pour la question que nous allons éclairer par une dispersion de Poisson, nous pourrions procéder par déceptions de sites, mais je propose quelque chose de plus excellent. Dans ma jeunesse, mon père m’emmenait régulièrement dans notre cour pour regarder (ou essayer de regarder) les pluies de météores. Nous n’étions pas des intellos de l’espace, mais il suffisait de regarder des articles provenant d’une épave spatiale dans le ciel pour nous faire sortir, malgré le fait que les pluies de météores semblaient toujours se produire pendant les mois les plus froids.

Le nombre de météores observés peut être affiché comme une dispersion de Poisson, étant donné que les météores sont autonomes, que le nombre normal de météores par heure est stable (pour le moment) et – c’est une estimation – que les météores ne se produisent pas tout le temps. Pour représenter le transport de Poisson, tout ce dont nous avons besoin est le paramètre de taux qui est la quantité d’occasions/intermédiaire * durée intermédiaire. Si je me souviens bien, on nous a conseillé d’attendre 5 météores par heure en gros ou 1 comme une horloge. En raison de la tolérance limitée d’un petit jeune (en particulier lors d’une nuit de consolidation), nous ne sommes jamais restés dehors plus d’une heure, donc nous utiliserons cette durée comme durée intermédiaire. En assemblant les deux, nous obtenons :

Que signifie précisément “5 météores prévus” ? Tout bien considéré, comme l’a indiqué mon cynique père, cela impliquait que nous verrions 3 météores en 60 minutes, maximum. À l’époque, je n’avais pas de compétences en sciences de l’information et je me suis confié à son jugement. Maintenant que je suis plus établi et que j’ai une bonne dose de suspicion envers les figures de pouvoir, c’est l’occasion idéale de soumettre son annonce à un examen sérieux. Nous pouvons utiliser le transport de Poisson pour découvrir la probabilité de voir précisément 3 mètres en une seule heure de perception :

14%, soit environ 1/7. Si par hasard nous sortions régulièrement pendant plusieurs semaines, nous pouvions alors prévoir que mon père aurait raison une fois pour toutes ! Bien que cela soit agréable à savoir, ce que nous recherchons, c’est la diffusion, la probabilité de voir diverses quantités de météores. Faire cela à la main est ennuyeux, donc nous utiliserons Python – que vous pouvez trouver dans ce Jupyter Scratchpad – pour le calcul et la perception.

Le diagramme ci-dessous montre la capacité de masse de probabilité pour le nombre de météores dans une heure avec un temps normal entre les météores de 12 minutes (ce qui équivaut à dire 5 météores attendus en 60 minutes).

C’est ce que signifie “5 occasions anticipées” ! Le nombre probable de météores est de 5, le paramètre de vitesse de la dispersion. (En raison d’une excentricité des nombres, 4 et 5 ont une probabilité similaire, 18%). De même, avec tout moyen de transport, il y a une estimation de la probabilité, mais il y a en plus un large éventail de qualités potentielles. Par exemple, nous pourrions sortir et voir 0 météore, ou nous pourrions en voir plus de 10 toutes les 60 minutes. Pour découvrir les probabilités de ces occasions, nous utilisons une condition similaire, mais cette fois-ci, nous vérifions des probabilités entières (voir le bloc-notes pour les subtilités).

Nous avons précédemment déterminé que la possibilité d’envisager précisément d’être des météores était d’environ 14%. La possibilité de voir 3 météores ou moins en une seule heure est de 27%, ce qui implique que la probabilité d’en voir plus de 3 est de 73%. De même, la probabilité de voir plus de 5 mètres est de 38,4% alors que nous pourrions espérer voir 5 météores ou moins en 61,6% des heures de perception. Malgré le fait que c’est peu, il y a 1,4% de possibilité de voir plus de 10 mètres en 60 minutes !

Pour imaginer ces situations potentielles, nous pouvons procéder à un examen en demandant à notre sœur d’enregistrer le nombre de météores qu’elle voit chaque heure pendant 10 000 heures. Les résultats apparaissent dans l’histogramme ci-dessous :