Dans le domaine de l’information, un modèle mixte est un modèle probabiliste permettant de parler de la proximité de sous-populations au sein d’une population générale, sans qu’il soit nécessaire qu’une collection d’informations surveillée distingue la sous-population à laquelle une perception individuelle a une place. Officiellement, un modèle mixte se rapporte à la circulation mixte qui parle de la dispersion probable des perceptions dans la population générale. Quoi qu’il en soit, alors que les questions liées aux “appropriations de mélanges” s’identifient à la déduction des propriétés de la population générale à partir de celles des sous-populations, les “modèles de mélanges” sont utilisés pour faire des déductions mesurables sur les propriétés des sous-populations étant donné les perceptions justes sur la population mise en commun, sans données sur les caractéristiques des sous-populations.

Les modèles de mélange peuvent être actualisés de différentes manières, notamment par des étapes qui transforment les caractères des sous-populations en perceptions singulières (ou en charges vers ces sous-populations), auquel cas ils peuvent être considérés comme des sortes de systèmes d’apprentissage en solo ou de regroupement. En tout état de cause, toutes les techniques de déduction ne comportent pas de telles avancées.

Les modèles de mélange ne doivent pas être confondus avec les modèles d’information compositionnelle, c’est-à-dire d’information dont les segments sont obligés de s’agréger pour obtenir une valeur stable (1, 100%, etc.). En tout état de cause, les modèles de composition peuvent être considérés comme des modèles de mélange, dans lesquels des individus de la population sont examinés sans but. D’un autre côté, les modèles de mélange peuvent être considérés comme des modèles de composition, où toute la population hors gabarit est normalisée à 1.

Modèle général de mélange

Un modèle commun de mélange dimensionnel limité est un modèle à plusieurs niveaux comprenant des segments d’accompagnement :

N variables irrégulières qui sont surveillées, chacune étant dispersée par un mélange de K segments, les segments ayant une place avec le groupe paramétrique équivalent de diffusion (par exemple, tous ordinaires, tous Zipfian, etc.) mais avec divers paramètres

N des facteurs inertes arbitraires indiquant le caractère de la partie mélange de chaque perception, chacun étant approprié par un moyen de transmission sans limite en dimension K

Beaucoup de charges de mélange K, qui sont des probabilités qui s’additionnent à 1.

Un grand nombre de paramètres K, chacun déterminant le paramètre du segment de mélange de comparaison. En règle générale, chaque “paramètre” est en réalité un grand nombre de paramètres. Par exemple, si les parties de mélange sont des appropriations gaussiennes, il y aura une moyenne et un changement pour chaque segment. Dans le cas où les parties de mélange sont toutes des disséminations de sortie (par exemple, lorsque chaque perception est un jeton d’un ensemble limité de lettres de taille V), il y aura un vecteur de probabilités V s’ajoutant à 1.

En outre, dans un cadre bayésien, les charges et paramètres de mélange seront eux-mêmes des facteurs arbitraires, et les disséminations antérieures seront placées au-dessus des facteurs. Dans un tel cas, les charges sont généralement considérées comme un vecteur arbitraire de dimension K tiré d’une circulation de Dirichlet (le conjugué le plus ancien de l’appropriation pure et simple), et les paramètres seront transmis par leurs antécédents conjugués individuels.

Sur le plan scientifique, un modèle paramétrique fondamental de mélange peut être décrit comme suit

Dans un cadre bayésien, tous les paramètres sont associés à des variables aléatoires, comme suit:

Cette représentation utilise F et H pour dépeindre séparément les transmissions discrétionnaires sur les perceptions et les paramètres. Les deux décisions les plus fondamentales de F sont le gaussien, autrement dit “serait attendu” (pour les perceptions authentiques et estimées) et le clair (pour les perceptions discrètes). D’autres résultats potentiels normaux pour l’appropriation des segments de mélange sont :

La diffusion binomiale, pour la quantité d'”événements positifs” (par exemple, les triomphes, le oui, le vote, etc.) étant donné un nombre fixe d’événements absolus

Circulation multinomiale, comme l’appropriation binomiale, cependant pour les contrôles d’événements à plusieurs voies (par exemple, oui/non/peut-être dans une vue d’ensemble)

Circulation binomiale négative, pour les perceptions de type binomial cependant où la quantité d’intrigue est le nombre de déceptions avant qu’un nombre donné de victoires n’arrive

La circulation de Poisson, pour le nombre d’événements d’une occasion dans un temps donné, pour une occasion qui est représentée par un rythme fixe de l’événement

Dispersion exponentielle, pour le temps qui précède l’occasion suivante, pour une occasion qui est représentée par un rythme fixe de l’événement

La diffusion logarithmique, pour les chiffres réels positifs qui sont acceptés pour se développer de manière exponentielle, par exemple, les moyens de subsistance ou les coûts

Circulation ordinaire multivariée (autrement appelée appropriation gaussienne multivariée), pour les vecteurs de résultats connexes qui sont exclusivement transmis en gaussien

Diffusion multivariée de Student’s-t (également connue sous le nom de diffusion multivariée de Student’s-t), pour les vecteurs de résultats liés à l’écrasement et au suivi [1]

Un vecteur de valeurs diffusées par Bernoulli, se comparant, par exemple, à une image à fort contraste, dont chacune vaut la peine de parler à un pixel ; voir le modèle de reconnaissance de la calligraphie ci-dessous :

Modèle de mélange gaussien

Une version bayésienne d’un modèle de mélange gaussien est la suivante:

Modèle de mélange gaussien multivarié

Un modèle de mélange gaussien bayésien est habituellement étiré pour s’adapter à un vecteur de paramètres obscurs (signifiant en frappant), ou à des transports ordinaires multivariés. Dans une dispersion multivariée (par exemple une dispersion affichant un vecteur x avec N facteurs irréguliers), on peut démontrer un vecteur de paramètres (par exemple, quelques perceptions d’un signe ou des fixations à l’intérieur d’une image) en utilisant un modèle de mélange gaussien ; dispersion antérieure sur le vecteur des évaluations données par

De telles circulations sont utiles pour s’attendre à des états d’images et de bouquets par exemple. En raison de la représentation des images, chaque gaussien peut être incliné, étendu et déformé par les réseaux de covariance. Une transmission gaussienne de l’ensemble est adaptée à chaque point fixe de l’image (en règle générale, 8×8 pixels). En principe, toute transmission des points de focalisation autour d’un groupe (seekk-implies) peut être précisément définie par un nombre suffisant de segments gaussiens, mais à peine plus de K=20 segments sont censés démontrer avec précision une appropriation donnée de l’image ou un ensemble d’informations.