Em insights, um modelo misto é um modelo probabilístico para falar da proximidade de subpopulações dentro de uma população em geral, sem que seja necessário que uma colecção informativa vigiada deva distinguir a subpopulação para a qual uma percepção individual tem um lugar. Oficialmente, um modelo misto está relacionado com a circulação da mistura que fala da dispersão provável das percepções na população em geral. Seja como for, embora as questões relacionadas com as “dotações de mistura” se identifiquem com a inferência das propriedades da população em geral das subpopulações, os “modelos de mistura” são utilizados para fazer deduções mensuráveis sobre as propriedades das subpopulações, dadas apenas as percepções sobre a população agrupada, sem dados de carácter de subpopulação.

Algumas formas diferentes de actualização dos modelos de mistura incluem passos que caracterizam os caracteres das hipóteses de sub-população para percepções singulares (ou cargas para tais sub-populações), caso em que estas podem ser vistas como tipos de aprendizagem a solo ou sistemas de agrupamento. Em qualquer caso, nem todas as técnicas de dedução incluem tais avanços.

Os modelos de mistura não devem ser confundidos com modelos de informação composicional, ou seja, informação cujos segmentos são obrigados a agregar a um valor constante (1, 100%, e assim por diante). Em qualquer caso, os modelos de composição podem ser considerados como modelos de mistura, em que os indivíduos da população são examinados sem qualquer objectivo. Por outro lado, os modelos de mistura podem ser pensados como modelos de composição, em que o tamanho total por população utilizadora foi padronizado para 1.

Modelo de mistura geral

Um modelo comum de mistura de dimensões limitadas é um modelo de vários níveis composto pelos segmentos que o acompanham:

N variáveis irregulares que são observadas, cada uma delas dispersa por uma mistura de segmentos K, tendo os segmentos um lugar com o grupo paramétrico equivalente de disseminação (por exemplo, todos ordinários, todos Zipfian, etc.), mas com vários parâmetros

N factores inertes arbitrários que indicam o carácter da parte de mistura de cada percepção, cada um apropriado por um transporte não mitigado de dimensão K

Muitas das cargas de mistura K, que são probabilidades que agregam a 1.

Um lote de parâmetros K, cada um determinando o parâmetro do segmento de mistura comparativo. Como regra, cada “parâmetro” é realmente um lote de parâmetros. Por exemplo, se as partes da mistura forem dotações gaussianas, haverá uma média e uma variação para cada segmento. No caso das partes de mistura serem todas divulgadas (por exemplo, quando cada percepção é um símbolo de um conjunto limitado de letras de tamanho V), haverá um vector de probabilidades V que se somará a 1.

Além disso, num cenário Bayesiano, as cargas e parâmetros da mistura serão, eles próprios, factores arbitrários e as divulgações anteriores serão colocadas sobre os factores. Neste caso, as cargas são normalmente vistas como um vector arbitrário de dimensão K retirado de uma circulação Dirichlet (o conjugado mais cedo da apropriação directa), e os parâmetros serão transmitidos pelos seus priores conjugados individuais.

Cientificamente, um modelo de mistura paramétrica fundamental pode ser retratado como se segue:

Num cenário Bayesiano, todos os parâmetros estão associados a variáveis aleatórias, como se segue:

Este retrato utiliza F e H para representar separadamente as transmissões discricionárias sobre percepções e parâmetros. Normalmente, H será o conjugado de F. As duas decisões mais básicas de F são gaussianas, conhecidas como “seria de esperar” (para percepções genuinamente estimadas) e corte claro (para percepções discretas). Outros resultados potenciais normais para a apropriação dos segmentos de mistura são:

Divulgação binomial, para a quantidade de “eventos positivos” (por exemplo, triunfos, sim, lançar uma votação, etc.) dado um número fixo de eventos absolutos

Circulação multinomial, tal como a dotação binomial, no entanto, para verificações de eventos multidireccionais (por exemplo, sim/não/ talvez numa visão global)

Circulação binomial negativa, para percepções de tipo binomial, porém em que a quantidade de intrigas é o número de decepções antes de acontecer um determinado número de vitórias

circulação de Poisson, para o número de eventos de uma ocasião num determinado período de tempo, para uma ocasião que é retratada por um ritmo fixo do evento

Dispersão exponencial, para o tempo anterior à ocasião seguinte, para uma ocasião que é retratada por um ritmo fixo do evento

Divulgação de logaritmos, para números genuínos positivos que sejam aceites para se desenvolverem exponencialmente, por exemplo, meios de subsistência ou custos

Circulação normal multivariada (também conhecida como apropriação multivariada gaussiana), para vectores de resultados relacionados que são exclusivamente gaussianos.

Divulgação multivariada Estudante-t (também conhecida como circulação t multivariada), para vectores de resultados relacionados com a esmagadora maioria dos casos[1].

Um vector de Bernoulli-disseminados valores, comparando, por exemplo, com uma imagem de alto contraste, cada um valendo a pena falar com um pixel; ver o modelo de reconhecimento de escrita em baixo:

Modelo de mistura gaussiana

Uma versão Bayesiana de um modelo de mistura gaussiana é a seguinte:

Modelo de mistura multivariada gaussiana

Um modelo de mistura Bayesiano Gaussiano é normalmente esticado para se ajustar a um vector de parâmetros obscuros (entendido em greve), ou de transmissões multivariadas normais. Numa dispersão multivariada (por exemplo, uma que apresente um vector x com N factores irregulares) é possível demonstrar um vector de parâmetros (por exemplo, algumas percepções de um sinal ou fixações dentro de uma imagem) utilizando um modelo de mistura gaussiana de dispersão anterior no vector de avaliações dado por

Tais circulações são úteis para esperar, por exemplo, estados de imagens e de cachos em forma de remendos. Por causa da imagem retratada, cada gaussiano pode ser inclinado, ampliado e distorcido pelas redes de covariância . Uma transmissão gaussiana do conjunto é adequada para cada fixação (como regra de tamanho 8×8 pixels) na imagem. Eminentemente, qualquer transmissão de focos em torno de um grupo (ver-implica) pode ser dada com precisão suficiente segmentos gaussianos, no entanto, pouco mais de K=20 segmentos são esperados para demonstrar com precisão uma determinada apropriação da imagem ou um monte de informação