Viés e Variância são dois erros de previsão principais que ocorrem principalmente durante um modelo de aprendizagem da máquina. A aprendizagem de máquinas resolve numerosos problemas com os quais nos preocupamos. Através da aprendizagem de máquinas, podemos realizar actividades que antes não conseguíamos realizar.
Como a aprendizagem de máquinas resolve a maioria dos problemas, enfrentamos vários desafios. Estas previsões podem ser ameaçadoras e irão afectar o resultado da modalidade. É por isso que precisamos de compreender e resolver estas previsões.
Para conceber um modelo de aprendizagem de máquinas, precisamos de alimentar todos os dados importantes para que o modelo possa fazer previsões e desenvolver novos dados por si só. As variações tornarão um modelo adequado diferente dos parâmetros definidos. Lidar com desvios e Bias é frustrante, uma vez que não se pode lançar o modelo ou demonstrar as capacidades do modelo a menos que os resultados sejam precisos.

Aprendizagem supervisionada

O tradeoff entre Bias vs. Variância é aplicável apenas na aprendizagem supervisionada da máquina. Mais importante ainda, utiliza-se estas previsões na modelação preditiva. Este tradeoff quebrará o erro de previsão para que possa analisar o desempenho do seu algoritmo.
Cada modelo de aprendizagem da máquina inclui um algoritmo que treina com a ajuda de dados relevantes. O algoritmo repete o mesmo modelo e melhora a capacidade do modelo ao fazer novos dados utilizando os dados de treino.
Há vários algoritmos que pode escolher para os modelos de aprendizagem da sua máquina. Alguns dos algoritmos são:
– Redes Neuronais
– Árvores de decisão
– SVM
– Regressão Linear
Todos os algoritmos acima são diferentes uns dos outros. O estilo de trabalho do algoritmo e a forma como eles processam os dados são todos diferentes. A quantidade de Variância e Polarização geram a diferença mais importante entre estes algoritmos.

Modelo final

Depois de decidir o algoritmo e os parâmetros que utiliza para o seu projecto, prepara o seu modelo final, inserindo os dados. Fornece uma grande quantidade de dados ao modelo de aprendizagem da máquina. Agora precisa de treinar esses conjuntos de dados e continuar a testar até começar a encontrar alguns resultados. O modelo ajudará a gerar a previsão a partir de dados anteriores e a desenvolver novos dados.

Tipos de Erro de Predição

O algoritmo do modelo de aprendizagem da máquina incluirá estes três tipos de erros de previsão:
– Variância
– Viés
– Erro Irreduzível

O que é o Bias?

A diferença entre o montante do valor-alvo e a previsão do modelo chama-se Bias. Pode-se alterar o Bias de um projecto alterando o algoritmo ou modelo. Quando as suposições que utiliza no modelo são simples, experimentará o Bias.
Pode obter o valor médio da previsão repetindo o processo de construção do modelo e conduzindo o processo de amostragem. Pode extrair dados de reamostragem do modelo, uma vez que este utiliza o conjunto de dados de formação e gera resultados precisos. É possível fazer uma resamostragem a partir de vários métodos, tais como bootstrapping e K fold sampling.
Quando se procede à reamostragem dos dados, está-se a afectar o Bias. Encontrará um elevado nível de Bias medindo a diferença entre os valores reais dos dados da amostra com o valor médio da previsão. Se um modelo for enviesado, experimentará um modelo subaproveitado. Cada modelo inclui algum enviesamento.
Encontrará um enviesamento elevado num algoritmo linear. É por isso que estes algoritmos impulsionam o processo de aprendizagem da máquina. Encontrará também um Bias na análise de regressão linear devido a um problema da vida real que um modelo simples não pode ajudar. Encontrará um Bias baixo no algoritmo não linear. Um modelo simples tem mais Bias.

O que é uma Variância?

Com Variance, pode encontrar a quantidade da função alvo que tem de ajustar se o algoritmo estiver a utilizar diferentes conjuntos de treino. Para o manter simples, pode dizer-se que uma variância ajuda a compreender a diferença entre variáveis aleatórias e valores esperados. A variância não ajuda a encontrar a precisão total, mas pode encontrar a irregularidade do modelo ao utilizar várias previsões de diferentes conjuntos de dados de treino.
A variância pode causar sobreajustamento. Nesta condição, mesmo a pequena variação causará enormes problemas no conjunto de dados. Quando se tem um modelo com grande variação, os conjuntos de dados irão gerar ruído aleatório em vez da função alvo. O seu modelo deve ter a capacidade de compreender a diferença entre as variáveis e os dados de entrada do resultado.
No entanto, quando um modelo tem um Desvio baixo, a previsão do modelo sobre os dados da amostra é próxima. Haveria uma enorme mudança na projecção da função alvo durante o erro de variância.
Se um algoritmo tiver baixa Variância, experimentará regressão logística, regressão linear, e análise linear discriminante no modelo. Por outro lado, com Variância alta, experimentaremos vizinhos k-nearest, árvores de decisão, e máquinas vectoriais de apoio.

Erro Irreduzível

Não se pode reduzir o erro irreduzível ou o ruído. Estes são os dados aleatórios que o modelo utiliza para fazer a nova previsão. Pode considerar estes dados como um conjunto incompleto de características, problema mal enquadrado, ou aleatoriedade inerente.
Porque é que o enviesamento e as variações são essenciais
O algoritmo de aprendizagem da máquina que utilizar para o seu projecto utilizará estes modelos estatísticos ou matemáticos. Através destes cálculos, poderá desenvolver dois tipos de erros:
Erro Reduzível – Pode minimizar e controlar este erro para melhorar a precisão e eficiência do resultado.
Erro Irredutível – Estes erros são naturais, e não se pode eliminar estas incertezas.
É possível reduzir o Bias e desvios, uma vez que estes são erros redutíveis. Para reduzir estes erros, é necessário seleccionar um modelo com flexibilidade e complexidade adequadas. Além disso, é possível utilizar dados adequados para treinar o modelo e reduzir estes erros. Isto irá ajudá-lo a trazer a precisão ao modelo.

Conclusão

O viés e a variação são os elementos essenciais da aprendizagem mecânica que se deve aprender e compreender. É necessário utilizar estes componentes na aprendizagem supervisionada da máquina. Na aprendizagem supervisionada de máquinas, o algoritmo aprende através do conjunto de dados da formação e gera novas ideias e dados. É necessário manter o equilíbrio de Bias vs. Variância, ajudando a desenvolver um modelo de aprendizagem de máquina que produza resultados de dados precisos.
Independentemente do algoritmo que utilizar para desenvolver um modelo, encontrará inicialmente Variance e Bias. Quando se muda um componente, este irá afectar o outro. Assim, não se pode reduzir ambos os componentes a zero. Se o fizer, irá levantar outros problemas. É por isso que precisa de usar um viés vs. variância. Para conceber um modelo sem erros, é necessário tornar ambos os componentes proeminentes.