Anteriormente, quando precisávamos armazenar mais informações ou aumentar nosso poder de preparação, a alternativa normal era proporcional verticalmente (obter todas as máquinas mais dominantes) ou atualizar ainda mais a base de código atual. Em qualquer caso, com os avanços no manuseio paralelo e na disseminação de frameworks, é progressivamente regular estender-se uniformemente ou ter mais máquinas para fazer uma tarefa similar em paralelo. Já seríamos capazes de ver muitos aparelhos de controle de informação no empreendimento Apache como Flash, Hadoop, Kafka, Zookeeper e Tempest. Seja como for, para que seja viável a escolha do aparelho de decisão, um pensamento essencial da Hipótese do Topo é importante. Top Hypothesis é uma idéia de que uma estrutura de banco de dados dispersa pode ter apenas 2 dos 3: Consistência, Acessibilidade e Resistência de Parcelas.

A Hipótese Top é significativa no mundo da Informação Enorme, particularmente quando temos que fazer trocas entre os três, tendo em vista o nosso caso de uso inovador. Neste blog, vou tentar esclarecer cada uma dessas idéias e as explicações por trás da troca de idéias. Vou me abster de utilizar modelos explícitos, pois os SGBD estão avançando rapidamente.

Tolerância de Partição

Esta condição expressa que a estrutura continua em funcionamento, independentemente do número de mensagens sendo diferido pelo sistema entre os hubs. Um framework segmentado e tolerante pode suportar qualquer medida de desapontamento do sistema que não provoque desapontamento de todo o organizado. Os registros de informação são adequadamente repetidos transversalmente sobre as misturas de hubs e sistemas para manter o framework em funcionamento através de blackouts irregulares. Ao gerenciar frameworks dispersos nos dias de hoje, Parcel Resilience não é uma alternativa. É uma necessidade. Daí em diante, precisamos trocar entre Consistência e Acessibilidade.

Alta Consistência

Esta condição expressa que todos os hubs vêem informações semelhantes simultaneamente. Basicamente, a execução de uma atividade lida irá restaurar a estimativa da última atividade composta, fazendo com que todos os hubs retornem informações semelhantes. Um framework tem consistência se uma troca começa com o framework em um estado confiável, e termina com o framework em um estado estável. Neste modelo, um framework pode (e se move) para um estado conflitante durante uma troca, entretanto, toda a troca é movida de volta se houver um erro em qualquer fase durante todo o tempo. Na figura, temos 2 registros distintos (“Bulbasaur” e “Pikachu”) em vários timestamps. O rendimento no terceiro segmento é “Pikachu”, a informação mais recente. Seja como for, os hubs vão precisar de tempo para se refrescar e não serão Acessíveis no sistema com a mesma freqüência.

Alta Disponibilidade

Esta condição expressa que cada solicitação recebe uma reação de progresso/desapontamento. A realização da acessibilidade em uma estrutura disseminada requer que a estrutura permaneça operacional 100% do tempo. Cada cliente recebe uma reação, pouco se preocupando com a condição de qualquer núcleo individual da estrutura. Esta medida não é importante para medir: é possível que você possa apresentar instruções de leitura/composição, ou não pode. Assim, as bases de dados são autônomas no tempo, pois os hubs devem estar acessíveis online de forma consistente. Isto implica, ao contrário do modelo passado, que não temos a mais nebulosa idéia de se “Pikachu” ou “Bulbasaur” foi incluído primeiro. O rendimento poderia ser esse. Conseqüentemente, por que a alta acessibilidade não é atingível ao quebrar informações jorrando em alta recorrência.