Anteriormente, cuando necesitábamos almacenar más información o incrementar nuestra potencia de preparación, la alternativa normal era la proporcional vertical (conseguir todas las máquinas más dominantes) o mejorar aún más la base de código actual. En cualquier caso, con los avances en el manejo en paralelo y los marcos diseminados, es progresivamente regular extenderse uniformemente o tener más máquinas para hacer una asignación similar en paralelo. Ya podríamos ver muchos aparatos de control de la información en la empresa Apache como Flash, Hadoop, Kafka, Zookeeper y Tempest. Sea como fuere, para elegir de manera viable el aparato de decisión, es importante un pensamiento esencial de la Hipótesis Superior. La Hipótesis Superior es una idea de que un marco de base de datos disperso puede tener sólo 2 de los 3: Consistencia, Accesibilidad y Resistencia de la Parcela.

La Hipótesis Superior es significativa en el mundo de la Enorme Información, particularmente cuando tenemos que hacer intercambios entre los tres, en vista de nuestro novedoso caso de uso. En este blog, intentaré aclarar cada una de estas ideas y las explicaciones detrás del intercambio de. Me abstendré de utilizar modelos explícitos ya que el DBMS está avanzando rápidamente.

Tolerancia de la partición

Esta condición expresa que el marco sigue funcionando, independientemente del número de mensajes que el sistema difiera entre los centros. Un marco que es tolerante a la segmentación puede soportar cualquier medida de decepción del sistema que no provoque una decepción del conjunto organizado. Los registros de información se repiten adecuadamente de forma cruzada sobre las mezclas de centros y sistemas para mantener el marco en funcionamiento a través de apagones irregulares. Cuando se gestionan los marcos dispersos actuales, la Resistencia de la Parcela no es una alternativa. Es una necesidad. De ahora en adelante, necesitamos intercambiar entre la Consistencia y la Accesibilidad.

Alta consistencia

Esta condición expresa que todos los centros ven información similar simultáneamente. Básicamente, la ejecución de una actividad de lectura restaurará la estimación de la última actividad de composición haciendo que todos los centros devuelvan información similar. Un marco tiene consistencia si un intercambio comienza con el marco en un estado fiable, y termina con el marco en un estado estable. En este modelo, un marco puede (y lo hace) pasar a un estado conflictivo durante un intercambio, sin embargo, todo el intercambio se retrocede si hay un error durante cualquier fase todo el tiempo. En la imagen, tenemos 2 registros distintos (“Bulbasaur” y “Pikachu”) en varias marcas de tiempo. El rendimiento del tercer segmento es “Pikachu”, la información más reciente. Sea como fuere, los centros requerirán tiempo para actualizarse y no estarán accesibles en el sistema con tanta frecuencia.

Alta Disponibilidad

Esta condición expresa que cada solicitud obtiene una reacción sobre el progreso/decepción. Lograr la accesibilidad en un marco difundido requiere que el marco se mantenga operativo el 100% del tiempo. Cada cliente obtiene una reacción, prestando poca atención a la condición de cualquier centro individual en el marco. Esta medida no es importante para medir: es posible que se puedan presentar direcciones de lectura/composición, o no. Por lo tanto, las bases de datos son autónomas en el tiempo, ya que los centros deben ser accesibles en línea de manera consistente. Esto implica que, a diferencia del modelo anterior, no tenemos la menor idea de si “Pikachu” o “Bulbasaur” se incluyó primero. El rendimiento podría ser que es posible que uno. En consecuencia, por qué no se puede lograr una alta accesibilidad al desglosar la información que brota a gran escala.