Apache Cassandra может быть высокомасштабируемой, высокопроизводительной распределенной базой данных, предназначенной для работы с большими объемами знаний на многих товарных серверах, обеспечивающей высокую доступность без единой точки отказа. это своего рода база данных NoSQL. позволяет нам сначала понять, что делает база данных NoSQL.

NoSQLDatabase

БД NoSQL (иногда называемая не только SQL) может быть базой данных, которая дает механизм хранения и извлечения данных помимо табличных отношений, используемых в реляционных БД. Эти базы данных не имеют схем, поддерживают простую репликацию, имеют простой API, в конечном итоге последовательны и могут обрабатывать огромное количество знаний.

Основной целью базы данных NoSQL является обладание

простота конструкции,

горизонтальное масштабирование, и

более точный контроль над доступностью.

Базы данных NoSql используют различные структуры данных по сравнению с реляционными базами данных. Это ускоряет некоторые операции в NoSQL. Пригодность конкретной БД NoSQL зависит от того, что она должна решить.

NoSQL против электронной базы данных

В следующей таблице перечислены пункты, отличающие электронную базу данных от базы данных NoSQL.

Реляционная база данных NoSql База данных

Поддерживает мощный командный язык. Поддерживает очень простой командный язык.

Имеет жесткую и быструю схему. Нет фиксированной схемы.

Следование ACID (Атомность, Согласованность, Изоляция и Долговечность). Только “в конечном итоге последовательность”.

Поддерживает транзакции. не поддерживает транзакции.

Кроме Кассандры, у нас есть последующие базы данных NoSQL, которые достаточно популярны –

Apache HBase – HBase – это open source, nonlational, distributed database modeled after Google’s BigTable и написанная на Java. Она разработана как соседка проекта Apache Hadoop и работает поверх HDFS, предоставляя возможности, подобные BigTable для Hadoop.

MongoDB – MongoDB может быть кроссплатформенной документально-ориентированной системой баз данных, которая позволяет избежать использования обычной табличной электронной структуры базы данных в пользу JSON-подобных документов с динамическими схемами, что делает смешивание знаний в определенных видах приложений более простым и быстрым.

Что такое Apache Cassandra?

Apache Cassandra – это система с открытым исходным кодом, распределённая и децентрализованная/распределённая система хранения (БД) для управления очень большими объёмами структурированных данных, открытых по всей планете. Она предоставляет высокодоступный сервис без единой точки отказа.

Ниже перечислен ряд примечательных особенностей Apache Cassandra –

Он масштабируемый, отказоустойчивый и последовательный.

Это база данных, ориентированная на столбцы.

Дистрибутивный дизайн основан на Amazon’s Dynamo и модели данных на Google’s Bigtable.

Созданная на Facebook, она резко отличается от электронных систем управления базами данных.

Кассандра реализует модель репликации в стиле “Динамо” без единой точки отказа, но добавляет более мощную модель данных “семейства колонок”.

Кассандра используется рядом наиболее важных компаний, таких как Facebook, Twitter, Cisco, Rackspace, ebay, Twitter, Netflix и др.

Особенности Кассандры

Кассандра стала настолько популярной благодаря своим выдающимся техническим характеристикам. Ниже приведен ряд особенностей Кассандры:

Эластичная масштабируемость – Кассандра очень масштабируема; она позволяет использовать большее количество аппаратного обеспечения для размещения большего количества клиентов и большего объема данных в соответствии с требованиями.

Всегда на архитектуре – У Cassandra нет единой точки отказа и она постоянно доступна для критически важных бизнес-приложений, которые не могут позволить себе сбой.

Быстрая линейная производительность – Cassandra обладает линейной масштабируемостью, т.е. увеличивает пропускную способность по мере увеличения количества узлов в кластере. Поэтому она поддерживает быстрое время отклика .

Гибкое хранение данных – Кассандра поддерживает все возможные форматы данных, включая: структурированные, полуструктурированные и неструктурированные. Она может динамически адаптировать изменения в ваших структурах данных в соответствии с вашими потребностями.

Простота распределения данных – Кассандра обеспечивает гибкость распределения данных там, где вы хотите, путем репликации данных в нескольких центрах обработки данных.

Поддержка транзакций – Cassandra поддерживает такие свойства, как Атомность, Согласованность, Изоляция и Прочность (ACID).

Быстрая запись – Кассандра была разработана для работы на дешевом товарном оборудовании. Она выполняет молниеносно быструю запись и может хранить много терабайт знаний, не жертвуя при этом эффективностью чтения.