CAP理论[编辑 | 编辑源代码]

CAP理论是分布式系统设计中的核心理论之一，由计算机科学家Eric Brewer在2000年提出。它阐述了在分布式系统中，一致性（Consistency）、可用性（Availability）和分区容错性（Partition Tolerance）三者不可兼得，最多只能同时满足其中两项。这一理论为NoSQL数据库的设计和选型提供了重要指导。

基本概念[编辑 | 编辑源代码]

CAP理论中的三个核心属性定义如下：

一致性（Consistency）：所有节点在同一时间看到的数据完全相同。即每次读取都能获得最新的写入数据或错误。
可用性（Availability）：每个请求都能得到响应（不保证是最新数据），系统始终可用。
分区容错性（Partition Tolerance）：系统在网络分区（节点间通信中断）时仍能继续运行。

根据CAP理论，分布式系统只能满足其中两项：

CA系统：保证一致性和可用性，但无法容忍网络分区（如传统关系型数据库）。
AP系统：保证可用性和分区容错性，但可能返回旧数据（如Cassandra、DynamoDB）。
CP系统：保证一致性和分区容错性，但在网络分区时可能不可用（如MongoDB、HBase）。

数学表达[编辑 | 编辑源代码]

CAP理论可以用数学方式描述为： $Consistency \land Availability \land Partition Tolerance \equiv False$

权衡示例[编辑 | 编辑源代码]

以下是一个简单的键值存储示例，展示不同选择下的行为差异：

CP系统示例[编辑 | 编辑源代码]

# 模拟CP系统（如MongoDB）
class CP_Database:
    def __init__(self):
        self.data = {}
        self.locked = False

    def write(self, key, value):
        if not self.locked:
            self.data[key] = value
            return True
        return False  # 网络分区时拒绝写入

    def read(self, key):
        if not self.locked:
            return self.data.get(key)
        return None  # 网络分区时不可用

AP系统示例[编辑 | 编辑源代码]

# 模拟AP系统（如Cassandra）
class AP_Database:
    def __init__(self):
        self.data = {}
        self.partition = False

    def write(self, key, value):
        self.data[key] = value
        return True  # 总是接受写入

    def read(self, key):
        if self.partition:
            return "stale_data"  # 网络分区时可能返回旧数据
        return self.data.get(key)