Python缓存机制[编辑 | 编辑源代码]

Python的缓存机制是一种优化技术，用于存储重复计算或频繁访问的数据，以提高程序的执行效率。Python在多个层面实现了缓存，包括小整数缓存、字符串驻留（interning）以及更高级的装饰器如functools.lru_cache。理解这些机制有助于编写更高效的Python代码。

小整数缓存[编辑 | 编辑源代码]

Python对小整数（通常在-5到256之间）进行了缓存，这些对象在程序启动时就被创建，并在整个程序生命周期内重复使用。这种优化减少了内存分配和垃圾回收的开销。

a = 256
b = 256
print(a is b)  # True，因为256在小整数缓存范围内

c = 257
d = 257
print(c is d)  # False，超出缓存范围

输出：

True
False

Python会对短字符串或符合特定规则的字符串（如变量名）进行驻留，即在内存中只保留一份副本。这减少了内存使用并加快了字符串比较速度。

s1 = "hello"
s2 = "hello"
print(s1 is s2)  # True，字符串被驻留

s3 = "hello world!"
s4 = "hello world!"
print(s3 is s4)  # False，长字符串通常不会被驻留

输出：

True
False

lru_cache是Python标准库中的一个装饰器，用于缓存函数的计算结果。它采用最近最少使用（LRU）策略，当缓存达到最大容量时，会丢弃最久未使用的条目。

from functools import lru_cache

@lru_cache(maxsize=None)  # 无大小限制的缓存
def expensive_function(x):
    print(f"Computing for {x}...")
    return x * x

print(expensive_function(2))  # 第一次计算
print(expensive_function(2))  # 从缓存中读取
print(expensive_function(3))  # 第一次计算

输出：

Computing for 2...
4
4
Computing for 3...
9

lru_cache适用于计算密集型函数，如递归计算的斐波那契数列：

@lru_cache(maxsize=None)
def fib(n):
    if n < 2:
        return n
    return fib(n-1) + fib(n-2)

print(fib(30))  # 快速计算，避免重复递归

输出：

以下是一个简单的LRU缓存工作原理示意图：

LRU缓存的时间复杂度为 $O (1)$ ，因为其基于哈希表和双向链表实现。缓存命中率（Hit Ratio）的计算公式为：

$Hit Ratio = \frac{Number of Cache Hits}{Total Number of Accesses}$

Python的缓存机制通过减少重复计算和内存分配来提高性能。开发者可以利用这些特性优化代码，特别是在处理大量数据或复杂计算时。理解这些机制有助于编写更高效、更可维护的Python程序。