Git敏感信息管理[编辑 | 编辑源代码]

Git敏感信息管理是指在使用Git版本控制系统时，如何正确处理和保护敏感数据（如密码、API密钥、私钥等）的最佳实践。由于Git的分布式特性，一旦敏感信息被提交到仓库历史中，即使后续删除也可能通过历史记录被恢复，因此需要特别警惕。

为什么需要敏感信息管理[编辑 | 编辑源代码]

Git仓库可能包含以下敏感信息：

这些信息如果泄露可能导致：

以下是一个典型的错误提交示例：

# 错误示例：在代码中硬编码凭证
db_password = "s3cr3tP@ssw0rd"

一旦这样的代码被提交并推送到远程仓库，就需要立即采取补救措施。

将敏感信息存储在环境变量中而非代码中：

# 正确做法：从环境变量读取
import os
db_password = os.environ['DB_PASSWORD']

创建.gitignore文件来排除敏感文件：

# .gitignore 示例
*.key
*.pem
*.env
config/secrets.json

Git提供机密扫描功能（如GitHub的Secret Scanning），可以检测并警告可能的敏感信息提交。

如果敏感信息已被提交，可以使用git filter-repo工具从历史中彻底删除：

# 安装git-filter-repo
pip install git-filter-repo

# 从历史中删除包含敏感信息的文件
git filter-repo --invert-paths --path credentials.txt

某开发者在GitHub公开仓库中意外提交了包含AWS访问密钥的配置文件。攻击者利用这些密钥发起了价值$50,000的比特币挖矿操作。

解决方案: 1. 立即在AWS控制台轮换密钥 2. 使用git filter-repo清理历史 3. 添加.gitignore排除所有.aws/credentials文件

某医疗应用在源代码中硬编码了生产数据库密码，导致患者数据泄露。

解决方案: 1. 将密码移至环境变量 2. 实现配置管理系统 3. 对所有开发者进行安全培训

创建.git/hooks/pre-commit钩子来自动检查敏感信息：

#!/bin/sh
# 检查是否包含可能的密码模式
if git diff --cached | grep -E 'password|secret|key'; then
    echo "ERROR: 检测到可能的敏感信息提交"
    exit 1
fi

AWS开发的git-secrets工具可以防止敏感信息提交：

# 安装
brew install git-secrets

# 初始化
git secrets --install
git secrets --register-aws

敏感信息泄露风险可以量化为： $R = P \times I$ 其中：

通过遵循这些实践，可以显著降低Git仓库中敏感信息泄露的风险。