SHA-256如何保护比特币和互联网安全

如果你关注过比特币，一定听说过"SHA-256"这个词。每笔比特币交易都需要经过SHA-256计算，整个比特币网络每秒进行着天文数字级别的SHA-256运算，以至于有人调侃说"比特币是用电来换数字的"。但SHA-256不仅仅用在比特币上——你每天上网时用的HTTPS证书、Git的版本管理、SSL/TLS握手……背后都有它的身影。

那么SHA-256到底是什么？它是怎么工作的？为什么它如此重要？

SHA-256的来龙去脉

SHA-256是SHA-2（安全哈希算法2）家族中最著名的成员，由美国国家安全局（NSA）设计，2001年正式发布为联邦信息处理标准（FIPS 180-4）。

它的"前辈"SHA-1在1993年发布，但后来被发现存在安全漏洞。SHA-2则在SHA-1的基础上进行了重大改进，输出长度从160位增加到256位（SHA-256）、384位（SHA-384）和512位（SHA-512）。

之所以叫"SHA-2"，是因为它是"SHA-1的继承者"——不是"SHA-1的升级版"的意思。所以别把"SHA-256"理解成"SHA-1的256位版本"，它们是两套完全不同的算法。

SHA-256是如何工作的？

我来尽量用通俗的方式解释SHA-256的工作原理。数学细节很复杂，但核心思路可以讲清楚。

SHA-256把任意长度的输入（可以是一个字，可以是整部《战争与和平》）切分成512位（64字节）一组。如果最后一组不满，就按照特定规则填充——先填一个"1"，然后填一堆"0"，最后用64位二进制表示原始消息的长度。这样每组恰好都是512位。

初始哈希值：八个32位整数

SHA-256有8个初始哈希值（H₀到H₇），它们是前8个质数平方根的小数部分的前32位。这些看起来像是随机选的数，其实来自数学上的精心设计。

64轮"搅拌"

对于每一组512位的数据，SHA-256要做64轮运算。每一轮都会用到：

消息调度（Message Schedule）：把当前分组扩展成64个32位字
压缩函数（Compression Function）：混合、替换、移位、异或
常量Kₜ：64个精心选择的32位常数

这64轮操作本质上就是在"搅拌"数据——把原始消息充分打散，混合均匀，最终产生一个"指纹"。

最终输出

处理完所有分组后，SHA-256把8个哈希值（H₀到H₇）串联起来，得到256位的最终哈希值——也就是32字节，或64个十六进制字符。

整个过程中有几点特别值得注意：

每组处理的结果会影响后续所有组：分组之间不是独立的，当前组的哈希值会加到下一组的计算中。这意味着要改一个字节的内容，必须重新计算它所在分组及其之后所有分组的哈希值。
雪崩效应极强：输入任何微小变化——比如把"HELLO"改成"HELLo"——最终输出的256位哈希值会有大约50%的位发生变化。这种效果在第二轮、第三轮中会继续放大。

SHA-256的安全性

SHA-256目前被认为是安全的。具体来说：

没有已知碰撞：截至目前，还没有人公开找到两个不同输入产生相同SHA-256输出的方法。理论上SHA-256的碰撞概率是2¹²⁸分之一——这个数字大到难以想象。
没有已知原像攻击：给定一个SHA-256哈希值，目前没有已知方法能在可接受时间内找到它的原始输入。
计算不可逆：从哈希值无法反推原始数据，这由算法的数学结构保证。

当然，"目前安全"不代表"永远安全"。密码学家们一直在寻找SHA-256的弱点。虽然目前没有实际的碰撞攻击，但理论上说，如果量子计算成熟，SHA-256的安全性会下降到"量子安全"的水平——但仍然是安全的（AES-256从256位降到128位等价安全性）。

SHA-256的实际应用

比特币：SHA-256的舞台

比特币用SHA-256的地方太多了。首先，每笔交易的内容会被哈希一次。然后这笔交易的哈希会和其他交易的哈希配对，再哈希一次——这个过程一直重复，直到只剩一个根哈希值，叫做Merkle根。

更著名的是"挖矿"。比特币矿工要做的事情就是：不断改变一个叫做"nonce"的数字，把区块头（包括Merkle根、前一区块哈希、时间戳等）进行双重SHA-256运算，谁先找到结果小于某个目标值，谁就赢得了这一轮的记账权。

这个"工作量证明"（Proof of Work）机制是比特币设计的核心创新之一。它的巧妙之处在于：验证一个有效哈希很容易，但找到一个有效哈希却需要消耗大量算力。SHA-256在这里扮演了"天然的难题生成器"的角色。

矿工每秒进行的SHA-256运算次数叫做"哈希率"（Hashrate）。整个比特币网络的总哈希率已经超过每秒500EH（5×10²⁰次哈希）——这个数字大到已经没有直观概念了。

TLS/SSL证书

当你访问HTTPS网站时，浏览器会验证服务器的证书是否有效。证书里包含了网站公钥的SHA-256指纹——这个指纹是证书颁发机构（CA）在签发证书时用自己私钥签名的。

如果攻击者试图伪造一个伪造的证书，它的SHA-256指纹必然与真实证书不同，浏览器就会拒绝信任。这就是SHA-256在互联网安全基础设施中的关键作用。

Git版本管理

Git用SHA-1来标识每个提交和文件对象。理论上Git应该迁移到SHA-256（GitHub已经在推进），因为SHA-1在理论上存在碰撞风险。Git的内部设计哲学是：每个对象的内容决定其哈希值，任何改动都会导致完全不同的哈希——这正是哈希函数的核心特性。

密码存储

虽然bcrypt和Argon2是更推荐的密码哈希方案，但很多系统仍然用SHA-256配合"盐值"（Salt）来存储密码。盐值是随机生成的数据，和密码一起哈希——这样即使两个人的密码相同，由于盐值不同，存储的哈希值也不同，能有效防止彩虹表攻击。

为什么SHA-256比MD5强这么多？

前面我们讲了MD5已经被碰撞攻击攻破。SHA-256比MD5强在哪里？

输出长度：MD5是128位，SHA-256是256位。更长的输出意味着更大的碰撞搜索空间。
算法结构：MD5的结构在理论上存在弱点，使得碰撞搜索变得更容易。SHA-256的数学结构更加坚固。
轮次：MD5只有4轮运算，SHA-256有64轮。更复杂的内部结构意味着更强的抵抗力。
初始值设计：SHA-256的初始哈希值来自数学常数，而MD5的初始值是硬编码的——王小云教授的研究表明，这种设计会让碰撞更容易构造。

SHA-256 vs SHA-3

2012年，NIST举办了一个公开竞赛来选择SHA-3标准。最终Keccak算法胜出，成为SHA-3。

SHA-3和SHA-2的设计原理完全不同——SHA-2是传统的基于置换-替换网络的结构，SHA-3用的是"海绵结构"（Sponge Construction）。这意味着即使未来SHA-2被发现弱点，SHA-3可以作为备选。

有趣的是，SHA-3并不是用来替代SHA-2的。NIST明确表示，SHA-2目前没有已知弱点，两者可以共存。SHA-3主要是在为"万一SHA-2被攻破"做准备。

总结

SHA-256是现代密码学的基石之一。它用看似简单的数学操作，实现了强大的单向性和抗碰撞性，在比特币、区块链、互联网安全、版本管理等领域发挥着不可替代的作用。

虽然量子计算可能会在将来改变密码学的格局，但SHA-256在量子时代仍然能保持相当的安全性（从256位降到约128位等价强度）。在那之前，它仍然是我们数字生活中最可靠的安全组件之一。

想亲手试试SHA-256？可以到我们的SHA-256工具页面，输入任意文字，看看它的256位哈希值是什么样的。