区块链
区块链(英语:blockchain 或 block chain)是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。本文根据阮一峰老师的区块链入门教程整理并解释一下区块链到底是什么,有何特别之处。
区块链就是一个数据库,记载了所有的交易,用作中央记账系统。每笔交易的核心,就是一句话,比如"张三向李四转移了1个比特币"。为了证明这句话可信,张三为它加上了数字签名。任何人都可以用张三的公钥,证明这确实是张三本人的行为。另一方面,其他人无法伪造张三的数字签名,所以不可能伪造这笔交易。矿工们收到这句话,首先验证数字签名的可信性,然后验证张三确实拥有这些比特币(每一笔交易都有上一笔交易的编号,用来查询比特币的来源)。验证通过以后,就着手把这句话写入区块链了。一旦写入区块链,所有人就都可以查询到,因此这笔比特币就被认为,从张三转移到了李四。区块链的作用就是把这句话永久保存下来了,让任何人都可以查看,并且任何人(包括张三本人在内)都无法再修改了。
- 首先,区块链的主要作用是储存信息。任何需要保存的信息,都可以写入区块链,也可以从里面读取,所以它是数据库。
- 其次,任何人都可以架设服务器,加入区块链网络,成为一个节点。
分布式数据库并非新发明,但是,区块链有一个革命性特点。区块链没有管理员,它是彻底无中心的。每个节点都是平等的,都保存着整个数据库。你可以向任何一个节点,写入/读取数据,所有节点最后都会同步,保证区块链一致。
区块链奇妙的地方在于怎么才能保证数据是可信。区块链由一个个区块(block)组成。区块很像数据库的记录,每次写入数据,就是创建一个区块。每个区块包含区块头(Head)和区块体(Body)。区块头包含了当前区块的多项元信息,如Hash值。正是通过这种联动机制,区块链保证了自身的可靠性,数据一旦写入,就无法被篡改。
- 区块链的 Hash 长度是256位,这就是说,不管原始内容是什么,最后都会计算出一个256位的二进制数字。而且可以保证,只要原始内容不同,对应的 Hash 一定是不同的。
- 区块与 Hash 是一一对应的,每个区块的 Hash 都是针对"区块头"(Head)计算的。这意味着,如果当前区块的内容变了,或者上一个区块的 Hash 变了,一定会引起当前区块的 Hash 改变。
由于必须保证节点之间的同步,所以新区块的添加速度不能太快。你永远只能在最新区块的后面,生成下一个区块。区块链的设计是,平均每10分钟,全网才能生成一个新区块,一小时也就六个。也就是说,只有通过极其大量的计算,才能得到当前区块的有效 Hash,从而把新区块添加到区块链。由于计算量太大,所以快不起来。这个过程就叫做采矿(mining),计算 Hash 的机器就叫做矿机,操作矿机的人就叫做矿工。
- 区块头包含一个难度系数(difficulty),这个值决定了计算 Hash 的难度。
- 就算采矿很难,但也没法保证,正好十分钟产出一个区块。为了将产出速率恒定在十分钟,中本聪还设计了难度系数的动态调节机制。他规定,难度系数每两周(2016个区块)调整一次。如果这两周里面,区块的平均生成速度是9分钟,就意味着比法定速度快了10%,因此难度系数就要调高10%;如果平均生成速度是11分钟,就意味着比法定速度慢了10%,因此难度系数就要调低10%。
- 不是任意一个 Hash 都可以,Hash 的有效性跟目标值密切相关,只有小于目标值的 Hash 才是有效的,否则 Hash 无效,必须重算。由于目标值非常小,Hash 小于该值的机会极其渺茫,可能计算10亿次,才算中一次。这就是采矿如此之慢的根本原因。
如果两个人同时向区块链写入数据,也就是说,同时有两个区块加入,因为它们都连着前一个区块,就形成了分叉。这时应该采纳哪一个区块呢?现在的规则是,新节点总是采用最长的那条区块链。如果区块链有分叉,将看哪个分支在分叉点后面,先达到6个新区块(称为"六次确认")。按照10分钟一个区块计算,一小时就可以确认。
区块链作为无人管理的分布式数据库,从2009年开始已经运行了8年,没有出现大的问题。这证明它是可行的。但是,为了保证数据的可靠性,区块链也有自己的代价。一是效率,数据写入区块链,最少要等待十分钟,所有节点都同步数据,则需要更多的时间;二是能耗,区块的生成需要矿工进行无数无意义的计算,这是非常耗费能源的。
目前,区块链最大的应用场景(可能也是唯一的应用场景),就是以比特币为代表的加密货币。