杨正昆选择了第二条路,在白度没做出成绩的项目他有点不甘心,如果当初白度还能继续投入,说不定用不了多久那个项目就会成功。
但他也考虑了风险。
商业公司都是逐利的,而这个项目很可能面临在白度那样尴尬的境地,投入太多产出太少,没人用的结果就是项目最后被撤。
但是杨正昆没有改变主意,而是坚定地组建团队攻克这个难题,做分布式数据库。
所谓的数据库就是有效地管理和存取大量数据资源,提高数据的共享性,使多个用户能够同时访问数据库中的数据;减小数据的冗余度,以提高数据的一致性和完整性,提供数据与应用程序的独立性,从而减少应用程序的开发和维护代价。
当时掌握在米国人手里的数据库都是集中式的数据库。
集中式数据库通俗点解释就是把数据的储存和处理集中在一台计算机上。
优点是大多数功能如修改、备份、查询、控制访问等都很容易实现。
数据库大小和它所在的计算机不需要担心数据库是否在中心位置,小企业可以在个人计算机上设立一个集中式数据库,而大型企业可以由大型机来控制整个数据库。
缺点是当中心站点计算机或数据库系统不能运行时,在系统恢复之前所有用户都不能使用系统。而且从终端到中心站点的通信开销是很昂贵的。
一旦有众多的用户在一个时间段同时提取数据还会造成服务器崩溃。
它最大的缺点是储存的数据有限,一旦这套数据库储存满了,你就再买下一套数据库。
西方人的观念里没有什么合作共赢,有的只是疯狂掠夺,不榨干你最后一滴血绝不罢休。
掌握了垄断技术的西方人还会请扒狼皮?
就拿世界最大数据库公司加固文来说吧。
ioeib小型机+oracle数据库+ec存储设备,这就是加固文标准的数据库设备,是从开始到后来三十年华国企业的it标配。
这一套硬件设备的成本就数以亿计。
一套设备存储满了你就得买下一套设备,像阿里巴巴和白度这样的公司,最高峰的时候这样的设备公司里成百上千套。
它还有一个缺点是,你想要临时增加一些服务器承载更多流量,还得提前几个月下订单。
这里还有一个霸王条款,就是你公司的数据一旦流量下降,设备闲置却依然要为此持续支付每年的使用费。
你有什么意见,对不起!厕所提去,爱要不要!
这样分布式数据库的概念也就有人提出了,而且提出的时间还非常的早,七十年代就有人提出了。
分布式数据库就不是把数据存放在一台计算机上了,而是无数台计算机上。
每一台计算机都都局部应用和自治处理能力,并且同时还能参与全网处理,这样就大大分担了计算机工作的压力。
二十年后,人们管这个叫云。
分布式数据库无论从处理速度还是储存容量上都是集中式数据库无法比拟的,这样就大大降低了成本。
但是它自然也有它的缺点,而且还是无法解决的大难题:就是这些串联的计算机都达不到金融级别的稳定性,如果其中一台机器罢工,容易产生多米诺骨牌效应般的连锁反应最终整个网络都会集体崩溃。
在技术上实现一台机器出问题,其他机器即时补好备份数据不难,难点在于让每台机器的工作量始终保持均衡。如果不均衡其中某一台工作量过大的计算机容易崩溃,继而又引发出一场大崩溃。
这也是分布式数据库在七十年代就提出却老也没成功的原因。
杨正昆干的就是这个。