那些便宜得离谱服务器是怎么来的?
这篇聊的是硬件。这些年IT行业似乎已经与硬件无缘了,一会儿云计算,一会儿区块链,一会儿AI。然而,硬件发展的脚步从来没有停歇过。这些技术的背后都带着硬件技术的发展。无论你“应用侧”有什么创新,都离不开计算和存储,都离不开硬件的支持。说回到我们的主题:那些便宜得离谱服务器是怎么来的?大家自己建站或者在选择VPC(虚拟主机)/云计算的时候可能发现:啊?它们家的主机怎么这么便宜?这里给大家直接曝光...
这篇聊的是硬件。这些年IT行业似乎已经与硬件无缘了,一会儿云计算,一会儿区块链,一会儿AI。然而,硬件发展的脚步从来没有停歇过。这些技术的背后都带着硬件技术的发展。无论你“应用侧”有什么创新,都离不开计算和存储,都离不开硬件的支持。
说回到我们的主题:那些便宜得离谱服务器是怎么来的?
大家自己建站或者在选择VPC(虚拟主机)/云计算的时候可能发现:啊?它们家的主机怎么这么便宜?
这里给大家直接曝光下原因(说是曝光毫不为过)。
给大家介绍4种降低服务器成本的方法:旧服务器/团购服务器/云超售/裸金属:
旧服务器和团购服务器是在硬件的成本上做文章,降低硬件成本,技术上和一般的服务器没区别;
云超售则是在软件上下手,降低成本提高售价;
唯独裸金属服务器是从底层技术上革新,把成本降得最低。
旧服务器虚拟化
成本:★ ,技术含量:★ ,服务能力 :★
这个方案没什么技术含量。
很多服务器5年以上了但是还可以使用,运转正常。信息技术公司又生命周期很短,所以很多硬件会被更替,就被一些虚拟化公司收购。这些旧服务器里的某些部件可能被简单升级,甚至完全不升级就直接上架提供服务了。因为很多网页服务其实只需要有个服务器就可以了,访问量很低,对算力的要求也很低,所以这些硬件完全可以支持。
这些服务器往往很廉价,甚至不要钱,因为财务上已经认为这些资产的价值是0了。买方甚至只需要出个运费和安装费,然后以后收入能覆盖电费就不亏了。所以对外的租用成本可以低得离谱。
大量采购压低硬件
成本:★ ★ ★ , 技术含量:★ ★ , 服务能力:★★ ★
这个方式,大家是可以猜到的,就跟PDD一样,团单是比单买要便宜的,然而这并不是这个采购形式的全部。
云计算公司或者虚拟主机租用公司(甲方),通过大单向硬件厂商(乙方)购买服务器,在购买的同时,甲方会附带一系列的要求,比如摒弃一些不常用的功能模块以降低成本;再比如,做一些特别定制的甲方特殊需求。这样一来,乙方一方面降低了价格,另一方面这样生产出来的硬件,只有一个甲方会采购。因为只有一个甲方会采购这种硬件,甲方又有了压价的可能性,除非乙方放弃生产线转产,否则很难对抗甲方。
黑么?
这就是云计算的本质啊!好比我成了最大的流量平台,客户都要从我这里购买,厂商也不得不给我低价。
云平台超售
成本:★ ★ ★ , 技术含量:★ ★ ★ , 服务能力:★ ★ ★
说到这里,就有一些技术含量了。
原理:
大家最早接触“超售”这个词,可能是从航空公司那边来的。我们先看一种情况:一架飞机可能只有200个座位,如果航司只发售200个座位,到出发当天,有些旅客因为行程变更可能就没来/或者改签到别的航班了,所以飞机上就会出现空位。这样一来,这些空座位就没有被充分的利用。为了利益最大化,航空公司想出了一个办法,就是“超售”。
一家飞机有200个座位,但是航司会假装它有220个座位,对外进行发售,这个就是“超售”。万一有旅客没有来办理登机手续的话,实际乘客数量就可能低于200个,这样所有乘客就可以顺利登机了。
然而,有个小风险,如果220个客户都来了怎么办?一般航司会采用下面的办法之一:
给客户升舱,没准经济舱满了,但是商务舱和头等舱还有座位,可以给客户升舱保证可以所有人都登机;
请客户改航班,并且给补偿;
请客户延期,并且给补偿;
胡搅蛮缠,说客户没有确认机票。
那么服务器是怎么"超售"的呢?把一台服务器当两台卖吗?大致是这个意思,但是也没那么简单:
如果一台16核的服务器可以被虚拟化成8台2核的服务器,这就是最普通的虚拟化了。这样做价钱也不会很低。
然而,如果我们把一台16核的服务器,虚拟化成16台2核的服务器呢?是不是就可以卖更多的钱了呢?
你可能会问:怎么还能有这种操作?!
技术上,其实早就可以这样操作了,而且也算是个虚拟化技术里,半公开的秘密了。这样虚拟出来的服务器,每个有2个“逻辑核”,好像一共有32个“逻辑核”,而实际上一共还是16个“物理核”。这就是服务器CPU的“超售”。说白了是个“赌博”。大多数时候,这16个2核服务器不会同时处于繁忙状态,有的忙有的闲。忙的服务器就占据2个核的算力,闲的服务器就几乎不占据CPU资源。这样16个虚拟服务器可以相安无事。
一些云计算厂商会把这个“复用”率算入价格里面,因此客户可能只需要付1.5个核的钱,就可以享用2个核的服务器了。
问题
但是,如果这16个服务器同时繁忙起来怎么办呢?那就没有办法了,这些服务器会开始抢CPU的资源,平均下来每个服务器还是只能占据大约1个核的算力。
这种场景会出现在计算密集型的云服务上,比如高并发的用户访问,或者集中的AI计算(可能一次需要几百台服务器跑3天的那种)。
所以一些云服务厂商为了能赚取更多的利润,会大量超售自己的CPU算力,闲的时候一切太平,忙的时候天下大乱。用户花了1.5个核的钱,但是只获得了1个核的算力甚至更低。
裸金属服务器
成本 :★ ★ ★ , 技术含量:★ ★ ★ ★ ★ , 服务能力:★ ★ ★ ★ ★
裸金属是今天的重点,上面无论那种方案在硬件上/软件上,实际上没有任何创新。
然而,裸金属服务器就不一样了, 它们和普通云计算主机有本质的不同。
我们都知道一台服务器,一般有这些部件:主板,CPU,内存,硬盘,网卡。(有些服务器需要GPU,可以认为它们接近CPU,先不单独讨论。)然而其实对客户有实质影响的基本就是:CPU/内存/硬盘,这三个要素。基于这3个要素,我们的裸金属服务器诞生了。
脑洞
大家跟我一起开个脑洞,如果我们的服务器像一个大型乐高玩具会怎样?
假设我们有一个超大超灵活的“主板”(好像乐高玩具的底盘),主板上可以插“计算卡”和“存储卡”。一个计算卡,包括CPU和内存(也可以带GPU);一个存储卡可以带一个4T的硬盘。然后这个大“主板”上再带一个千兆网卡,解决所有计算卡的网络需求。我们就组合出一个超大型的服务器了啊。想要算力就插“计算卡”,想要存储,就插“存储卡”。而且因为主板/网卡/机箱等等都是复用的,所以成本大大降低了。
这其实不是脑洞,这就是裸金属服务器的底层技术,它和云计算技术基本是同时出现的。只不过云计算走的是软件虚拟化技术,而裸金属服务器走的是纯硬件。
高性能无超售
裸金属服务器因为是硬件的拓展,所以没有超售这一说的。一个计算卡,就是一台服务器,每个服务器都是用户独享的,没有复用或者超售这一说。所以性能绝对有保证。
高可用
一个主板上有很多的“计算卡”,在一个计算卡发生“失败”的时候,另一个空闲的计算卡可以马上顶上来,这就实现了服务器的高可用性。因为失败的比例不高,一个大主板如果有30个繁忙的计算卡(active),保留3个空闲的就算卡(passive)也就可以了,也就是active-passive的比例是10:1。然而如果是传统高可用架构的话,客户需要自己配置active-passive的负载均衡,比例一定是10:10,这样一来,一定有一半的服务器要闲着!从这点看,客户如果采用裸金属服务器的成本又可以降低40%。
不光计算卡可以高可用,存储卡一样是高可用的。每份数据都有3份备份。任何两份失败了,服务器都可以正常运转。
高密度
还有一个重要的影响服务器成本的因素,被很多技术人员忽略的,其实就是“土地“的成本。安装服务器的机柜是要占用数据中心的面积的,说白了,就是土地的成本。一个标准的机柜差不多是“42U的高度”(没见过机柜的同学就认为是42个插槽好了)。我们现在常用的“刀片机”一般占据一个插槽的空间。但是因为散热和布线的问题,42个U不能都占满。所以一个机柜可能最多放20~25个服务器也就差不多了。
那么一个同样的机柜可以插放多少裸金属服务器呢?
.
.
.
.
240~300台服务器!!!OMG!!!
是的,我没写错。这个密度基本是传统服务器的10倍。房价大家都知道了,如果一平米的旅店原本住1个人,现在能住10个人,性能还完全不受损失,你说它是不是应该节省大量成本?!?!
对于那些寸土寸金的地段,这个高密度服务器部署的方案简直就好像让它的面积扩大了10倍的效果!!!
管理成本低
最后还要提一点,虽然服务器很多,密度又高,但是我主板数量少啊!所以管理成本很低!
支持300台服务器的主板可能就5个就够了,一个主板如果配双路电源,双千兆网卡的话,也就是只需要10个电源线,10条网线就可以支持300台服务器了。
纳尼?!
如果部署传统的服务器一个机柜20台服务器,还需要40根电源线,40根网线呢!!!!你说你300台服务器只需要10个电源线和网线?!?!
这才是黑科技啊!
不光电线网线少,而且大部分的服务器管理操作都可以通过远程完成,具体如何做我就不细说了,基本上除了上架的时候,都不太需要人去机房做操作。你说省钱不省钱?
总结
说到这里我就不再扯了,大家有问题的话,欢迎沟通和讨论。总结下:
旧服务器和团购服务器是在硬件的成本上做文章,降低硬件成本,技术上和一般的服务器没区别;
云超售则是在软件上下手,降低成本提高售价;
唯独裸金属服务器是从底层技术上革新,把成本降得最低。
如果大家还有别的思路把服务器的价格降下来,欢迎交流!我也学习下。
作者:马尔代夫 转载请注明作者及出处。
更多推荐
所有评论(0)