注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

钱五哥の163空间

记录俺的生活和工作历程

 
 
 

日志

 
 
关于我

从事网络通信软件和开发管理开发多年,了解各类软件系统的架构、设计、开发和测试以及相应的开发方法。工作之余,喜欢研究一些自己感兴趣的事情,包括写写小程序、做做木工、看看连续剧、读读军事杂志、养鱼种花等等

网易考拉推荐

盛大云云主机发生故障,多用户数据丢失事件的简要分析  

2012-08-08 14:14:52|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

和朋友们讨论了一阵子,然后又分析了两者的网站。基本上认为是宣传口径问题。业内人士都知道,弹性计算环境中,虚拟机自带的本地存储实际上是没有可靠性保证的,也没有持久化,只有EBS这类存储才是可靠的。

?

云主机的宣传在这里(http://www.grandcloud.cn/product/c2),里面介绍的都是云主机的优点,但是没有提供SLA。帮助栏目中显式介绍了本地硬盘的不可靠问题,但是里面只是说回收后才被删除,没有说运行中也会故障(http://www.grandcloud.cn/product/help/c2)。原文如下:

系统删除之后数据就没有了?

是的,请注意,云主机缺省的系统盘在删除云主机之后,是会被回收的,同时系统盘中的数据就会被清理。请通过如下方式保存您的数据:

  1. 购买一个云硬盘,将数据存储在云硬盘上;
  2. 通过API将数据以Key/Value方式存放在云存储上;
  3. 制作镜像,启动的时候从镜像创建云主机。

云主机重启,/data下的数据和/分区的数据不会丢失吧?如果云主机上层的 host机器重启了呢?

云主机或者上层的host重启是不会丢失数据的,请放心。

?

这一点和亚马逊的介绍方式(http://aws.amazon.com/ec2/)不一样。亚马逊在介绍中直接推荐了EBS作为持久化存储和SLA,分别如下:

Amazon Elastic Block Store – Amazon Elastic Block Store (EBS) offers persistent storage for Amazon EC2 instances. Amazon EBS volumes are network-attached, and persist independently from the life of an instance. Amazon EBS volumes are highly available, highly reliable volumes that can be leveraged as an Amazon EC2 instance’s boot partition or attached to a running Amazon EC2 instance as a standard block device. When used as a boot partition, Amazon EC2 instances can be stopped and subsequently restarted, enabling you to only pay for the storage resources used while maintaining your instance’s state. Amazon EBS volumes offer greatly improved durability over local Amazon EC2 instance stores, as Amazon EBS volumes are automatically replicated on the backend (in a single Availability Zone). For those wanting even more durability, Amazon EBS provides the ability to create point-in-time consistent snapshots of your volumes that are then stored in Amazon S3, and automatically replicated across multiple Availability Zones. These snapshots can be used as the starting point for new Amazon EBS volumes, and can protect your data for long term durability. You can also easily share these snapshots with co-workers and other AWS developers. Amazon EBS provides two volume types: Standard volumes and Provisioned IOPS volumes. Standard volumes offer cost effective storage that is ideal for applications with moderate or bursty I/O requirements. Provisioned IOPS volumes are designed to deliver predictable, high performance for I/O intensive applications such as databases. See Amazon Elastic Block Store for more details.

?

Reliable – Amazon EC2 offers a highly reliable environment where replacement instances can be rapidly and predictably commissioned. The service runs within Amazon’s proven network infrastructure and datacenters. The Amazon EC2 Service Level Agreement commitment is 99.95% availability for each Amazon EC2 Region.

?

此外在报价方面AWS的EC2也是明白地说明存储是“local instance storage”,这和盛大也是不同的。

?

===========================原文转载====

?

CBSi中国·ZOL 作者:中关村在线 涂兰敬 责任编辑:涂兰敬 【原创】 2012年08月08日 01:38 评论(2)

在本页阅读全文(共2页)

??? 8月6日晚上8:10,盛大云在其官方微博上发布一则因云主机故障致用户数据丢失事件的公开声明。声明说到:8月6日,盛大云在无锡的数据中心因为一台物理服务器磁盘发生损坏,导致“个别用户”数据的丢失。盛大云已经在尽全力协助用户恢复数据。

盛大云公开申明一石激起千层浪

??? 一石激起千层浪。“一台物理服务器磁盘发生损坏”就导致用户数据丢失。这个解释似乎并没有让网友和用户们信服。很多网友直接在微博上回复自己的质疑。

??? 有网友直接质问:你们难道连RAID都没有么?另外,也有人提出:盛大云怎么存储还用宿主机物理硬盘?这也叫云?就算用宿主机物理硬盘,也该有个备份吧。

盛大云云主机发生故障 致用户数据丢失

??? 并且有网友对盛大云数据中心的规划提出了质疑:盛大云是需要建立规模化的数据中心,四处搞一些小机房太分散了。灾备有没有做到位?最基本的,RAID做了没?这些是盛大需要思索的问题。

?? 有网友一针见血地指出盛大云的本质:所谓盛大的云主机其实就是虚拟机而已。 可悲的是即便是物理机虚了几台,也应该挂RAID啊。服务器挂硬盘做数据存储还是比较罕见的吧。

??? 还有网友提出了对丢失数据的用户赔偿问题:客户不是专家,如果造成了经济损失,就要赔。服务既然是服务,就应该有SLA。SLA应该对云存储服务水平,业务连续性程度,数据安全级别,数据恢复时间,罚责等做出明确定义。服务等级和SLA不同,成本上的投入自然不同,价格也相应不同。

??? 很多网友提出让盛大云提出对个别数据丢失的用户赔偿计划:如果根据国内云厂商的SLA,用户数据丢失,云厂商相应的得要负数据丢失的损失责任,而且要赔偿百倍宕机时间。????????

盛大云因硬盘损坏导致用户数据丢失
图 盛大云公开声明

??? 对于因为一台“物理服务器磁盘发生损坏”,导致“个别用户”数据的丢失的情况,盛大云技术人员给出自己的解释:虚拟机的磁盘有两种生产方式,一种是直接使用宿主机的物理磁盘。这种情况下,如果宿主机的物理磁盘发生故障,云主机不可避免会造成数据丢失,这也是本次事件产生的原因;另外一种是使用远程存储,也就是盛大硬盘产品,这种方式实际上是把用户的数据存到了远程的一个集群里,并同时做了多份备份,即使宿主机出故障也不会影响到云主机的数据。

??? 因为物理机的损坏很难避免,为了避免您遇到意外损失,我们建议您在云主机之外,也做好数据备份。

在盛大云官方微博的回复中,并不是一边倒的骂声。有的网友也提出了不同意见:公平说句,这个真不怪盛大。需要数据保护就不应该用宿主主机物理硬盘,而采用外部存储,例如盛大其他的云存储存储服务。

盛大云因硬盘损坏导致用户数据丢失
图 网友吐槽盛大云

??? 这种声音很快就被一片骂声掩盖,有网友直接次责盛大云以上的解释:负责故障的盛大同学当其他人不懂存储了?!难道宿主机的磁盘没有做RAID,也没备份?丢数据实在是大事故,难不成别人每天把几十G数据往其他网络备份。

??? 但是,有网友认为:如果用raid,骂得人会更多。raid修复的时候磁盘重载,整个系统可用性急剧下降,一次影响几十台虚拟机。

??? 盛大云感觉自己的做着主动地坦白,同时还推销了一下自己的云存储,没有曾想到,却掀起网友大范围的痛批。到记者发稿之时,这篇道歉信已经被转发1800次,评论700多次。也就是查不到三个转发者,就有差不多一个人忍不住想骂上两句。

盛大云因硬盘损坏导致用户数据丢失
图 盛大云转发和评论数

??? 真不知道,盛大云这次事件算得上失败的危机公关,还是真正意义上的技术故障。

??? 其实,我们看到国际上一些IT巨头提供的公有云都曾经出现过安全事件,亚马逊最多,谷歌、微软等一些云服务提供商都出现过安全事件。既然事情已经出现,仍然希望盛大云也能够学习一下IT巨头们处理此类事件的态度,开诚布公,直面问题。

??? 盛大云首先需要以端正的态度安抚和赔偿丢失数据的用户损失,同时还要在数据安全上考虑的更加周到,杜绝类似事件再次发生,并最终公开一个解决方案。不是危言耸听!如果这类事件处理不好,影响的不仅仅是盛大云一家企业的未来,一定还会影响到其它云服务提供商的信任危机,加深企业用户对云计算的不信任感。

  评论这张
 
阅读(116)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017