2015-06-01
浅析上海云计算分布式系统工业设计注意点
   尽管我们声称为群集,每台机器很可能是出故障了。但这样做的设计,但是一些资源给用户直接暴露的服务的物理地址。对于服务器服务几年,发生故障的可能性是很大的,特别是如果平时在服务器负载是相当高的。我不知道什么是服务器保修时间的平均水平,但绝对不能是几个小时搞定,更短的时间为一天,超过半个月甚至更长的时间。对于高级用户,它使用本地缓存,或其他策略来屏蔽呼叫服务的影响是不可用,然而,停服对用户的副作用的几天,无论多么不可能忽视。
 
 
  
  后发现的问题,可以简单地释放API的新版本,或一个简单的配置文件可以被校正。对于在线用户,然而,他们正在运行的状态已经运行服务。这个简单的修正可能需要他们的服务重新启动,这对于一个大集群,成本是非常高的。如果因为这个服务不可用,从而导致事故发生在网上,然后在应用程序方面将肯定是一个非常活跃的修正这个错误。但是,如果使用的架构发现了这个问题,并积极推动应用程序修改,可能的应用将推动因为种种原因起飞。
  
  设计服务的接口,因此,要注意的是这个接口必须是稳定的,并且后端服务失败,升级的操作是很重要的,例如绝对如果透明的用户。不要把服务暴露给用户的实际地址:这个服务器总有一天会死。特别是对于需要编译如C ++ API,界面更重要。毕竟对于申请方的API的变化意味着重新编译;重新编译的手段去释放的过程:至少跌落试验。

版权所有 © 2017 万象设计江苏责任有限公司版权所有    |    苏IPC备11051157号-7