大云时代到来,云到底安不安全?该从哪些方面考虑要不要上云?未来的趋势怎样的?
一、大云时代的IT架构
在真正的云的时代,企业的IT架构是一个什么样的形态?
从下往上看,很多企业IT里面直接是硬件服务器,再加上企业级的软件。后来为了提升资源分配和管理的效率,上面就加了一些虚拟化层。
虚拟化的概念,从IBM大型主机的年代,到银行还在广泛使用小型机的现在,这里边有了硬件分区和虚拟化的东西。接下来Vmware开始做X86架构,也就是英特尔cpu的虚拟化,再进一步带动了开源社区的KVM和Zen的发展。
虚拟化技术逐步走向成熟。从商业形态上面,AWS在十几年前推出了S3和EC2这样的存储虚拟化和计算虚拟化的、以商业形式作为service提供出来的、按使用量去付费的、在线提供资源的模式。现在微软的Azure、阿里云、腾讯云以及市面上各种云公司都在向大众提供像水电一样方便的云服务。
我个人对于云的理解是两方面,一方面是成本,另外一方面是效率。形态上来看,就是按需获取、按使用量去付费,解决资源的闲置,或者是说预先采购、一次性投入资金的成本问题,以及后续的资源分配、资源管理层面效率的问题,最后会折算成企业IT上面的TCO的一部分。
除了市面上现在在推的这些做基础设施云的公司之外,最上面一层是一些SASS服务。比如说ServiceNow(日常办公的)、Salesforce(销售的)、Slack(沟通工具),然后是Dingtalk(钉钉)、wechat Enterprise(企业微信)、Zoom(刚刚上市的一家华人创办的公司)、Webex(和Zoom一个体系,后来被Cisco收购了)、Teambition(上海一家做项目管理的云服务的公司)。
所以综合从下往上看,从裸金属bare-metal到上层云服务,现在其实有很多厂商去提供物理机的云服务,即可以按需租借的物理机。
再往上一层,就是各种资源的池化、虚拟化的能力。
二、云管理和云服务的概念
在云之上的一个概念叫Cloud native application,就是云原生应用。这些应用程序开发的时候,已经不再考虑具体跑在什么物理硬件上面,而是直接参考这些云提供什么样的服务,利用这些云的服务来开发云原生的APP。
同时因为云作为基础资源的一部分是需要管理的,这些云端的服务相对有两个形态:一个是个人或者组织可以直接有一个界面,独立使用相关的功能,比如说独立使用视频会议,独立使用项目管理;另一个,比如说Sales Force和Slack,它有API提供出来,可以对当前企业流程中的一些关键的点可以去做钩子,可以去做集成和整合,最终融合成整个企业it的一个组件,作为第三方的外部服务嵌入到整个流程里来。
所以应运而生的另外一个概念叫云管平台 (cloud management platform)。很多云公司都出过或大或小的事故,即所谓的黑天鹅事件。应用架构做得再完备,总有一些外部的或者是内部的一些因素考虑不到。以前物理机可以多买几台做备份,现在到了云时代,这么多家云服务商,怎么管好这些云、用好这些云,做到业务的连续性、业务架构做的可靠性?那就要说到云的生长和建设过程了。
三、云的生长和建设过程
我们从基础设施看一下这些云是怎么生长和建设的。最基础,每家云服务公司现在都有全球的数据中心和布点。那么这些点的基础是靠各种海底光缆和陆上光缆,比如说中国到欧洲,其实除了海缆之外,还有陆缆。这些数据中心通过物理光纤,加上现在我们讲的sd-wan(就是软件定义的广域网,包括有卫星通信的一个信道),把最基础的一张大的全球平面的互联网给连起来。
平时我们上网其实使用的是接入网的技术,结合现有的连接的基础设施,除了骨干网之外,就是3G、4G、5G(2G和3G基本已经被淘汰)了。像NB-IoT、 wifi、Lora,现在主要用于设备连接,物理的手机以及家里的各种设施连接。对于可靠性要求比较高的场景,有光纤以及同轴电缆这样的物理技术。
在有了可靠的基础设施之后,因为业务转型原因,比如说以前做to B的银行慢慢要转向零售或者开放银行的概念,这时我们的数据量,包括交易量,都会暴涨,同时可能会面临开放场景下的欺诈、攻击等等问题,包括信用的审查、风险控制等,都需要大数据的支撑。
当前所有这些基础设施都是由软件来管理的,这些软件把所有的资源按需去提供,可以去做资源的高可用的保障。比如说光纤断掉之后,链路可以自动切换。这些其实构成了可靠性的基础。还有其他的互联网的技术层面的基础设施,都是由软件协商和协调的。这些东西从最终的呈现形态上来看,就是我们比较可靠的云服务。
但是有时候数据量也不一定要特别大。因为很多时候我们其实是靠常识就能确定的,一定程度上数据只是用来帮我们去验证的,去辅助我们的决策的。所以通常我们做企业的大数据,或者说企业的商业智能BI,我们是在流程里边尽可能多的去留存尽量详细的数据。同时我们引入适当的工具,去做相应的分析,同时做小步快跑的迭代。
四、大数据和AI的取舍
大数据云存储的开发,包括数据的清洗、数据的分析框架、AI、机器学习的计算平台,整体的一套循环。 这一整套的全自动化的流程,是可以从数据的采集、到最终数据输出结果、再回馈给业务这么一个链条。我们可以先把数据全部都存起来,再根据实际的情况抽取出来分析。
而现在AI用的哪里用的最多呢?按照我过去从业的经验来看,大部分的都还是集中在这个机器视觉,比如说人脸识别。现在安防行业可能基本上是维持了整个AI产业的运转。关于A.I.这一块,大家都有很多的认知,比如手机上的摄像头拍完照片之后自动美颜、智能安检、智能体检,再比如互联网上一些违规内容的检测、筛查、公共安全,已经在深刻影响人们生活了。
当前的机器学习以及AI还是非常重地依赖于数据样本质量和相应的参数调优,或者说强场景结合的一个点。一定是在针对有特定场景需求的情况下,针对性地去收集数据,才可能有一个比较好的效果。所以有时候比较笼统地说一套大数据或者是一个A.I.系统,并不一定会短期看到效果。往往很多事情我们都会在高估它短期的价值,低估它长期的价值。
关于AI的应用,我们举两个例子。
一个是关于警察的岗位考核。通过摄像头拍摄可以知道警察上班时是否有过违规违法行为。督察部门会根据这些计算机分析出来的特殊场景中,是否有过违规来作为考核的参考。这些场景都比较特殊,和识别人脸、验证一个身份还不太一样,这是拿到了大量的具体数据之后,经过一周或者两周的训练,生成相应的模型,集成在应用程序里边去做场景化的智能。
另一个是关于渣土车的治理。渣土车属于比较高危的车辆,怎么监管?比如说有没有蒙上合适的覆盖物、车牌有没有遮挡、车体是否干净、是否有按照指定的轨迹去行使、有没有超速等等,这些问题都需要被严格监管。 那么在这个项目上面,高清的摄像头可以识别渣土车的各种状态,一旦出现问题,就可以及时给城管、综合治理部门以及交警部门发送信息预警。
五、不同云管理的数据安全问题
关于多云管理,多家公有云或者说一家公有云的多个区域之间,做好热备或者说互备,可以规避云上面的系统性风险。另外一块是混合云,比如说某保险,他们在大型云服务公司上用一些虚机做前置接入,使用云防火墙等安全服务,后边通过专线连回自己的数据中心,前端互联网业务、后端就是核心业务,和银行有点像。 这样做,相比过去的传统做法来讲,数据比较安全,核心业务比较安全。
现在都在讲企业上云,我个人曾经帮助过很多拥有海量数据的企业、具有复杂流程的企业、要求高安全性的企业去上云。国内上云总体来讲还是一个信任的,或者说信心的问题,你是否能支撑我的业务?或者说我的数据放上去,你是否能保障我安全,不去窃取我的数据或者怎么样?其实整体来看,公有云正常来讲还是比个人或者小公司自己去做要安全许多。
六、云应用的实战案例
最后给大家讲两个云应用的案例。
一个是某银行,因为整体的业务转型,要求业务开发的灵活性以及基础架构的灵活性,需要去支撑海量的零售用户,把以前以垂直业务为核心的应用架构改造成以用户账户为中心的架构。我们结合他们的业务部,重新规划了一版新的内容管理平台,整体是面向零售侧的广大C端用户,流程里边所有的信息采集、管理,包括模型训练,以及其他的流程支撑,我们把所有的用户数据做了一个集中。这样做的好处是,行内基本上所有的应用都可以共享一套用户信息。在风控效率、资源的整合、后台的监督等等方面,包括基于人工智能和机器学习,在训练各种模型以及用户画像方面有了巨大的效率提升。这个平台上线一年时间就接入了几十个核心系统,到目前已稳定运营了好几年。
另一个案例是某通讯公司,该公司业务包括集团下所有物联网相关的从芯片连接、数据的存储、车联网、视频云等等方面的全平台建设。之前的供应商在数据存储方面出了比较大的问题,无法满足快速增加的业务需求。后来我们帮他们建立了一个海量的,数十个P大小的存储系统,包括车联网的数据、他们自己的另外的一些海量的物联网卡,各行各业的物联网卡的数据的收集、分析、后期的运营,全部放在了一个统一的数据平台上面。当然这些数据都放在客户自己的IDC的机房里,而且最后只需要按照使用量或使用结果来付费即可。
七、未来云转型的大趋势
整体来看,不管是产业互联网、物联网,包括我们的日常生活,其实都是逐渐在往云上转移,只是说对于云,不同的场景会有不同的理解,不同的行业也会有不同的需求,没有放之四海皆准的云概念。只要能满足大家的管理的效率、使用的成本、灵活地获取和使用,作为一种服务的形态来融入到企业的流程,或者说能够很好地支撑企业的业务,就够了。
总结一下,就是说我们要把产品服务化,便于去更好地去交付;把服务去做产品化,便于提升交付的效率。整体上来讲,这就是我的对于云的理解。我们平衡好效率和成本以及其他利益方的关系,向云的转型肯定是势在必行的,只是早晚问题。