大数据多租户管理问题 (立项调研)

运营商的数据接入应用都涉及到很多部门,也是非常头疼的问题。
这样如果对于不同的应用/数据使用不同的集群,就涉及到数据共享问题,这肯定是难以接受的,也不符合大数据的架构特点。而使用同一个集群就涉及到应用资源抢占(比如CPU 内存)的问题,每个应用都应该都一个特定的资源比例,比如A应用理论能使用集群80%的资源,B应用重要性比较低使用20%的资源,在实际执行中如何达到这样资源隔离的效果。
另外数据的安全管控是一个问题,希望达到一个多应用、多数据管控公用的集群效果,有什么好的建议?
参与22

15同行回答

sprewellkobesprewellkobe专有云TX
回复 5# zhangfengyu     资源隔离和虚拟化是两个事,你这做资源隔离根本不需要虚拟化,对于linux cgroup可以解决你的问题,cpu、io、net、memory都可以做隔离,对于其他操作系统也有相应得解决方案...显示全部
回复 5# zhangfengyu


    资源隔离和虚拟化是两个事,你这做资源隔离根本不需要虚拟化,对于linux cgroup可以解决你的问题,cpu、io、net、memory都可以做隔离,对于其他操作系统也有相应得解决方案收起
互联网服务 · 2015-03-11
浏览2952
zhangfengyuzhangfengyu信息分析/架构师中国电信
回复 3# 北京荣歆咨询     非常感谢。如果不使用虚拟化技术能否做到呢?显示全部
回复 3# 北京荣歆咨询


    非常感谢。如果不使用虚拟化技术能否做到呢?收起
电信运营商 · 2015-03-10
浏览2919
zhangfengyuzhangfengyu信息分析/架构师中国电信
回复 2# 北京休伦科技 嗯。这个用不用虚拟化没有关系,我们不太考虑商业的解决方案了。显示全部
回复 2# 北京休伦科技
嗯。这个用不用虚拟化没有关系,我们不太考虑商业的解决方案了。收起
电信运营商 · 2015-03-10
浏览2960
北京荣歆咨询北京荣歆咨询系统架构师北京荣歆咨询有限公司
运营商的数据接入应用都涉及到很多部门,也是非常头疼的问题。这样如果对于不同的应用/数据使用不同的集群 ...zhangfengyu 发表于 2015-3-9 14:55 就涉及到数据共享问题,这肯定是难以接受的,也不符合大数据的架构特点。而使用同一个集群就涉及到应用资源抢占(比如CPU 内存)的...显示全部
运营商的数据接入应用都涉及到很多部门,也是非常头疼的问题。
这样如果对于不同的应用/数据使用不同的集群 ...
zhangfengyu 发表于 2015-3-9 14:55


就涉及到数据共享问题,这肯定是难以接受的,也不符合大数据的架构特点。而使用同一个集群就涉及到应用资源抢占(比如CPU 内存)的问题,每个应用都应该都一个特定的资源比例,比如A应用理论能使用集群80%的资源,B应用重要性比较低使用20%的资源,在实际执行中如何达到这样资源隔离的效果?
A:我想计算资源的管理和控制还是有多种办法的,需要分析确定的需求来选择恰当的方式。比如,同一集群内多个node运行的应用其实是可以不同的,只要应用不冲突,不同的应用也可以同时运行在某些相同node上,而每个node在虚拟化下变为动态的VM,资源也具有动态性和容量自动调整的能力。所以,隔离应该不难实现,动态调整需要分析需求然后细化方案。
另外数据的安全管控是一个问题,希望达到一个多应用、多数据管控公用的集群效果,有什么好的建议?
A:数据管控要根据实际需求来看,关键是哪些应用可能修改数据,避免冲突。对于只读的应用访问相对容易,可以通过设定只读权限,或增加只读副本来增加数据并发访问性能的同时达到数据可靠性和一致性的实现。对于数据修改的需求,一般权限应该集中到某一个应用接口上,避免数据的不一致。当然,这个应用本身可以是并发的,来提高并发性能。
鉴于对需求了解有限,以上仅供参考。
收起
IT咨询服务 · 2015-03-09
浏览2956
博飞信息科技博飞信息科技CTO博飞信息科技(上海)有限公司
OpenStack中的Flavor是可以对CPU/存储IO/网络IO做出限制的,但是不是非常灵活,个人感觉您的场景好像更适合使用VMWare的解决方案呢(DRS)?显示全部
OpenStack中的Flavor是可以对CPU/存储IO/网络IO做出限制的,但是不是非常灵活,个人感觉您的场景好像更适合使用VMWare的解决方案呢(DRS)?收起
软件开发 · 2015-03-09
浏览2988
rui_jhrui_jh软件开发工程师18
YARN or Symphony显示全部

YARN or Symphony

收起
互联网服务 · 2016-03-13
浏览2214
sprewellkobesprewellkobe专有云TX
回复 11# zhangfengyu     为啥难以管控呢?不太理解,我这么问吧,你做资源限制的目的是什么?1,把yarn跟其他【别的】业务隔离2,使使用 yarn分析的各业务隔离显示全部
回复 11# zhangfengyu


    为啥难以管控呢?不太理解,我这么问吧,你做资源限制的目的是什么?

1,把yarn跟其他【别的】业务隔离
2,使使用 yarn分析的各业务隔离收起
互联网服务 · 2015-03-13
浏览2147
xuyanhuixuyanhui信息分析/架构师58同城大数据
回复 13# zhangfengyu     现阶段还没有开源出来这部分的代码,不过我们之前做过调研,以及工作量的评估,业内腾讯和阿里这部分都已经实现了这部分修改。相信用不了多久开源的方案也会有的。...显示全部
回复 13# zhangfengyu


    现阶段还没有开源出来这部分的代码,不过我们之前做过调研,以及工作量的评估,业内腾讯和阿里这部分都已经实现了这部分修改。相信用不了多久开源的方案也会有的。收起
互联网服务 · 2015-03-13
浏览2106
zhangfengyuzhangfengyu信息分析/架构师中国电信
有没有现成的方案或者相关资料,修改yarn的源代码有难度哦显示全部
有没有现成的方案或者相关资料,修改yarn的源代码有难度哦收起
电信运营商 · 2015-03-12
浏览2141
xuyanhuixuyanhui信息分析/架构师58同城大数据
是可以结合的,但是要去修改yarn的代码,这部分修改起来问题不大。我之前调研过。显示全部
是可以结合的,但是要去修改yarn的代码,这部分修改起来问题不大。我之前调研过。收起
互联网服务 · 2015-03-11
浏览2144

提问者

zhangfengyu
信息分析/架构师中国电信
擅长领域: 大数据虚拟化云计算

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2015-03-09
  • 关注会员:2 人
  • 问题浏览:14722
  • 最近回答:2016-03-13
  • X社区推广