中企动力 > 头条 > 数据站

网站性能检测评分

注:本网站页面html检测工具扫描网站中存在的基本问题,仅供参考。

数据站

Alluxio发布新版本V1.8,加速数据分析和机器学习的云端部署 企业视频课程

img

卷毛猪

关注
云端逐渐成为大数据企业的必争之地。根据美国媒体报道,7月31日消息,分布式虚拟存储系统Alluxio发布1.8版本,加速针对数据分析及机器学习的云端部署。

Alluxio是世界上首个能以内存级速度集成数据的软件系统,其技术脱胎于其创始人李浩源博士在加州伯克利AMPLab的博士课题开源研究项目Tachyon——它能够在大数据应用层及存储层之间搭建一个虚拟数据层,让企业能够利用这个系统来使用和管理不同的数据应用及存储方案。此前,全球知名的现象级开源软件Spark及Mesos同样出自AMPLab,只是不同于针对存储的Alluxio,前者专注于计算,后者则专注于资源管理和调度。

由于拥有内存级的访问速度,Alluxio系统比过去的方案快了十倍甚至数十倍。

创建五年后,Alluxio是最活跃的数据生态系统开源项目之一,解决数据问题的能力备受信任。在中国市值排名前十的互联网公司中,已经有八家在应用Alluxio的技术方案,管理PB级别的数据。除此之外,华为、联想、中国电信、京东等公司也都在用它来管理数据,其他合作伙伴包括英特尔、三星、微软、Nvidia、Oracle等等。

Alluxio经历了数次版本更替。通过此次更新,这个系统希望能进一步支持不同的云端存储方案,加速数据储存、调取和使用的速度,解决深度学习面临的数据存储问题;与此同时,给他们非常重视的开源社区提供更多的支持和帮助。

针对云端部署,Alluxio的新版本提供了三个全新的功能:

1. 感知定位的数据管理工具。企业可以为数据应用设置不同的策略,根据数据的位置标记来选定具体的数据调用区域或者优化数据分布,从而降低调用不同存储位置的数据时的成本、提高效率。

2. 针对不同云端存储方案的优化。解决对象存储或者云端存储方案和传统的HDFS(HadoopDistributedFileSystem)方案中的API及执行效率的差别带来的问题;也让把数据从HDFS转移到对象存储时更加容易,真正做到在云端轻便地转移数据。

3. FUSE(FilesysteminUserspace)界面。FUSE能把云上的数据缓存在本地,通过普通的本地文件夹展现,以无缝支持现有的机器学习和大数据分析框架来存取云端数据。

云端趋势下,混合云部署的强大需求

此次Alluxio版本更新,可以说是顺应了企业“往云上走”的趋势。

近几年,不仅有层出不穷的云端数据存储、计算和分析创业项目提供服务,大公司也在寻求更好的云端部署方案。

2018年6月,微软收购知名开源开发平台GitHub后,并表示将进行GitHub与自己的云服务产品AzureCloud的整合。分析报告预测,未来云服务市场将从今年的281亿美元增长到2021年的533亿美元。

“数据分析和机器学习的兴起让云端的计算量大量增长,Alluxio的特性意味着它同样可以很好地管理混合云的数据。”李浩源对钛媒体说道。451Research的报告显示,预计在2019年,超过66%的企业会使用一个混合云或者多个云服务方案的架构,它们都可能面对不同云服务上迥异的操作差异,单凭自己很难保证效率,需要第三方服务方案的协助。

更远的未来里,中小型企业可能会彻底转向公有云部署。

Gartner预测,到2021年,全球超过50%的企业会应用纯粹的公有云存储方案,而更大的公司则会应用更多的第三方云端基础架构来管理混合云。

这和李浩源的判断相符。他认为,对于很多现代企业来说真正的价值往往在数据里。

尤其是对于某些大型企业来说,最核心的数据管理很难假手于人。2017年马云接受Bloomberg专访时曾说出金句,“数据的重要程度堪比上个世纪的石油。”

EricAnderson(时任Google产品经理)谈Alluxio

“总有一些数据他们希望保存在本地服务器上,但全部放在本地成本又太高,所以选折中方案,在一个无缝的架构下管理私有和公有云是一个刚需。”李浩源说道。

除此之外,Alluxio也希望能解决近几年火热的数据分析及深度学习面临的数据存储问题。

对于数据分析来说,已经有了不少使用云上数据的方案,Alluxio只是能帮助提高性能、降低费用。

对于深度学习,问题则稍显复杂。

“不是所有的训练数据都能直接用于像Tensorflow这种深度学习框架,另外各类分布式存储和云存储的交互方式和传统本地交互方式有很大区别,用户难以准确地配置和使用新工具。”举个例子,没有Alluxio时,让深度学习框架TensorFlow访问微软云服务AzureObjectstore上的数据就是一件难以完成的事情。

Alluxio的特性意味着它能整合各类存储系统,缩短各类深度学习框架与存储层之间的距离,提高效率及弹性、降低成本。另一方面,这次更新里的FUSE工具则让Alluxio可以挂载本地文件系统,让用户在使用远程云端分布式存储时,拥有和本地数据时相似的交互体验。

关注开源社区

除了针对云端部署及深度学习的更新之外,Alluxio的新版本还有另一个重点:为开发者提供了更多便利,包括:

1.提供针对应用运行的数据服务监视工具,包括能够获取集群实时数据的web图形界面以及命令行界面(CommandLineInterface)工具,让开发者能够更好地了解数据的使用情况、分析性能结果并获得数据洞察。

2.更完善的生态系统集成。把对数据服务的追踪和洞察扩展到不同的应用层和存储层,开发者可以通过新的工具直观地看到存储系统中的问题,比如延时的直方图和存储空间利用率。

3.一个入门套件(StarterKit),其中包括预建的代码及其他文件和一些简单的案例展示,包括“如何在本地机器上安装Alluxio”“如何安装和设置AWSS3Bucket(存储桶)及加速远程读取”,让开发者能更快地上手并使用Alluxio。

“开源社区是我们最珍视的事情之一,所以希望尽可能地帮助开发者理解和使用这个系统。”李浩源说道。他认为,自创立之初,这一社区带来的活力是推动Alluxio迅速进展的重要推力之一。

在2016年接受CSDN采访时,Alluxio曾表示“Alluxio是史上成长速度最快的开源社区之一”,如今其贡献者已经超过800人,在GitHub上星标超过3000个。

正在比赛气泡足球的部分Alluxio团队成员

这个项目里还有不少活跃的公司贡献者,他们还能提供针对具体产品和应用场景的反馈。英特尔、腾讯、阿里巴巴、百度、京东、陌陌等公司同样也是这个开源项目的贡献者之一。比如陌陌的工程师团队会基于陌陌的应用场景,做出适配和调整,而后经过Alluxio的社区管理者审核后接纳,“最终形成一个正向的反馈,是一个双向改进的过程”。

百度、去哪儿和陌陌都曾经就应用Alluxio之后的经验做出分享,比如百度此前分享过,在用他们自己开发的使用SparkSQL作为计算引擎的查询系统时,单独一次查询需要100-150秒;加上作为内存中心的存储层的Alluxio之后,数据可能会冲击本地或远程Alluxio节点,需要10-15秒;当所有数据储存在Alluxio本地时,平均只需5秒,速度提升了30倍。测试过后,百度围绕Alluxio和SparkSQL建立了一个完整的系统。

2016年初,Alluxio曾获得硅谷知名风险投资机构AndressenHorowitz的750万美元融资。

黑客称因A站客服态度诚恳决定无条件删除所窃数据 互联网视频课程

img

默西迪丝

关注
DoNews互娱6月15日消息(记者刘胜军)

6月12日攻击A站的黑客在地下论坛发帖称,因A站客服态度诚恳和对二次元世界的热爱,团队决定无条件删除所窃数据库。

发帖黑客在宣布删除A站数据之前曾扬言要分阶段出售A站所泄的用户信息,并在第一阶段公布了300个用户的信息。

从6月12日开始,A站客服开始和黑客团队交涉,经过两天时间,黑客被说服,并在一地下论坛发布声明称出于A站客服态度诚恳,以及对于二次元世界的热爱,决定无条件删除数据库。在此之前,黑客团队并未将数据库信息出售给任何人,对于此前公布的信息他们也表示抱歉。

在发现信息被窃后,A站通过官方公告、微博、官网、手机短信等形式向用户发放了情况说明和修改密码的建议,公司内部也组织了一系列安全系统加强措施。

有网友戏称,“黑客遭受了A站客服和用户的跨次元打击,终于决定用爱发电。”(完)

带数据库备份的智能建站系统 流量视频课程

img

傲旋

关注
2005年把网络安全提到了一个新的日程上来,业内流行一段话:没有最好的安全,只有最好的方法:备份、备份、再备份。网站放到互联网上,受到关注的程度比较大,备份也成了一个非常重要的课题。
传统的自助建站,数据库不能独立,所有的网站公用一个数据库,实现备份功能是不可能的。但是今天九天智能建站(www.cn9sky.net)解决了这个问题。九天智能建站是一款可以生成独立数据库的网站。用户可以轻松的通过智能建站生成的网站实现数据库备份。然后我们可以选择把数据库下载到本地,保存。恐怕物理隔绝是最好的方法。
养成定期备份的习惯吧!这样您的网站才没有后顾之忧。当然,要选择好的智能建站产品。
img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP