中企动力 > 头条 > 文件数据管理

网站性能检测评分

注:本网站页面html检测工具扫描网站中存在的基本问题,仅供参考。

文件数据管理

好程序员:Namenode元数据管理 流量视频课程

img

Paris

关注

在NameNode运行时会将内存中的元数据信息存储到所指定的文件,即${dfs.name.dir}/current目录下的fsimage文件,此外还会将另外一部分对NameNode更改的日志信息存储到${dfs.name.dir}/current目录下的edits文件中。fsimage文件和edits文件可以确定NameNode节点当前的状态,这样在NameNode节点由于突发原因崩溃时,可以根据这两个文件中的内容恢复到节点崩溃前的状态,所以对NameNode节点中内存元数据的每次修改都必须保存下来。但是如果每次都保存到fsimage文件中,这样效率就特别低,所以引入编辑日志文件edits,保存对元数据的修改信息,也就是fsimage文件保存NameNode节点中某一时刻内存中的元数据(即目录树),edits保存这一时刻之后的对元数据的更改信息。

一、内存元数据

内存中有一份完整的元数据(内存meta data),包含文件路径、副本数、blockid,及每一个block所在datanode的信息。

二、Fsimage镜像文件

fsimage 文件其实是 Hadoop 文件系统元数据的一个永久性的检查点,其中包含 Hadoop 文件系统中的所有目录和文件 idnode 的序列化信息;

使用命令将二进制fsimage文件还原成XML文件hdfs fs -oiv -i fsimage“文件输入路径” -p XML -o “输出路径”

1.首先是一个image head,其中包含:

imgVersion(int):当前image的版本信息

namespaceID(int):用来确保别的HDFS instance中的datanode不会误连上当前NN。

numFiles(long):整个文件系统中包含有多少文件和目录

genStamp(long):生成该image时的时间戳信息。

2.接下来便是对每个文件或目录的源数据信息,如果是目录,则包含以下信息:

path(String):该目录的路径,如“/user/build/build-index”

replications(short):副本数(目录虽然没有副本,但这里记录的目录副本数也为3)

mtime(long):该目录的修改时间的时间戳信息

atime(long):该目录的访问时间的时间戳信息

blocksize(long):目录的blocksize都为0

numBlocks(int):实际有多少个文件块,目录的该值都为-1,表示该item为目录

nsQuota(long):namespace Quota值,若没加Quota限制则为-1

dsQuota(long):disk Quota值,若没加限制则也为-1

username(String):该目录的所属用户名

group(String):该目录的所属组

permission(short):该目录的permission信息,如644等,有一个short来记录。

3.若从fsimage中读到的是一个文件,则还会额外包含如下信息:

blockid(long):属于该文件的block的blockid

numBytes(long):该block的大小

genStamp(long):该block的时间戳

三、edits日志文件

edits存放的是 Hadoop文件系统的所有更新操作的路径,文件系统客户端执行的所有写操作首先会被记录到 edits文件中。

WPS+云办公商业版正式上线 为企业而生的一站式云办公平台 企业视频课程

img

齐碧

关注
当今时代,人工智能、云、大数据成为新的时代主题。这三大主题的深度结合不仅将改造传统行业,还将改变企业的办公和运作方式,为企业创造全新的机遇。虽然国外市场早已有产品成熟的的Googledocs、Quip等“云端Office”平台,但“云端Office”在国内方兴未艾。

金山办公软件准确洞察了这个趋势,并于两年前就推出了WPS+云办公,并不断对该产品进行创新和升级。日前,WPS+云办公商业版正式上线,本着“为企业而生”的宗旨,为企业搭建“云端Office”,助力企业用户的信息化转型。

以企业云文档为核心解决用户的文档管理痛点

WPS+云办公商业版不仅包含大家所熟悉的WPSOffice办公套件,还提供专业的企业云文档、文档安全、文档服务等现代化办公所需的一整套基础云服务,不受时间和地点的约束,随时随地便能办公。

WPS+云办公商业版支持任何系统,不管是Windows或是Mac,抑或是智能手机,只要打开浏览器登录WPS+云办公商业版网页端,进入云协作,便可使用了。企业云文档是WPS+云办公商业版的核心模块,其最大特点是所有文档都可以储存在云端,完全不占用电脑和手机内存。企业云文档能帮助企业将分散的文档按照公司组织架构进行集中管理,公司管理员可通过用户活跃数、文档类型及数量、云文档空间状态、文件使用频度等数据,了解企业运作情况。

文档来回传输既麻烦,又怕弄错版本?WPS+云办公商业版中的企业云文档能够实现文档在线协同,企业成员可与团队成员共同编辑同一份文档,每个人的编辑过程都清晰可见。文档创作完成后,还可以链接形式一键分享给其他需要查看的伙伴。在【链接设置】中,还可通过设置分享范围、权限类型、链接有效期等权限设置,来保证文档的安全。此外,在企业云文档中,文档的所有历史编辑版本都储存在云端,可一键查看和还原文档的任一历史版本。

对于企业最关注的文档安全问题,WPS+云办公商业版也下足了功夫。通过WPS+云办公商业版后台,企业管理员可对所有企业成员账号及企业管理架构进行管理。在每一个团队中,团队管理员可以对团队成员的角色权限进行设定,同时还可以对每一层级文件夹的操作权限进行设置,真正做到360度无死角保护企业文档的安全。

新增【文档服务】助力工作质量和效率的提升

除了以上核心功能,WPS+云办公商业版还新增了【PDF转Word】、【数据恢复】、【文档修复】和【OCR识别】四大实用功能,让用户的文档创作更加得心应手。

查看PDF文件时发现需要修改,但又无法直接操作?WPS+云办公商业版可随心使用【PDF转Word】功能,而且后台自动转换,转换的同时不影响PDF文件的查阅。

虽然工作时,大家都保持谨慎的态度,但难免也有失手的时候。在电脑上处理文档后,不小心将包含重要数据的文件删除或格式化了怎么办?重要数据的丢失对企业而言,就是重大的无形资产损失。WPS+云办公商业版中新增的【数据恢复】就旨在帮助企业找回重要数据。此外,【文档修复】能帮助企业用户解决PC端文档打开时遇到的文档乱码和文档无法打开的难题。遇到想要编辑的图片也不用发愁了,因为企业用户可在图片上设定识别区域,【OCR识别】功能能自动将识别出的文字输出为文档,便于编辑。

通过提供高效率、低成本、易操作的一站式文档管理服务,WPS+云办公商业版能直击企业用户在文档管理中的痛点。有了WPS+云办公商业版,企业用户无需任何IT基础架构投入,一键即可搭建云端办公室,提高沟通和协作效率。

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP