一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)

网友投稿 1033 2022-10-25

一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)

一文参透分布式存储系统Ceph的架构设计、集群搭建(手把手)

Ceph概述

1.1 背景

Ceph是一个去中心化的分布式存储系统, 提供较好的性能、可靠性和可扩展性。Ceph项目最早起源于Sage就读博士期间的工作(最早的成果于2004年发表),并随后贡献给开源社区, 遵循LGPL协议(LESSER GENERAL PUBLIC LICENSE的简写,中文译为“较宽松公共许可证”)。在经过了数年的发展之后,目前已得到众多云计算厂商(OpenStack、CloudStack、OpenNebula、Hadoop)的支持并被广泛应用。

1.2 介绍

Ceph是一个可靠、自动重均衡、自动恢复的分布式存储系统,根据场景划分可以将Ceph分为三大块,分别是对象存储、块设备和文件系统服务。

Ceph的主要优点是分布式存储,在存储每一个数据时,都会通过计算得出该数据存储的位置,尽量将数据分布均衡,不存在传统的单点故障的问题,可以水平扩展。

Ceph存储集群至少需要一个Ceph Monitor和两个OSD守护进程。而运行Ceph文件系统客户端时,则必须要有元数据服务器(Metadata Server)。

1.3 特点

Ceph适合跨集群的小文件存储, 拥有以下特点:

高性能Client和Server直接通信, 不需要代理和转发;Client不需要负责副本的复制, 有Primary主节点负责, 这样可以有效降低clien网络的消耗;采用CRUSH算法,数据分布均衡,并行度高,支持上千个存储节点, 支持TB及PB级数据。高可用性数据多副本, 支持故障域分隔,数据强一致性;没有单点故障,较好的容错性, 有效支撑各种故障场景;支持所有故障的检测和自动恢复,可以做到自动化管理;支持并行恢复,能够极大的降低数据恢复时间, 提高数据的可靠性。高扩展性高度并行化设计,没有单个中心控制组件,所有负载都能动态的划分到各个服务器上。去中心化、灵活、随节点增加线性增长。场景丰富支持三种存储接口类型: 块存储、文件存储、对象存储。 同时支持自定义接口,C++为底层实现, 兼容多种语言。

块存储: 将磁盘空间映射给主机使用, 适用 docker容器、虚拟机磁盘存储分配;日志存储, 文件存储。文件存储: 解决块存储无法共享问题, 在服务器架设FTP和NFS服务器,适用目录结构的存储、日志存储等。对象存储: 大容量硬盘, 安装存储管理软件, 对外提供读写访问能力, 具备块存储的高速读写能力, 也具备文件存储共享的特性; 适用图片存储或视频存储。

1.4 分布式存储系统横纵对比

对比说明

TFS

FASTDFS

MooseFS

GlusterFS

CEPH

开发语言

C++

C

C

C

C++

数据存储方式


文件/Trunk


文件/块

对象/文件/块

在线扩容

支持

支持

支持

支持

支持

冗余备份

支持

支持

支持

支持

支持

单点故障

存在

不存在

存在

不存在

不存在

易用性

安装复杂,官方文档少

安装简单,社区相对活跃

安装简单,官方文档多

安装简单,官方文档专业化

安装简单,官方文档专业化

适用场景

跨集群的小文件

单集群的中小文件

单集群的大中文件

跨集群云存储

单集群的大中小文件

2. Ceph架构设计

2.1 Ceph整体设计

基础存储系统RADOSReliable, Autonomic,Distributed Object Store,即可靠的、自动化的、分布式的对象存储这就是一个完整的对象存储系统,所有存储在Ceph系统中的用户数据事实上最终都是由这一层来存储的。而Ceph的高可靠、高可扩展、高性能、高自动化等等特性本质上也是由这一层所提供的。基础库librados这层的功能是对RADOS进行抽象和封装,并向上层提供API,以便直接基于RADOS(而不是整个Ceph)进行应用开发。特别要注意的是,RADOS是一个对象存储系统,因此,librados实现的API也只是针对对象存储功能的。RADOS采用C++开发,所提供的原生librados API包括C和C++两种。高层应用接口这层包括了三个部分:RADOS GW(RADOS Gateway)、 RBD(Reliable Block Device)和Ceph FS(Ceph File System),其作用是在librados库的基础上提供抽象层次更高、更便于应用或客户端使用的上层接口。其中,RADOS GW是一个提供与Amazon S3和Swift兼容的RESTful API的gateway,以供相应的对象存储应用开发使用。RADOS GW提供的API抽象层次更高,但功能则不如librados强大。应用层这层是不同场景下对于Ceph各个应用接口的各种应用方式,例如基于librados直接开发的对象存储应用,基于RADOS GW开发的对象存储应用,基于RBD实现的云硬盘等等。librados和RADOS GW的区别在于,librados提供的是本地API,而RADOS GW提供的则是RESTfulAPI。由于Swift和S3支持的API功能近似,这里以Swift举例说明。Swift提供的API功能主要包括:

用户管理操作:用户认证、获取账户信息、列出容器列表等;容器管理操作:创建/删除容器、读取容器信息、列出容器内对象列表等;对象管理操作:对象的写入、读取、复制、更新、删除、访问许可设置、元数据读取或更新等。

2.2 逻辑架构

2.3 Ceph 专业术语

OSD: Ceph的对象存储设备,OSD守护进程的功能是存储数据,处理数据的复制、恢复、回填、再均衡,并通过检查其他OSD守护进程的心跳来向Ceph Monitors 提供一些监控信息。Monitors: Ceph监视器,Monitor维护着展示集群状态的各种图表,包括监视器图、OSD图、归置组(PG)图、和CRUSH图。PG:Ceph归置组,每个Object最后都会通过CRUSH计算映射到某个PG中,一个PG可以包含多个Object。MDS: Ceph元数据服务器(MDS),为Ceph文件系统存储元数据。CephFS: Ceph文件系统,CephFS提供了一个任意大小且兼容POSIX的分布式文件系统。RADOS: Reliable Autonomic Distributed Object Store,表示可靠、自动、分布式的对象存储。Ceph中的一切都是以对象形式存储,RADOS就负责存储这些对象,RADOS层确保数据一致性和可靠性。Librados:librados库是一种用来简化访问RADOS的方法,目前支持PHP、Python、Ruby、Java、C和C++语言。RBD:Ceph 的块设备,它对外提供块存储,可以被映射、格式化进而像其他磁盘一样挂载到服务器。RGW/RADOSGW:Ceph 对象网关,它提供了一个兼容S3和Swift的restful API接口。

3. Ceph集群部署配置

3.1 部署结构

虚拟机创建三台服务器,CENTOS版本为7.6, IP网段192.168.116.0/24。三台主机名称为:

CENTOS7-1: IP为192.168.116.141, 既做管理节点, 又做子节点。CENTOS7-2: IP为192.168.116.142, 子节点。CENTOS7-3: IP为192.168.116.143, 子节点。

3.2 系统配置

系统配置工作, 三台节点依次执行:

修改主机名称 [root@CENTOS7-1 ~]# vi /etc/hostname

CENTOS7-1

编辑hosts文件

192.168.116.141 CENTOS7-1192.168.116.142 CENTOS7-2192.168.116.143 CENTOS7-3

[Ceph]name=Ceph packages for $basearchbaseurl=noarch packages# 官方源#baseurl=清华源baseurl=source packagesbaseurl=安装ceph与ceph-deploy组件 ```sh yum update && yum -y install ceph ceph-deploy

安装完成, 如果执行ceph-deploy出现ImportError: No module named pkg_resources

安装python2-pip: yum -y install python2-pip

yum install epel-release -y

安装NTP时间同步工具

yum install ntp ntpdate ntp-doc -y

确保时区是正确, 设置开机启动:

systemctl enable ntpd

并将时间每隔1小时自动校准同步。编辑 vi /etc/rc.d/rc.local 追加:

/usr/sbin/ntpdate ntp1.aliyun.com > /dev/null 2>&1; /sbin/hwclock -w

配置定时任务, 执行crontab -e 加入:

0 */1 * * * ntpdate ntp1.aliyun.com > /dev/null 2>&1; /sbin/hwclock -w

3.3 免密码SSH登陆

官方建议不用系统内置用户, 创建名为ceph_user用户, 密码也设为ceph_user:

useradd -d /home/ceph_user -m ceph_userpasswd ceph_user

设置sudo权限

echo "ceph_user ALL = (root) NOPASSWD:ALL" | sudo tee /etc/sudoers.d/ceph_usersudo chmod 0440 /etc/sudoers.d/ceph_user

ssh-copy-id ceph_user@CENTOS7-1ssh-copy-id ceph_user@CENTOS7-2ssh-copy-id ceph_user@CENTOS7-3

修改管理节点上的​​~/.ssh/config​​ 文件, 简化SSH远程连接时的输入信息:管理节点是会有root和ceph_user多个用户, ssh远程连接默认会以当前用户身份进行登陆,如果我们是root身份进行远程连接, 还是需要输入密码, 我们想简化, 该怎么处理?切换root身份,

su root

修改~/.ssh/config 文件

Host CENTOS7-1 Hostname CENTOS7-1 User ceph_userHost CENTOS7-2 Hostname CENTOS7-2 User ceph_userHost CENTOS7-3 Hostname CENTOS7-3 User ceph_user

注意修改文件权限, 不能采用777最大权限:

chmod 600 ~/.ssh/config

进行ssh远程连接时, Host的主机名称是区分大小写的, 所以要注意配置文件的主机名称。开放端口, 非生产环境, 可以直接禁用防火墙:

systemctl stop firewalld.servicesystemctl disable firewalld.service

SELINUX设置SELinux设为禁用:

setenforce 0

永久生效: 编辑 vi /etc/selinux/config修改:

SELINUX=disabled

3.4 集群搭建配置

采用root身份进行安装

在管理节点创建集群配置目录,cd /usr/local:

mkdir ceph-clustercd ceph-cluster

注意: 此目录作为ceph操作命令的基准目录, 会存储处理配置信息。创建集群, 包含三台机器节点:

ceph-deploy new CENTOS7-1 CENTOS7-2 CENTOS7-3

创建成功后, 会生一个配置文件。如果接下来集群的安装配置出现问题, 可以执行以下命令清除, 再重新安装:

ceph-deploy purge CENTOS7-1 CENTOS7-2 CENTOS7-3ceph-deploy purgedata CENTOS7-1 CENTOS7-2 CENTOS7-3ceph-deploy forgetkeys

将三台节点的mon信息也删除

rm -rf /var/run/ceph/

修改配置文件, 有些配置后面需用到:

vi /usr/local/ceph-cluster/ceph.conf

加入:

[global]# 公网网络public network = 192.168.116.0/24# 设置pool池默认分配数量 默认副本数为3osd pool default size = 2# 容忍更多的时钟误差mon clock drift allowed = 2mon clock drift warn backoff = 30# 允许删除poolmon_allow_pool_delete = true[mgr]# 开启WEB仪表盘mgr modules = dashboard

第一项为副本数, 设为2份。第二项为对外IP访问网段,注意根据实际IP修改网段。第三、四项为允许一定时间的漂移误差。执行安装:

ceph-deploy install CENTOS7-1 CENTOS7-2 CENTOS7-3

如果出现错误:

ceph_deploy][ERROR ] RuntimeError: Failed to execute command: ceph --version

可以在各节点上单独进行安装:

yum -y install ceph

如果没有仓库文件ceph.repo, 按上面的步骤手工创建。初始monitor信息:

ceph-deploy mon create-initial## ceph-deploy --overwrite-conf mon create-initial

ceph-deploy admin CENTOS7-1 CENTOS7-2 CENTOS7-3

安装mgr(管理守护进程), 大于12.x版本需安装, 我们装的是最新版,需执行:

ceph-deploy mgr create CENTOS7-1 CENTOS7-2 CENTOS7-3

ceph-deploy osd create --data /dev/sdb CENTOS7-2

三台节点都需分别依次执行。

ceph-deploy gatherkeys CENTOS7-1

验证节点:输入ceph health 或 ceph -s查看, 出现HEALTH_OK代表正常。

![file](如果出现错误:

[root@CENTOS7-1 ~]# ceph -s cluster: id: 0ec99aa9-e97e-43d3-b5b9-90eb21c4abff health: HEALTH_WARN 1 filesystem is degraded 1 osds down 1 host (1 osds) down Reduced data availability: 41 pgs inactive Degraded data redundancy: 134/268 objects degraded (50.000%), 22 pgs degraded, 87 pgs undersized 39 slow ops, oldest one blocked for 2286 sec, daemons [osd.0,mon.CENTOS7-2,mon.CENTOS7-3] have slow ops. clock skew detected on mon.CENTOS7-2, mon.CENTOS7-3 services: mon: 3 daemons, quorum CENTOS7-1,CENTOS7-2,CENTOS7-3 mgr: centos7-1(active), standbys: centos7-3, centos7-2 mds: fs_test-1/1/1 up {0=centos7-1=up:replay} osd: 3 osds: 1 up, 2 in data: pools: 9 pools, 128 pgs objects: 134 objects, 64 KiB usage: 1.0 GiB used, 19 GiB / 20 GiB avail pgs: 32.031% pgs unknown 134/268 objects degraded (50.000%) 65 active+undersized 41 unknown 22 active+undersized+degraded

在各节点执行命令, 确保时间同步一致:

ntpdate ntp1.aliyun.com

3.5 安装管理后台

开启dashboard模块

ceph mgr module enable dashboard

生成签名

ceph dashboard create-self-signed-cert

创建目录mkdir mgr-dashboard

[root@CENTOS7-1 mgr-dashboard]# pwd/usr/local/ceph-cluster/mgr-dashboard

生成密钥对

cd /usr/local/ceph-cluster/mgr-dashboard

openssl req -new -nodes -x509 -subj "/O=IT/CN=ceph-mgr-dashboard" -days 3650 -keyout dashboard.key -out dashboard.crt -extensions v3_ca

[root@CENTOS7-1 mgr-dashboard]# lltotal 8-rw-rw-r-- 1 ceph_user ceph_user 1155 Jul 14 02:26 dashboard.crt-rw-rw-r-- 1 ceph_user ceph_user 1704 Jul 14 02:26 dashboard.key

启动dashboard

ceph mgr module disable dashboardceph mgr module enable dashboard

设置IP与PORT

ceph config set mgr mgr/dashboard/server_addr 192.168.116.141ceph config set mgr mgr/dashboard/server_port 18843

关闭HTTPS

ceph config set mgr mgr/dashboard/ssl false

查看服务信息

[root@CENTOS7-1 ceph-cluster]# ceph mgr services{ "dashboard": "dashboard set-login-credentials admin admin

访问

3.6 创建Cephfs

集群创建完后, 默认没有文件系统, 我们创建一个Cephfs可以支持对外访问的文件系统。

ceph-deploy --overwrite-conf mds create CENTOS7-1 CENTOS7-2 CENTOS7-3

创建两个存储池, 执行两条命令:

ceph osd pool create cephfs_data 128ceph osd pool create cephfs_metadata 64

少于5个OSD可把pg_num设置为128OSD数量在5到10,可以设置pg_num为512OSD数量在10到50,可以设置pg_num为4096OSD数量大于50,需要计算pg_num的值通过下面命令可以列出当前创建的存储池:

ceph osd lspools

创建fs, 名称为fs_test:

ceph fs new fs_test cephfs_metadata cephfs_data

状态查看, 以下信息代表正常:

[root@CENTOS7-1 mgr-dashboard]# ceph fs lsname: fs_test, metadata pool: cephfs_metadata, data pools: [cephfs_data ]

[root@CENTOS7-1 mgr-dashboard]# ceph mds statfs_test-1/1/1 up {0=centos7-1=up:active}

附: 如果创建错误, 需要删除, 执行:

ceph fs rm fs_test --yes-i-really-mean-itceph osd pool delete cephfs_data cephfs_data --yes-i-really-really-mean-it

确保在ceph.conf中开启以下配置:

[mon]mon allow pool delete = true

采用fuse挂载先确定ceph-fuse命令能执行, 如果没有, 则安装:

yum -y install ceph-fuse

创建挂载目录

mkdir -p /usr/local/cephfs_directory

挂载cephfs

[root@node3 ~]# ceph-fuse -k /etc/ceph/ceph.client.admin.keyring -m 192.168.116.141:6789 /usr/local/cephfs_directoryceph-fuse[6687]: starting ceph client2019-07-14 21:39:09.644181 7fa5be56e040 -1 init, newargv = 0x7fa5c940b500 newargc=9ceph-fuse[6687]: starting fuse

查看磁盘挂载信息

[root@CENTOS7-1 mgr-dashboard]# df -hFilesystem Size Used Avail Use% Mounted on/dev/mapper/centos-root 38G 3.0G 35G 8% /devtmpfs 1.9G 0 1.9G 0% /devtmpfs 1.9G 0 1.9G 0% /dev/shmtmpfs 1.9G 20M 1.9G 2% /runtmpfs 1.9G 0 1.9G 0% /sys/fs/cgroup/dev/sda1 197M 167M 31M 85% /boottmpfs 378M 0 378M 0% /run/user/0tmpfs 1.9G 24K 1.9G 1% /var/lib/ceph/osd/ceph-0ceph-fuse 27G 0 27G 0% /usr/local/cephfs_directorytmpfs 378M 0 378M 0% /run/user/1000

/usr/local/cephfs_directory目录已成功挂载。

3.7 客户端连接验证(Rados Java)

安装好JDK、GIT和MAVEN。-rados java客户端源码

git clone rados-java]# pwd/usr/local/sources/rados-java

执行MAVEN安装, 忽略测试用例:

[root@CENTOS7-1 rados-java]# mvn install -Dmaven.test.skip=true

生成jar包, rados-0.7.0.jar

[root@CENTOS7-1 target]# ll总用量 104drwxr-xr-x 3 root root 17 8月 11 18:32 classesdrwxr-xr-x 2 root root 27 8月 11 18:32 dependenciesdrwxr-xr-x 3 root root 25 8月 11 18:32 generated-sourcesdrwxr-xr-x 2 root root 28 8月 11 18:32 maven-archiverdrwxr-xr-x 3 root root 35 8月 11 18:32 maven-status-rw-r--r-- 1 root root 105701 8月 11 18:32 rados-0.7.0.jar

创建软链接, 加入CLASSPATH

ln -s /usr/local/sources/rados-java/target/rados-0.7.0.jar /opt/jdk1.8.0_301/jre/lib/ext/rados-0.7.0.jar

安装jna

yum -y install jna

创建软链接

ln -s /usr/share/java/jna.jar /opt/jdk1.8.0_301/jre/lib/ext/jna.jar

查看

[root@CENTOS7-1 target]# ll /opt/jdk1.8.0_301/jre/lib/ext/jna.jarlrwxrwxrwx 1 root root 23 8月 11 19:00 /opt/jdk1.8.0_301/jre/lib/ext/jna.jar -> /usr/share/java/jna.jar

[root@CENTOS7-1 target]# ll /opt/jdk1.8.0_301/jre/lib/ext/rados-0.7.0.jarlrwxrwxrwx 1 root root 52 8月 11 18:59 /opt/jdk1.8.0_301/jre/lib/ext/rados-0.7.0.jar -> /usr/local/sources/rados-java/target/rados-0.7.0.jar

创建JAVA测试类CephClient类,注意, 最新版0.6的异常处理包位置已发生变化。

import com.ceph.rados.Rados;import com.ceph.rados.exceptions.*;import java.io.File;public class CephClient { public static void main (String args[]){ try { Rados cluster = new Rados("admin"); System.out.println("Created cluster handle."); File f = new File("/etc/ceph/ceph.conf"); cluster.confReadFile(f); System.out.println("Read the configuration file."); cluster.connect(); System.out.println("Connected to the cluster."); } catch (RadosException e) { System.out.println(e.getMessage() + ": " + e.getReturnValue()); } }}

运行验证需要在linux环境下运行,且要在client节点。编译并运行:

[root@CENTOS7-1 sources]# javac CephClient.java [root@CENTOS7-1 sources]# java CephClientCreated cluster handle.Read the configuration file.Connected to the cluster.

成功与ceph建立连接。注意:如果java和javac版本不同,可以使用rpm -qa |grep java 进行查找, rpm -e --nodeps jdk进行删除,source /etc/profile进行生效jdk的位数为64位

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:2015年百度之星程序设计大赛 - 资格赛 (1003 IP聚合)
下一篇:JTaro:基于 Vue 2.0 的轻量级H5 SPA 框架
相关文章

 发表评论

暂时没有评论,来抢沙发吧~