Doris单机安装

Doris介绍

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。

Doris安装部署-单机

Doris 架构非常简单,只有两类进程

  • Frontend(FE),主要负责用户请求的接入、查询解析规划、元数据的管理、节点管理相关工作。
  • Backend(BE),主要负责数据存储、查询计划的执行。

所以,我们安装也是针对于这两个进程来进行。由于我们在虚拟机中搭建学习环境,单机部署即可,集群部署与单机部署方法一直,仅需将BE部署多台服务器即可。

环境:(本次安装在Ubuntu 20.04,CentOS7安装步骤相同)

系统 CentOS7/Ubuntu
Doris版本 1.2.1

0x00 设置系统最大打开文件句柄数

1
2
3
4
vim /etc/security/limits.conf
# 尾部添加
* soft nofile 65536
* hard nofile 65536

0x01 下载安装包

下载地址:https://archive.apache.org/dist/doris/1.2/1.2.1-rc01/

我们下载下图的三个安装包

image-20230618191443142

0x02 解压安装

执行下面的命令进行解压

1
2
3
4
5
6
7
8
9
tar -xvJf apache-doris-be-1.2.1-bin-x86_64.tar.xz
tar -xvJf apache-doris-fe-1.2.1-bin-x86_64.tar.xz
tar -xvJf apache-doris-dependencies-1.2.1-bin-x86_64.tar.xz
# 文件夹重命名
mv apache-doris-be-1.2.1-bin-x86_64 doris-be
mv apache-doris-fe-1.2.1-bin-x86_64 doris-fe
mv apache-doris-dependencies-1.2.1-bin-x86_64 doris-dependencies
# 将java-udf的jar包文件复制到be的lib中
cp doris-dependencies/java-udf-jar-with-dependencies.jar doris-be/lib/

添加环境变量

1
2
3
4
5
6
7
8
vim /etc/profile
# 尾部添加
export DORIS_BE_HOME=你的BE目录
export DORIS_FE_HOME=你的FE目录
export $DORIS_BE_HOME/bin:$DORIS_FE_HOME/bin:$PATH

# 编辑完后生效一下
source /etc/profile

0x03 FE配置

进入到 FE 目录的 conf 目录中,这里是 FE 配置文件所在目录,我们编辑 fe.conf

1
2
3
4
vim fe.conf

# 编辑内容如下
priority_networks = 192.168.10.128/24  # 这里填上你事先规划好的FE机器IP

其他参数可以按需配置,详情可见官网 https://doris.apache.org/zh-CN/docs/dev/admin-manual/config/fe-config


配置好后,我们就可以启动FE了,由于我们配置了环境变量,命令如下

1
start_fe.sh --daemon

注意: 如果出现下面的报错,是因为端口被占用,这时我们可以从fe.conf中,将被占用的端口修改。

image-20230618193830835

FE启动完成后,我们可以访问 ip:[http_port] 来访问Doris的前端页面,目前我们没有配置连接MySQL,所以直接输入内置的root就可以登录。

image-20230618194447225

0x04 BE配置

进入到 BE 目录的 conf 目录中,这里是 FE 配置文件所在目录,我们编辑 be.conf

1
2
3
4
5
vim be.conf

# 编辑内容如下
priority_networks = 192.168.10.128/24  # 这里填上你事先规划好的BE机器IP,如果是集群,那么就用分号隔开
# storage_root_path 该参数为BE数据存储的目录,多目录之间用英文状态的分号分隔,默认是${DORIS_HOME}/storage,可按需修改

其他参数可以按需配置,详情可见官网 https://doris.apache.org/zh-CN/docs/dev/admin-manual/config/be-config


配置好后,我们就可以启动FE了,由于我们配置了环境变量,命令如下

1
start_be.sh --daemon

注意: 如果出现下面的报错,是因为端口被占用,这时我们可以从be.conf中,将被占用的端口修改。(吐槽一下,doris官方就不能给个与其他大数据组件不冲突的端口么)

image-20230618195925621

0x05 集群配置

将BE启动后,我们连接MySQL,把BE添加到FE中

1
2
3
4
5
6
7
8
9
# 连接FE
mysql -h192.168.10.128 -P9030 -uroot
#第一次无需输入密码,进入后我们设置密码
SET PASSWORD FOR 'root' = PASSWORD('123456');
# 退出,用密码登录
mysql -h192.168.10.128 -P9030 -uroot -p123456
# 添加BE
ALTER SYSTEM ADD BACKEND "192.168.10.128:9050";
# 如果是集群,那么就将集群中配置的BE都加入进来

添加BE后,我们查看BE的状态

SHOW PROC '/backends' \G;

image-20230618200437790

查看FE状态

SHOW PROC '/frontends' \G;

image-20230618200533622

此时,我们再登录前端页面,发现需要密码了,输入密码进入后,我们可以开始操作Doris了。

image-20230618200651967