Doris单节点部署 2023-06-18 大数据 约 1567 字 预计阅读 4 分钟 Doris单机安装 Doris介绍 Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海 阅读更多
SparkSQL解析SQL 2023-02-07 Spark 约 1282 字 预计阅读 3 分钟 SparkSQL解析SQL SparkSQL采用Antlr来解析SQL,我们可以直接使用该工具,对SQL进行一个自定义的解析。Antlr全称为 阅读更多
Git基本使用教程 2022-05-16 Git 约 1435 字 预计阅读 3 分钟 Git基本使用教程 Git介绍 是一个分布式版本控制软件,最初由林纳斯·托瓦兹创作,于2005年以GPL授权条款释出。最初目的是为了更好地管理L 阅读更多
Hive配置jdbc 2021-07-23 Hive 部署 约 505 字 预计阅读 2 分钟 Hive单机部署过程 旧电脑上面之前搭建过各种单机大数据平台,当时没有一一记录下来过程,导致后续再次搭建的时候还是要跌坑,现在打算把所有平台全 阅读更多
Spark二次排序笔记 2020-09-09 Spark 笔记 约 954 字 预计阅读 2 分钟 Spark二次排序笔记 引言 让我们先思考一下什么是二次排序,这是一个很典型的数据处理算法。首先我们有一个数据,这个数据的key之间是有序的,而 阅读更多