clickhouse 批量插入数据及ClickHouse常用命令详解-FinClip官网

clickhouse 批量插入数据及ClickHouse常用命令详解

网友投稿 2214 2022-10-25

clickhouse 批量插入数据及ClickHouse常用命令详解

目录一.安装使用Ⅰ).安装Ⅱ).配置Ⅲ).启停服务二.常用命令Ⅰ).创建表Ⅱ).创建物化视图Ⅲ).插入数据Ⅳ).查询数据Ⅴ).创建NESTED表Ⅵ).NESTED表数据查询Ⅶ).配置字典项Ⅷ).字典查询Ⅸ).导入数据Ⅹ).导出数据Ⅺ).查看partition状态Ⅻ).清理partitionXIII).查看列的压缩率XIV).查看物化视图的磁盘占用

一.安装使用

ClickHouse是Yandex提供的一个开源的列式存储数据库管理系统，多用于联机分析（OLAP）场景，可提供海量数据的存储和分析，同时利用其数据压缩和向量化引擎的特性，能提供快速的数据搜索。

Ⅰ).安装

sudo yum install yum-utils

sudo rpm --import https://repo.yandex.ru/clickhouse/CLICKHOUSE-KEY.GPG

sudo yum-config-manager --add-repo https://repo.yandex.ru/clickhouse/rpm/stable/x86_64

sudo yum install clickhouse-server clickhouse-client

sudo /etc/init.d/clickhouse-server start

clickhouse-client

Ⅱ).配置

a).clickhouse-server

CLICKHOUSE_USER=username

CLICKHOUSE_LOGDIR=${CLICKHOUSE_HOME}/log/clickhoue-server

CLICKHOUSE_LOGDIR_USER=username

CLICKHOUSE_DATADIR_OLD=${CLICKHOUSE_HOME}/data/old

CLICKHOUSE_DATADIR=${CLICKHOUSE_HOME}/data

b).config.xml

... ...

info

${CLICKHOUSE_HOME}/log/clickhoue-server/clickhoue-server.log

${CLICKHOUSE_HOME}/log/clickhoue-server/clickhoue-server-error.log

100M

${CLICKHOUSE_HOME}>

${CLICKHOUSE_HOME}/tmp>

${CLICKHOUSE_HOME}/user_files>

Asiz/Shanghai

... ...

Ⅲ).启停服务

#### a).启动服务

sudo service clickhouse-server start

#### b).停止服务

sudo service clickhouse-server stop

Ⅳ).客户端访问

clickhouse-client

二.常用命令

Ⅰ).创建表

CREATE TABLE IF NOT EXISTS database.table_name ON cluster cluster_shardNum_replicasNum(

'id' UInt64,

'name' String,

'time' UInt64,

'age' UInt8,

'flag' UInt8

)

ENGINE = MergeTree

PARTITION BY toDate(time/1000)

ORDER BY (id,name)

SETTINGS index_granularity = 8192

Ⅱ).创建物化视图

CREATE MATERIALIZED VIEW database.view_name ON cluster cluster_shardNum_replicasNum

ENGINE = AggregatingMergeTree

PARTITION BY toYYYYMMDD(time)

ORDER BY (id,name)

AS SELECT

toStartOfHour(toDateTime(time/1000)) as time,

id,

name,

sumState( if (flag = 1, 1, 0)) AS successCount,

sumState( if (flag = 0, 1, 0)) AS faildCount,

sumState( if ((age < 10), 1, 0)) AS rang1Age,

sumState( if ((age > 10) AND (age < 20), 2, 0)) AS rang2Age,

sumState( if ((age > 20), 3, 0)) AS rang3Age,

maxState(age) AS maxAge,

minState(age) AS minAge

FROM datasource.table_name

GROUP BY time,id,name

Ⅲ).插入数据

a).普通数据插入

INSERT INTO database.table_name(id, name, age, flag) VALUES(1, 'test', 15, 0)

b).json数据插入

INSERT INTO database.table_name FORMAT JSONEachRow{"id":"1", "name":"test", "age":"11", "flag":"1"}

Ⅳ).查询数据

a).表数据查询

SELECT * FROM database.table_name WHERE id=1

b).物化视图查询

SELECT id, name, sumMerge(successCount), sumMerge(faildCount), sumMerge(rang1Age), sumMerge(rang2Age), maxMerge(maxAge), minMerge(minAge)

FROM database.view_name

WHERE id=1

GROUP BY id, name

Ⅴ).创建NESTED表

CREATE TABLE IF NOT EXISTS database.table_name(

'id' UInt64,

'name' String,

'time'http:// UInt64,

'age' UInt8,

'flag' UInt8

nested_table_name Nested (

sequence UInt32,

id UInt64,

bzatjNVy name String,

time UInt64,

age UInt8,

flag UInt8

socketAhttp://ddr String,

socketRemotePort UInt32,

socketLocalPort UInt32,

eventTime UInt64,

exceptionClassName String,

hashCode Int32,

nextSpanId UInt64

))

ENGINE = MergeTree

PARTITION BY toDate (time / 1000)

ORDER BY (id, name, time)

SETTINGS index_granularity = 8192

Ⅵ).NESTED表数据查询

SELECT table1.*,table1.id FROM nest.table_name AS table1 array JOIN nested_table_name AS table2

Ⅶ).配置字典项

url

hostname

9000

default

dict

hash_code

String

url

String

url_hash

hostname

9000

default

dict

hash_code

String

url

String

Ⅷ).字典查询

SELECT

id,

dictGet('name', 'name', toUInt64(name)) AS name,

dictGetString('url', 'url', tuple(url)) AS url

FROM table_name

Ⅸ).导入数据

clickhouse-client --query="INSERT INTO database.table_name FORMAT CSVWithNames" < /path/import_filename.csv

Ⅹ).导出数据

clickhouse-client --query="SELECT * FROM database.table_name FORMAT CSV" sed 's/"//g' > /path/export_filename.csv

Ⅺ).查看partition状态

SELECT table, name, partition，active FROM system.parts WHERE database='database_name'

Ⅻ).清理partition

ALTER TABLE database.table_name ON cluster cluster_shardNum_replicasNum detach partition 'partition_id'

XIII).查看列的压缩率

SELECT

database,

table,

name,

formatReadableSize(sum(data_compressed_bytes) AS c) AS comp,

formatReadableSize(sum(data_uncompressed_bytes) AS r) AS raw,

c/r AS comp_ratio

FROM system.columns

WHERE database='database_name'

AND table='table_name'

GROUP BY name

XIV).查看物化视图的磁盘占用

clickhouse-client --query="SELECT partition,count(*) AS partition_num, formatReadableSize(sum(bytes)) AS disk_size FROM system.columns WHERE database='database_name' " --external --?le=***.sql --name=parts --structure='table String, name String, partition UInt64, engine String' -h hostname

微信小程序本地存储与登录页面处理实例详细讲解

2214 2022-10-25

clickhouse 批量插入数据及ClickHouse常用命令详解

微信开发中 ACCESS TOKEN 过期失效的解决方案详解

微信小程序利用 JS 实现注册 60s 倒计时功能解析

微信小程序本地存储与登录页面处理实例详细讲解

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

开放银行银行案例，迎接金融创新的未来