clickhouse的安装和使用（单机+集群）_一叶扁粥的博客-CSDN博客知识图谱

clickhouse的安装和使用（单机+集群）_一叶扁粥的博客-CSDN博客

本站和网页 https://blog.csdn.net/wyee000/article/details/90027301 的作者无关，不对其内容负责。快照谨为网络故障时之索引，不代表被搜索网站的即时页面。

clickhouse的安装和使用（单机+集群）_一叶扁粥的博客-CSDN博客
clickhouse的安装和使用（单机+集群）
一叶扁粥
于 2019-05-09 13:15:59 发布
5617
收藏
12
分类专栏：
大数据框架
文章标签：
Clickhouse
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。
本文链接：https://blog.csdn.net/wyee000/article/details/90027301
版权
大数据框架
专栏收录该内容
3 篇文章
0 订阅
订阅专栏
什么是clickhous
ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库（DBMS），主要用于在线分析处理查询（OLAP），能够使用SQL查询实时生成分析数据报告。
安装前的准备
以CentOS6.8为例
1. CentOS取消打开文件数限制在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.conf这2个文件的末尾加入一下内容：
soft nofile 65536hard nofile 65536soft nproc 131072hard nproc 131072 重启生效用ulimit –n 或者ulimit –a查看设置结果用ulimit –n 或者ulimit –a查看设置结果
[root@hadoop102 ~]# ulimit -n
65536
2. CentOS取消取消SELINU 修改/etc/selinux/config中的SELINUX=disabled后重启
vim /etc/selinux/config
SELINUX=disabled
3. CentOS关闭防火墙
service iptables stop
service ip6tables stop
4. 安装依赖
yum install -y libtool
yum install -y *unixODBC*
安装
1.网址
官网安装包下载地址
2.单机模式
上传5个文件到Linux中
[root@hadoop102 software]# ls
clickhouse-client-1.1.54236-4.el6.x86_64.rpm
clickhouse-server-1.1.54236-4.el6.x86_64.rpm
clickhouse-compressor-1.1.54236-4.el6.x86_64.rpm
clickhouse-server-common-1.1.54236-4.el6.x86_64.rpm
clickhouse-debuginfo-1.1.54236-4.el6.x86_64.rpm
分别安装这5个rpm文件
[root@hadoop102 software]# rpm -ivh *.rpm
启动ClickServer 前台启动：
clickhouse-server –config-file=/etc/clickhouse-server/config.xml
后台启动：
nohup clickhouse-server –config-file=/etc/clickhouse-server/config.xml >null 2>&1
[1] 2696
使用client连接server
clickhouse-client
3.分布式安装
准备三台机器，改好主机名之类的，然后执行以上所有步骤我这里是hadoop102,hadoop103,hadoop104
三台机器修改配置文件config.xml
vim /etc/clickhouse-server/config.xml
把60行左右的三行改为这样
<listen_host>::</listen_host>


在三台机器的etc目录下新建metrika.xml文件
vim /etc/metrika.xml
添加如下内容：
<yandex>
<clickhouse_remote_servers>
<perftest_3shards_1replicas>
<shard>
<internal_replication>true</internal_replication>
<replica>
<host>hadoop102</host>
<port>9000</port>
</replica>
</shard>
<shard>
<replica>
<internal_replication>true</internal_replication>
<host>hadoop103</host>
<port>9000</port>
</replica>
</shard>
<shard>
<internal_replication>true</internal_replication>
<replica>
<host>hadoop104</host>
<port>9000</port>
</replica>
</shard>
</perftest_3shards_1replicas>
</clickhouse_remote_servers>
<zookeeper-servers>
<node index="1">
<host>hadoop102</host>
<port>2181</port>
</node>
<node index="2">
<host>hadoop103</host>
<port>2181</port>
</node>
<node index="3">
<host>hadoop104</host>
<port>2181</port>
</node>
</zookeeper-servers>
<macros>
<replica>hadoop102</replica>
</macros>
<networks>
<ip>::/0</ip>
</networks>
<clickhouse_compression>
<case>
<min_part_size>10000000000</min_part_size>
<min_part_size_ratio>0.01</min_part_size_ratio>
<method>lz4</method>
</case>
</clickhouse_compression>
</yandex>
注意：
<macros>
<replica>hadoop102</replica>
</macros>
不同机器这里不能相同
三台机器启动ClickServer
service clickhouse-server start
数据类型
整型固定长度的整型，包括有符号整型或无符号整型。整型范： Int8 - [-128 : 127] Int16 - [-32768 : 32767] Int32 - [-2147483648 : 2147483647] Int64 - [-9223372036854775808 : 9223372036854775807] 无符号整型范： UInt8 - [0 : 255] UInt16 - [0 : 65535] UInt32 - [0 : 4294967295] UInt64 - [0 : 18446744073709551615]
浮点型 Float32 - float Float64 – double 建议尽可能以整数形式存储数据。例如，将固定精度的数字转换为整数值，如时间用毫秒为单位表示，因为浮点型进行计算时可能引起四舍五入的误差。
select 1-0.9
┌───────minus(1, 0.9)─┐
│ 0.09999999999999998 │
└─────────────────────┘
与标准SQL相比，ClickHouse 支持以下类别的浮点数：
Inf-正无穷
select 1/0
┌─divide(1, 0)─┐
│ inf │
└──────────────┘
-Inf-负无穷：
select -1/0
┌─divide(1, 0)─┐
│ -inf │
└──────────────┘
NaN-非数字：
:) select 0/0
┌─divide(0, 0)─┐
│ nan │
└──────────────┘
布尔型没有单独的类型来存储布尔值。可以使用 UInt8 类型，取值限制为 0 或 1。
字符串 String 字符串可以任意长度的。它可以包含任意的字节集，包含空字节。 FixedString(N) 固定长度 N 的字符串，N 必须是严格的正自然数。当服务端读取长度小于 N 的字符串时候，通过在字符串末尾添加空字节来达到 N 字节长度。当服务端读取长度大于 N 的字符串时候，将返回错误消息。与String相比，极少会使用FixedString，因为使用起来不是很方便。
枚举类型包括 Enum8 和 Enum16 类型 Enum 保存 ‘string’= integer 的对应关系。 Enum8 用 ‘String’= Int8 对描述。 Enum16 用 ‘String’= Int16 对描述。用法演示：创建一个带有一个枚举 Enum8(‘hello’ = 1, ‘world’ = 2) 类型的列：
CREATE TABLE t_enum
x Enum8('hello' = 1, 'world' = 2)
ENGINE = TinyLog
这个 x 列只能存储类型定义中列出的值：‘hello’或’world’。如果尝试保存任何其他值，ClickHouse 抛出异常。
INSERT INTO t_enum VALUES ('hello'), ('world'), ('hello')
INSERT INTO t_enum VALUES
Ok.
3 rows in set. Elapsed: 0.002 sec.
insert into t_enum values('a')
INSERT INTO t_enum VALUES
Exception on client:
Code: 49. DB::Exception: Unknown element 'a' for type Enum8('hello' = 1, 'world' = 2)
从表中查询数据时，ClickHouse 从 Enum 中输出字符串值。
SELECT * FROM t_enum
┌─x─────┐
│ hello │
│ world │
│ hello │
└───────┘
如果需要看到对应行的数值，则必须将 Enum 值转换为整数类型。
SELECT CAST(x, 'Int8') FROM t_enum
┌─CAST(x, 'Int8')─┐
│ 1 │
│ 2 │
│ 1 │
└─────────────────┘
数组 Array(T)：由 T 类型元素组成的数组。 T 可以是任意类型，包含数组类型。但不推荐使用多维数组，ClickHouse 对多维数组的支持有限。例如，不能在 MergeTree 表中存储多维数组。可以使用array函数来创建数组：
array(T)
也可以使用方括号：
[]
创建数组案例：
SELECT array(1, 2) AS x, toTypeName(x)
SELECT
[1, 2] AS x,
toTypeName(x)
┌─x─────┬─toTypeName(array(1, 2))─┐
│ [1,2] │ Array(UInt8) │
└───────┴─────────────────────────┘
1 rows in set. Elapsed: 0.002 sec.
:) SELECT [1, 2] AS x, toTypeName(x)
SELECT
[1, 2] AS x,
toTypeName(x)
┌─x─────┬─toTypeName([1, 2])─┐
│ [1,2] │ Array(UInt8) │
└───────┴────────────────────┘
1 rows in set. Elapsed: 0.002 sec.
元组 Tuple(T1, T2, …)：元组，其中每个元素都有单独的类型。创建元组的示例：
:) SELECT tuple(1,'a') AS x, toTypeName(x)
SELECT
(1, 'a') AS x,
toTypeName(x)
┌─x───────┬─toTypeName(tuple(1, 'a'))─┐
│ (1,'a') │ Tuple(UInt8, String) │
└─────────┴───────────────────────────┘
1 rows in set. Elapsed: 0.021 sec.
Date 日期类型，用两个字节存储，表示从 1970-01-01 (无符号) 到当前的日期值。
还有很多数据结构，可以参考官方文档：官方文档
表引擎
表引擎（即表的类型）决定了： 1）数据的存储方式和位置，写到哪里以及从哪里读取数据 2）支持哪些查询以及如何支持。 3）并发数据访问。 4）索引的使用（如果存在）。 5）是否可以执行多线程请求。 6）数据复制参数。 ClickHouse的表引擎有很多，下面介绍其中几种，对其他引擎有兴趣的可以去查阅官方文档：官方文档
TinyLog 最简单的表引擎，用于将数据存储在磁盘上。每列都存储在单独的压缩文件中，写入时，数据将附加到文件末尾。该引擎没有并发控制
如果同时从表中读取和写入数据，则读取操作将抛出异常；如果同时写入多个查询中的表，则数据将被破坏。
这种表引擎的典型用法是 write-once：首先只写入一次数据，然后根据需要多次读取。此引擎适用于相对较小的表（建议最多1,000,000行）。如果有许多小表，则使用此表引擎是适合的，因为它比需要打开的文件更少。当拥有大量小表时，可能会导致性能低下。不支持索引。案例：创建一个TinyLog引擎的表并插入一条数据
:)create table t (a UInt16, b String) ENGINE = TinyLog;
:)insert into t (a, b) values (1, 'abc');
此时我们到保存数据的目录/var/lib/clickhouse/data/default/t中可以看到如下目录结构：
[root@hadoop102 t]# ls
a.bin b.bin sizes.json
a.bin 和 b.bin 是压缩过的对应的列的数据， sizes.json 中记录了每个 *.bin 文件的大小：
[root@hadoop102 t]# cat sizes.json
{"yandex":{"a%2Ebin":{"size":"28"},"b%2Ebin":{"size":"30"}}}
Memory 内存引擎，数据以未压缩的原始形式直接保存在内存当中，服务器重启数据就会消失。读写操作不会相互阻塞，不支持索引。简单查询下有非常非常高的性能表现（超过10G/s）。一般用到它的地方不多，除了用来测试，就是在需要非常高的性能，同时数据量又不太大（上限大概 1 亿行）的场景。
Merge Merge 引擎 (不要跟 MergeTree 引擎混淆) 本身不存储数据，但可用于同时从任意多个其他的表中读取数据。读是自动并行的，不支持写入。读取时，那些被真正读取到数据的表的索引（如果有的话）会被使用。 Merge 引擎的参数：一个数据库名和一个用于匹配表名的正则表达式。案例：先建t1，t2，t3三个表，然后用 Merge 引擎的 t 表再把它们链接起来。
:)create table t1 (id UInt16, name String) ENGINE=TinyLog;
:)create table t2 (id UInt16, name String) ENGINE=TinyLog;
:)create table t3 (id UInt16, name String) ENGINE=TinyLog;
:)insert into t1(id, name) values (1, 'first');
:)insert into t2(id, name) values (2, 'second');
:)insert into t3(id, name) values (3, 'i am in t3');
:)create table t (id UInt16, name String) ENGINE=Merge(currentDatabase(), '^t');
:) select * from t;
┌─id─┬─name─┐
│ 2 │ second │
└────┴──────┘
┌─id─┬─name──┐
│ 1 │ first │
└────┴───────┘
┌─id─┬─name───────┐
│ 3 │ i am in t3 │
└────┴────────────┘
MergeTree Clickhouse 中最强大的表引擎当属 MergeTree （合并树）引擎及该系列（*MergeTree）中的其他引擎。 MergeTree 引擎系列的基本理念如下。当你有巨量数据要插入到表中，你要高效地一批批写入数据片段，并希望这些数据片段在后台按照一定规则合并。相比在插入时不断修改（重写）数据进存储，这种策略会高效很多。格式：
`ENGINE [=] MergeTree(date-column [, sampling_expression], (primary, key),` index_granularity)
参数解读：
date-column — 类型为 Date 的列名。ClickHouse 会自动依据这个列按月创建分区。分区名格式为 "YYYYMM" 。
sampling_expression — 采样表达式。
(primary, key) — 主键。类型为Tuple()
index_granularity — 索引粒度。即索引中相邻”标记”间的数据行数。设为 8192 可以适用大部分场景。
案例：
create table mt_table (date Date, id UInt8, name String) ENGINE=MergeTree(date, (id, name), 8192);
insert into mt_table values ('2019-05-01', 1, 'zhangsan');
insert into mt_table values ('2019-06-01', 2, 'lisi');
insert into mt_table values ('2019-05-03', 3, 'wangwu');
在/var/lib/clickhouse/data/default/mt_tree下可以看到：
[root@hadoop102 mt_table]# ls
20190501_20190501_2_2_0 20190503_20190503_6_6_0 20190601_20190601_4_4_0 detached
随便进入一个目录：
[root@hadoop102 20190601_20190601_4_4_0]# ls
checksums.txt columns.txt date.bin date.mrk id.bin id.mrk name.bin name.mrk primary.idx
*.bin是按列保存数据的文件*.mrk保存块偏移量primary.idx保存主键索引
ReplacingMergeTree 这个引擎是在 MergeTree 的基础上，添加了“处理重复数据”的功能，该引擎和MergeTree的不同之处在于它会删除具有相同主键的重复项。数据的去重只会在合并的过程中出现。合并会在未知的时间在后台进行，所以你无法预先作出计划。有一些数据可能仍未被处理。因此，ReplacingMergeTree 适用于在后台清除重复的数据以节省空间，但是它不保证没有重复的数据出现。格式：
ENGINE [=] ReplacingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [ver])
可以看出他比MergeTree只多了一个ver，这个ver指代版本列。案例：
create table rmt_table (date Date, id UInt8, name String,point UInt8) ENGINE= ReplacingMergeTree(date, (id, name), 8192,point);
插入一些数据：
insert into rmt_table values ('2019-07-10', 1, 'a', 20);
insert into rmt_table values ('2019-07-10', 1, 'a', 30);
insert into rmt_table values ('2019-07-11', 1, 'a', 20);
insert into rmt_table values ('2019-07-11', 1, 'a', 30);
insert into rmt_table values ('2019-07-11', 1, 'a', 10);
等待一段时间或optimize table rmt_table手动触发merge，后查询
:) select * from rmt_table;
┌───────date─┬─id─┬─name─┬─point─┐
│ 2019-07-11 │ 1 │ a │ 30 │
└────────────┴────┴──────┴───────┘
SummingMergeTree 该引擎继承自 MergeTree。区别在于，当合并 SummingMergeTree 表的数据片段时，ClickHouse 会把所有具有相同主键的行合并为一行，该行包含了被合并的行中具有数值数据类型的列的汇总值。如果主键的组合方式使得单个键值对应于大量的行，则可以显著的减少存储空间并加快数据查询的速度，对于不可加的列，会取一个最先出现的值。语法：
ENGINE [=] SummingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [columns])
参数：
columns — 包含将要被汇总的列的列名的元组
案例：
create table smt_table (date Date, name String, a UInt16, b UInt16) ENGINE=SummingMergeTree(date, (date, name), 8192, (a))
插入数据：
insert into smt_table (date, name, a, b) values ('2019-07-10', 'a', 1, 2);
insert into smt_table (date, name, a, b) values ('2019-07-10', 'b', 2, 1);
insert into smt_table (date, name, a, b) values ('2019-07-11', 'b', 3, 8);
insert into smt_table (date, name, a, b) values ('2019-07-11', 'b', 3, 8);
insert into smt_table (date, name, a, b) values ('2019-07-11', 'a', 3, 1);
insert into smt_table (date, name, a, b) values ('2019-07-12', 'c', 1, 3);
等待一段时间或optimize table smt_table手动触发merge，后查询
:) select * from smt_table
┌───────date─┬─name─┬─a─┬─b─┐
│ 2019-07-10 │ a │ 1 │ 2 │
│ 2019-07-10 │ b │ 2 │ 1 │
│ 2019-07-11 │ a │ 3 │ 1 │
│ 2019-07-11 │ b │ 6 │ 8 │
│ 2019-07-12 │ c │ 1 │ 3 │
└────────────┴──────┴───┴───┘
发现2019-07-11，b的a列合并相加了，b列取了8（因为b列为8的数据最先插入）。
Distributed 分布式引擎，本身不存储数据, 但可以在多个服务器上进行分布式查询。读是自动并行的。读取时，远程服务器表的索引（如果有的话）会被使用。
Distributed(cluster_name, database, table [, sharding_key])
参数解析：
cluster_name - 服务器配置文件中的集群名,在/etc/metrika.xml中配置的
database – 数据库名
table – 表名
sharding_key – 数据分片键
案例演示： 1）在hadoop102，hadoop103，hadoop104上分别创建一个表t
:)create table t(id UInt16, name String) ENGINE=TinyLog;
2）在三台机器的t表中插入一些数据
:)insert into t(id, name) values (1, 'zhangsan');
:)insert into t(id, name) values (2, 'lisi');
3）在hadoop102上创建分布式表
:)create table dis_table(id UInt16, name String) ENGINE=Distributed(perftest_3shards_1replicas, default, t, id);
4）往dis_table中插入数据
:) insert into dis_table select * from t
5）查看数据量
:) select count() from dis_table
FROM dis_table
┌─count()─┐
│ 8 │
└─────────┘
:) select count() from t
SELECT count()
FROM t
┌─count()─┐
│ 3 │
└─────────┘
可以看到每个节点大约有1/3的数据
SQL语法
CREATE
CREATE DATABASE 用于创建指定名称的数据库，语法如下：
CREATE DATABASE [IF NOT EXISTS] db_name
如果查询中存在IF NOT EXISTS，则当数据库已经存在时，该查询不会返回任何错误。
:) create database test;
Ok.
0 rows in set. Elapsed: 0.018 sec.
CREATE TABLE 对于创建表，语法如下：
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE = engine
DEFAULT expr – 默认值，用法与SQL类似。
MATERIALIZED expr – 物化表达式，被该表达式指定的列不能被INSERT，因为它总是被计算出来的。对于INSERT而言，不需要考虑这些列。另外，在SELECT查询中如果包含星号，此列不会被查询。
ALIAS expr – 别名。
有三种方式创建表： 1）直接创建
:) create table t1(id UInt16,name String) engine=TinyLog
2）创建一个与其他表具有相同结构的表
CREATE TABLE [IF NOT EXISTS] [db.]table_name AS [db2.]name2 [ENGINE = engine]
可以对其指定不同的表引擎声明。如果没有表引擎声明，则创建的表将与db2.name2使用相同的表引擎。
:) create table t2 as t1 engine=Memory
:) desc t2
DESCRIBE TABLE t2
┌─name─┬─type───┬─default_type─┬─default_expression─┐
│ id │ UInt16 │ │ │
│ name │ String │ │ │
└──────┴────────┴──────────────┴────────────────────┘
3）使用指定的引擎创建一个与SELECT子句的结果具有相同结构的表，并使用SELECT子句的结果填充它。语法：
CREATE TABLE [IF NOT EXISTS] [db.]table_name ENGINE = engine AS SELECT ...
实例：先在t2中插入几条数据
:) insert into t1 values(1,'zhangsan'),(2,'lisi'),(3,'wangwu')
:) create table t3 engine=TinyLog as select * from t1
:) select * from t3
┌─id─┬─name─────┐
│ 1 │ zhangsan │
│ 2 │ lisi │
│ 3 │ wangwu │
└────┴──────────┘
INSERT INTO 主要用于向表中添加数据，基本格式如下：
INSERT INTO [db.]table [(c1, c2, c3)] VALUES (v11, v12, v13), (v21, v22, v23), ...
实例：
:) insert into t1 values(1,'zhangsan'),(2,'lisi'),(3,'wangwu')
还可以使用select来写入数据：
INSERT INTO [db.]table [(c1, c2, c3)] SELECT ...
实例：
:) insert into t2 select * from t3
:) select * from t2
┌─id─┬─name─────┐
│ 1 │ zhangsan │
│ 2 │ lisi │
│ 3 │ wangwu │
└────┴──────────┘
ClickHouse不支持的修改数据的查询：UPDATE, DELETE, REPLACE, MERGE, UPSERT, INSERT UPDATE。
ALTER ALTER只支持MergeTree系列，Merge和Distributed引擎的表，基本语法：
ALTER TABLE [db].name [ON CLUSTER cluster] ADD|DROP|MODIFY COLUMN ...
参数解析：
ADD COLUMN – 向表中添加新列
DROP COLUMN – 在表中删除列
MODIFY COLUMN – 更改列的类型
案例演示： 1）创建一个MergerTree引擎的表
create table mt_table (date Date, id UInt8, name String) ENGINE=MergeTree(date, (id, name), 8192);
2）向表中插入一些值
insert into mt_table values ('2019-05-01', 1, 'zhangsan');
insert into mt_table values ('2019-06-01', 2, 'lisi');
insert into mt_table values ('2019-05-03', 3, 'wangwu');
3）在末尾添加一个新列age
:)alter table mt_table add column age UInt8
:)desc mt_table
┌─name─┬─type───┬─default_type─┬─default_expression─┐
│ date │ Date │ │ │
│ id │ UInt8 │ │ │
│ name │ String │ │ │
│ age │ UInt8 │ │ │
└──────┴────────┴──────────────┴────────────────────┘
:) select * from mt_table
┌───────date─┬─id─┬─name─┬─age─┐
│ 2019-06-01 │ 2 │ lisi │ 0 │
└────────────┴────┴──────┴─────┘
┌───────date─┬─id─┬─name─────┬─age─┐
│ 2019-05-01 │ 1 │ zhangsan │ 0 │
│ 2019-05-03 │ 3 │ wangwu │ 0 │
└────────────┴────┴──────────┴─────┘
4）更改age列的类型
:)alter table mt_table modify column age UInt16
:)desc mt_table
┌─name─┬─type───┬─default_type─┬─default_expression─┐
│ date │ Date │ │ │
│ id │ UInt8 │ │ │
│ name │ String │ │ │
│ age │ UInt16 │ │ │
└──────┴────────┴──────────────┴────────────────────┘
5）删除刚才创建的age列
:)alter table mt_table drop column age
:)desc mt_table
┌─name─┬─type───┬─default_type─┬─default_expression─┐
│ date │ Date │ │ │
│ id │ UInt8 │ │ │
│ name │ String │ │ │
└──────┴────────┴──────────────┴────────────────────┘
DESCRIBE TABLE 查看表结构
:)desc mt_table
┌─name─┬─type───┬─default_type─┬─default_expression─┐
│ date │ Date │ │ │
│ id │ UInt8 │ │ │
│ name │ String │ │ │
└──────┴────────┴──────────────┴────────────────────┘
CHECK TABLE 检查表中的数据是否损坏，他会返回两种结果： 0 – 数据已损坏 1 – 数据完整该命令只支持Log，TinyLog和StripeLog引擎。
一叶扁粥
关注
关注
点赞
12
收藏
打赏
评论
clickhouse的安装和使用（单机+集群）
什么是clickhousClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库（DBMS），主要用于在线分析处理查询（OLAP），能够使用SQL查询实时生成分析数据报告。安装前的准备以CentOS6.8为例1. CentOS取消打开文件数限制在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.con...
复制链接
扫一扫
专栏目录
clickhouse的单机部署
new_buff_007的博客
03-01
233
1.什么是clickhouse
clickhouse:全称是click stream data warehouse,简称clickhouse。是一个完全的列式数据库，可以做到流批一体。
2.单机部署
1.入门安装与启动
（1）使用脚本下载yum源
yum install -y curl // 安装curl，可以请求url链接，请求外网
curl -s https://packagecloud.io/install/repositories/altinity/clickhouse/script.
3分钟搞定ClickHouse单机部署
Aaron的博客
04-19
574
背景做为一名 "极客少年" , 总是按耐不住想要整点活 , 在 Windows 上捣腾个黑苹果,去 Andriod 机上搞个 Linux , 这不现在又想部署个单机的ClickHouse基础环境服务器软件版本bigdata1Centos7.6.1bigdata1ClickHouse20.4.5.36手把手教你白嫖三台服务器ClickHouse 可以在任何具有 x86_64 , AArch64 或 PowerPC64LE CPU 架构的 Linux , FreeBSD 或 Mac OS X 上运行。检查当前
评论 1
您还未登录，请先
登录
后发表或查看评论
ClickHouse教程 — 第一章 ClickHouse单机版安装
最新发布
Mr_XiMu的博客
11-22
346
ClickHouse单机版安装使用
ClickHouse集群搭建部署
u013332124的专栏
01-27
9011
文章目录一、单机版安装和启停二、集群部署搭建1、手动搭建clickhouse集群2、使用docker-compose快速搭建clickhouse集群三、集群扩容如何保证扩容后的数据均匀分布？四、集群缩容docker-compose 中的一些文件
一、单机版安装和启停
单机版的安装相对简单，官网介绍了好几种办法：
https://clickhouse.com/docs/zh/getting-started/install/
这里提一下tgz安装包的方式，目前官网的文档有点问题(不知道将来会不会更新)。从21
Clickhouse数据库七：配置高可用（复本）
weixin_42796403的博客
03-23
366
Clickhouse数据库七：配置高可用（复本）
副本的目的主要是保障数据的高可用性，即使一台clickhouse节点宕机，那么也可以从其他服务器获得相同的数据。
clickhouse的副本严重依赖zookeeper, 用于通知副本server状态变更
副本是表级别的，不是整个服务器级的。所以，服务器里可以同时有复本表和非复本表。
7.1 复本写入流程
7.2 配置规划
7.3 在hadoop103安装clickhouse
参考:https://blog.csdn.net/weixin_42796
metrika.xml 的格式一
一名数据库爱好者的专栏
04-23
1313
网上搜到的常见的 metrika.xml 内容，发现在 clickhouse 21.4 上无效果。
# yum list installed |grep -i clickhouse
clickhouse-client.noarch 21.4.4.30-2 @clickhouse-stable
clickhouse-common-static.x86_64 21.4.4.30-2 @cli
ClickHouse单机+集群部署。
现在你写的以后就变成了你的野心
03-30
268
Clickhouse集群搭建Clickhouse集群搭建（rpm）搭建前准备开始安装添加clickhouse源查一下clickhouse源有没有添加成功安装servier和client检查是否安装成功通过 clickhouse service 来启动,停止,clickhouse启动服务使用客户端退出客户端配置 config.xml每台节点启动完成了查看是否启动如过启动失败可以去查看log ,log位置启动完成后我们进入client ,说明成功了
Clickhouse集群搭建（rpm）
搭建前准备
配置好防
阿里云数据库ClickHouse核心技术解析
huzechen的博客
11-27
1448
分享嘉宾：和君阿里云编辑整理：猫哥出品平台：大数据猫导读：2020年ClickHouse就是一批黑马，成功脱颖而出，在各大互联网都受到青睐，头条、腾讯、快手、阿里都在使用ClickHo...
clickhouse的metrika.xml
星瀚
09-27
325
clickhouse , config.xml metrika.xml
clickhouse集群搭建详细步骤
dnice的博客
04-29
7395
搭建说明
Clickhouse集群依赖Zookeeper集群。因此需要先搭建zk集群。
请先参考【记录】zookeeper集群搭建详细步骤完成zookeeper集群搭建。
如果zookeeper集群已成功搭建完成，下面开始搭建Clickhouse集群。
需要环境：
实例1
实例2
实例3
IP
192.168.11.11
192.168.11.12
192.168.11.13
OS
centos7.9
centos7.9
centos7.9
zk
zookeeper-3.8.0
clickhouse集群部署步骤（包括部分问题解决方法）
m0_67550015的博客
07-24
3272
clickhouse集群部署（三台机器）
Clickhouse-高级
cybtcl的博客
04-05
2741
Clickhouse使用场景
列式存储、数据压缩、向量化执行、支持标准 SQL、支持 20 多张表引擎、支持多线程与分布式、多主架构、交互式查询、数据分片与分布式查询等
ClickHouse 适合 OLAP 数据分析类的场景，数据体量越大，ClickHouse 的优势越大。ClickHouse 不适合以下场景： 1) ClickHouse 不支持事务，事务场景不适合 2) 不适合根据主键进行行粒度查询或删除场景（支持但不建议）
ClickHouse集群安装
1）这里选择 node1、node2
ClickHouse集群搭建
喜讯XiCent 的博客
11-15
4239
前两篇文章给大家介绍了ClickHouse及其核心架构，以及ClickHouse的单机部署。但是在实际生产中我们很少会是单机运行，因此今天就给大家介绍ClickHouse集群的部署方法
Zookeeper集群部署
ClickHouse虽说不依赖Hadoop生态，但是依赖于zookeeper，作用是实现ClickHouse多个实例之间的通信。例如一个客户端向其中一个实例发起写入数据的操作，该实例接收到请求后会将操作日志写入zookeeper中，这样其他实例监听到zookeeper的变化，便从目标实例下载数.
【clickhouse】clickhouse 副本与分片分片详解
九师兄
02-07
3703
1.概述
转载：【clickhouse】clickhouse 副本与分片分片详解
clickhouse 中每个服务器节点都可以被称为一个 shard（分片）。假设有 N 台服务器，每个服务器上都有一张数据表 A，且每个服务器上的数据表 A 的数据不重复，那么就可以说数据表 A 拥有 N 的分片。
对于一个完整的方案来说，还要考虑在数据写入时如何被均匀低写到各个分片中，以及数据在查询时如何路由到每个分片，组合成结果集。
clickhouse 的数据分片需要结合 DIstributed 表引擎一起使用。.
Clickhouse 集群安装(完整版)
@羲凡—只为更好的活着
01-19
2791
@羲凡——只为了更好的活着
Clickhouse 集群安装(完整版)
前期准备
安装zookeeper
集群步骤
1.先安装四个单机的clickhouse
2.在四台机器上新建 /etc/metrika.xml 文件，生成两分片两副本集群
一、安装单机clickhouse(四台都操作,以Centos为例)
官网Centos/Ubuntu/Docker安装
1.1.在线安装
yum install yum-utils
rpm --import https://repo.clickhouse.tech/CLIC
ClickHouse最佳实战之分布表写入流程分析
京东科技开发者
10-14
1595
云妹导读：前不久，京东智联云正式上线了基于Clickhouse的分析型云数据库JCHDB，一经推出便受到广大用户的极大关注。有兴趣的小伙伴可以回顾上一篇文章《比MySQL快839倍！揭开...
ClickHouse集群探究 3shard_2replicas
麦田里的守望者-蒋中洲【相信相信的力量】
12-19
744
1、准备三台物理主机分别命名为CentOSA/CentOSB/CentOSC
2、规划物理主机的集群规模和配置图
3、按照单机模式分别在CentOSA、CentOSB、CentOSC上安装ClickHouse的服务
4、安装完成后，所有节点拷贝/etc/init.d/clickhouse-server脚本在/etc/init.d/clickhouse-server-1
5、修改clickhouse-server-1脚本
#!/bin/sh
### BEGIN INIT INFO
# Provides:
Clickhouse（四）基本概念
xiaohu21的博客
10-02
1499
Clickhouse使用和接入方式
1.Clickhouse有哪些接入方式
2. Clickhouse介入方式详解
3.Clickhouse接入方式常见问题和解决办法
ClickHouse集群模式总结
chensonga的专栏
01-12
2891
ClickHouse 集群模式分类
Clickhouse分布式集群搭建
大数据研习社
07-27
750
这种方法更为安全，它可以把使用这些环境变量的权限控制到用户级别,这里是针对某一个特定的用户，如果你需要给某个用户权限使用这些环境变量，你只需要修改其个人用户主目录下的.bashrc文件就可以了。这里是针对所有的用户的,所有的shell。Zookeeper最小集群是3节点集群，生产环境中100节点以下集群3个Zookeeper节点就够用，500节点以下集群5节点就够用。可以到官网下载对应版本的jdk，这里选择安装jdk1.8版本，并上传至/home/hadoop/app目录下。...
“相关推荐”对你有帮助么？
非常没帮助
没帮助
一般
有帮助
非常有帮助
提交
©️2022 CSDN
皮肤主题：像素格子
设计师：CSDN官方博客
返回首页
一叶扁粥
CSDN认证博客专家
CSDN认证企业博客
码龄5年
暂无认证
原创
39万+
周排名
144万+
总排名
1万+
访问
等级
223
积分
粉丝
获赞
评论
13
收藏
私信
关注
热门文章
clickhouse的安装和使用（单机+集群）
5616
命令行执行可以，脚本无效的解决办法
2866
ssh突然失效
775
-XX:-HeapDumpOnOutOfMemoryError
622
hue调度oozie，oozie再调度sqoop遇到的问题
585
分类专栏
大数据框架
3篇
学习笔记
2篇
遇到的问题
4篇
最新评论
CentOS6.8安装Ambari
一叶扁粥:
这些也是从网上各种找各种试，最后才成的，遗憾的是忘记备份了
CentOS6.8安装Ambari
开着拖拉机回家:
谢谢，我想问下目前 HDP 的这些 tar 文件您是怎么获取的
CentOS6.8安装Ambari
一叶扁粥:
好几年了，找不到了
CentOS6.8安装Ambari
开着拖拉机回家:
HDP-UTILS-1.1.0.21-centos6.tar.gz 大哥这个压缩包有吗？
clickhouse的安装和使用（单机+集群）
Tisfy:
这让我想起了先贤的一句话：六翮飘飖私自怜，一离京洛十馀年。
您愿意向朋友推荐“博客详情页”吗？
强烈不推荐
不推荐
一般般
推荐
强烈推荐
提交
最新文章
idea远程调试看flume源码
cdh5.12安装spark2时，客户端配置 (id=12) 已使用 1 退出,而预期值为 0
hue调度oozie，oozie再调度sqoop遇到的问题
2019年10篇
目录
目录
分类专栏
大数据框架
3篇
学习笔记
2篇
遇到的问题
4篇
目录
评论 1
被折叠的条评论
为什么被折叠?
到【灌水乐园】发言
查看更多评论
打赏作者
一叶扁粥
你的鼓励将是我创作的最大动力
¥2
¥4
¥6
¥10
¥20
输入1-500的整数
余额支付
(余额：-- )
扫码支付
扫码支付：¥2
获取中
扫码支付
您的余额不足，请更换扫码支付或充值
打赏作者
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额
抵扣说明：
1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。 2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。
余额充值