使用Mavne Archetypes定义统一的flink-udf-pom模板,便于快速复用和版本一致性
-
使用`Mavne Archetypes`定一个flink-udf-quickstart工具
-
FlinkSQL Error — OffsetOutOfRangeException
本文记录了一次 FlinkSQL 消费 Kafka 时遇到的 OffsetOutOfRangeException 错误。该错误是由于 Flink 作业尝试从一个已不存在的 Kafka offset 开始消费数据导致的。根本原因是 Kafka topic 的数据已根据保留策略被清理,而 Flink consumer group 却被重置到了一个过旧的时间点,其对应的 offset 已经失效。
-
Analyzing Replica Inconsistency in ClickHouse
在 ClickHouse 多Shard多副本集群中,使用 ReplicatedMergeTree 引擎建表时,如果未显式指定 Zookeeper 路径,系统默认使用包含随机 {uuid} 的路径,可能导致同一 Shard 的不同副本 Zookeeper 路径不一致,进而引发数据不一致的问题。本文分析了该问题的成因,并提出规避建议。
In ClickHouse multi-shard, multi-replica clusters, using ReplicatedMergeTree without explicitly setting the Zookeeper path can lead to inconsistent paths due to randomly generated {uuid} values. This may cause data inconsistency between replicas within the same shard. This post analyzes the root cause and provides mitigation suggestions. -
Flink使用经验总结-1
Flink遇到问题处理,以及部分场景的工具使用经验总结。
-
Kafka Connect 配置source task and sink task 操作手册
指引配置不同组件的Kakfa Connect sink/source task,以及注意事项
-
Cloud上ARM CPU的调研及和几点思考
随着Apple在ARM CPU替代Intel CPU的取得的巨大成功后,对ARM在云市场上大规模应用和部署是否也可行?。总体来看,ARM CPU在成本、灵活性和功耗上,相比X86CPU都有明显的优势。本文以Ampera ARM CPU为代表,简单分析其技术、性能测试和应用场景。
-
Clickhouse add external disk
Clickhouse集群添加S3外部存储
-
Clickhouse system.parts 使用
使用system.parts统计表容量、分区大小和表行数等信息
-
clickhouse config xml
Clickhouse 24.x config.xml 配置说明
-
Clickhouse minmax and set index
使用Clickhouse minmax和set索引,提升SQL查询性能