流计算业务修复或重跑历史数据时,常需手动干预 Kafka Consumer Group 的消费位点。本文总结将 Offset 按时间回渐、清空与重置至 Earliest 三种常用递层操作。
-
Kafka Connect Task UNKNOWN 状态修复与 Flink Savepoint 恢复指南
记录 Kafka Connect 任务进入 UNKNOWN 卡死状态时的 REST API 复位操作,以及 Flink 任务基于 S3 Savepoint 的快速停启命令。
-
Flink SQL 多流 Join 背压优化与 MiniBatch 状态调优实践
生产中 Flink SQL 多流 Join 极易触发背压。本文总结了使用 LATERAL TABLE 替代多流 Join、以及开启 RocksDB MiniBatch 减少 IO 的两项优化经验。
-
ClickHouse ReplicatedMergeTree 副本数据不一致与 ZK Path 修复实践
在 ClickHouse 集群中,ReplicatedMergeTree 表的 Zookeeper 路径异常会导致副本数据不一致。本文演示从排查数据偏差、隔离差异数据,到重建表结构、回写数据的完整修复方案。
-
2025-06-01-kafka-connect-apache-camel-guide
2025-06-01-kafka-connect-apache-camel-guide
-
FlinkML 遇到的性能问题--避坑
FlinkML进行矩阵计算的遇到的性能问题,以及原因分析
-
2025-09-28-flink-sql-ml-dataset-feature-etl
2025-09-28-flink-sql-ml-dataset-feature-etl
-
使用`Mavne Archetypes`定一个flink-udf-quickstart工具
使用
Mavne Archetypes定义统一的flink-udf-pom模板,便于快速复用和版本一致性 -
FlinkSQL Error — OffsetOutOfRangeException
本文记录了一次 FlinkSQL 消费 Kafka 时遇到的 OffsetOutOfRangeException 错误。该错误是由于 Flink 作业尝试从一个已不存在的 Kafka offset 开始消费数据导致的。根本原因是 Kafka topic 的数据已根据保留策略被清理,而 Flink consumer group 却被重置到了一个过旧的时间点,其对应的 offset 已经失效。
-
Analyzing Replica Inconsistency in ClickHouse
在 ClickHouse 多Shard多副本集群中,使用 ReplicatedMergeTree 引擎建表时,如果未显式指定 Zookeeper 路径,系统默认使用包含随机 {uuid} 的路径,可能导致同一 Shard 的不同副本 Zookeeper 路径不一致,进而引发数据不一致的问题。本文分析了该问题的成因,并提出规避建议。
In ClickHouse multi-shard, multi-replica clusters, using ReplicatedMergeTree without explicitly setting the Zookeeper path can lead to inconsistent paths due to randomly generated {uuid} values. This may cause data inconsistency between replicas within the same shard. This post analyzes the root cause and provides mitigation suggestions.