各位大佬,请教个Flink CDC问题哈,flink消费kafka数据使用StreamingFileSink写入hive,当杀死jobmanager的进程时,会自动拉起另外一个jobmanager进程,hdfs目录有新增数据文件,对应的外表也可查到新增数据,但是hive表里数据总量比kafka数据总量要少,有些offset的数据hive表里没有,kafka里有,数据丢失一部分,请问这是什么原因,该如何排查解决啊?
各位大佬,请教个Flink CDC问题哈,flink消费kafka数据使用,请问这是什么原因,该如?[阿里云实时计算 Flink版]
「点点赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!