发表于：2023-6-29 8:29:440次点击

各位大佬，请教个Flink CDC问题哈，flink消费kafka数据使用，请问这是什么原因，该如？[阿里云实时计算 Flink版]

各位大佬，请教个Flink CDC问题哈，flink消费kafka数据使用StreamingFileSink写入hive,当杀死jobmanager的进程时，会自动拉起另外一个jobmanager进程，hdfs目录有新增数据文件，对应的外表也可查到新增数据，但是hive表里数据总量比kafka数据总量要少，有些offset的数据hive表里没有，kafka里有，数据丢失一部分，请问这是什么原因，该如何排查解决啊？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

一	二	三	四	五	六	日
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

各位大佬，请教个Flink CDC问题哈，flink消费kafka数据使用，请问这是什么原因，该如？[阿里云实时计算 Flink版] 暂停朗读为您朗读

各位大佬，请教个Flink CDC问题哈，flink消费kafka数据使用，请问这是什么原因，该如？[阿里云实时计算 Flink版]