在 Flink 中保存 Checkpoint 到 HDFS 中可以通过配置 flink-conf.yaml 文件中的以下参数来实现:

# State Backend
state.backend: filesystem # 设置状态后端为文件系统
state.backend.fs.checkpointdir: hdfs://<namenode-hostname>:<namenode-port>/flink/checkpoints # 设置Checkpoint保存的目录

# High Availability
high-availability: zookeeper # 设置高可用性为zookeeper
high-availability.zookeeper.quorum: <zookeeper-quorum> # 设置zookeeper集群地址
high-availability.zookeeper.path.root: /flink # 设置zookeeper根节点路径

其中,state.backend.fs.checkpointdir 参数指定了 Checkpoint 保存的目录,<namenode-hostname> 为 HDFS 的 namenode 主机名,<namenode-port> 为 HDFS 的端口号。在 Hadoop 的配置文件 core-site.xml 中可以找到 HDFS 的端口号配置:

<property>
  <name>fs.defaultFS</name>
  <value>hdfs://<namenode-hostname>:<namenode-port></value>
</property>

需要将 <namenode-hostname><namenode-port> 替换为实际的 HDFS 配置。

Flink Checkpoint 保存到 HDFS 配置详解

原文地址: https://www.cveoy.top/t/topic/mkel 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录