flink读取数据后过滤出包含数据
的行
在Flink中,过滤出包含数据的行,可以使用filter算子结合contains方法来实现。
示例代码如下:
import org.apache.flink.api.common.functions.FilterFunction;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
public class FlinkFilterExample {
public static void main(String[] args) throws Exception {
// 创建执行环境
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
// 从文件中读取数据
DataStream<String> input = env.readTextFile("path/to/file.txt");
// 过滤出包含数据的行
DataStream<String> filtered = input.filter(new FilterFunction<String>() {
@Override
public boolean filter(String value) throws Exception {
return value.contains("数据");
}
});
// 打印结果
filtered.print();
// 执行程序
env.execute("Flink Filter Example");
}
}
在上面的代码中,我们首先使用readTextFile方法从文件中读取数据,然后使用filter算子结合contains方法来过滤出包含数据的行。最后,我们使用print方法将结果打印出来。
需要注意的是,filter算子只过滤掉不满足条件的数据,而不会修改数据本身。如果需要修改数据,可以使用map算子
原文地址: https://www.cveoy.top/t/topic/fD1G 著作权归作者所有。请勿转载和采集!