[root@master pyflink]# cat k102.py
from pyflink.datastream import StreamExecutionEnvironment
# 创建 StreamExecutionEnvironment 对象
env = StreamExecutionEnvironment.get_execution_environment()
# 读取文件,创建 DataStream 对象
data_stream = env.read_text_file('/root/pyflink/test.log')
# 对每行数据添加字符串 'aaaa'
new_stream = data_stream.map(lambda x: 'aaaa->'+x)
# 输出到控制台
new_stream.print()
# 执行任务
env.execute('Add "aaaa" to each line')
[root@master pyflink]# python k102.py
4> aaaa->3333333333333333,ccccccccccccc
2> aaaa->222222233333333,hhhhhhhhhhhhh
3> aaaa->1111111111111111,aaaaaaaaaaaaaa
1> aaaa->4444444444444444,eeeeeeeeeeeee
4> aaaa->1111111111111111,ddddddddddddd
1> aaaa->111111122222222,ffffffffffffff
3> aaaa->2222222222222222,bbbbbbbbbbbbbb
[root@master pyflink]# cat test.log
1111111111111111,aaaaaaaaaaaaaa
2222222222222222,bbbbbbbbbbbbbb
3333333333333333,ccccccccccccc
1111111111111111,ddddddddddddd
4444444444444444,eeeeeeeeeeeee
111111122222222,ffffffffffffff
222222233333333,hhhhhhhhhhhhh
[root@master pyflink]# python k102.py
2> aaaa->1111111111111111,aaaaaaaaaaaaaa
2> aaaa->2222222222222222,bbbbbbbbbbbbbb
3> aaaa->3333333333333333,ccccccccccccc
3> aaaa->1111111111111111,ddddddddddddd
4> aaaa->4444444444444444,eeeeeeeeeeeee
4> aaaa->111111122222222,ffffffffffffff
1> aaaa->222222233333333,hhhhhhhhhhhhh
在上述代码中,map() 函数接受一个 lambda 表达式作为参数,用于对每行数据进行处理。lambda 表达式中的
x 变量表示每行数据,x + 'aaaa' 表示将每行数据末尾添加字符串 'aaaa'。
最后通过 print() 方法将处理后的数据输出到控制台。
对数据流应用映射转换。转换调用的MapFunction文章来源:https://www.toymoban.com/news/detail-467896.html
数据流的每个元素。每个MapFunction调用只返回一个元素。文章来源地址https://www.toymoban.com/news/detail-467896.html
到了这里,关于pyflink map函数例子的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!