当前位置:首页 > 内存 > 正文

flink内存调优

  • 内存
  • 2024-08-21 15:34:43
  • 4380

一、Flink限流原文视频链接:
二、Flink性能调优(一)Flink依赖于内存计算。您可以监控GC(垃圾收集)并评估内存使用情况和残留情况,以确定内存是否是性能瓶颈并进行相应优化。
监控YARNContainerGC节点进度。
GC配置:在客户端的“conf/”配置文件中,“”配置项中添加条目:“
GC日志默认添加在这里。
任务的并行度可以定义为以下四个级别(优先级从高到低排序)>您可以根据需要为管理器设置合适的内存。
•设置内存的参数。
•使用yarn-cluster命令时添加“-yjmMEM”参数设置内存。
每个TaskManager中Core它可以运行一个任务。同时,增加任务管理器的数量就相当于增加任务并发度。“-nNUM”参数设置任务管理器的数量。同时运行多个任务相当于增加任务并发度。>使用yarn-session命令时添加“-sNUM”参数设置SLOT编号
任务管理器内存主要用于任务执行等。添加“-tmMEM”参数来设置命令br/>•添加“-ytmMEM”来设置使用yarn-cluster命令时的内存。
三、ApacheFlink是什么?Flink其实就是ApacheFlink,是业界非常流行的大数据产品。它是由Apache软件基金会开发的。其核心是一个用Java和Scala编写的分布式流数据流引擎。ApacheFlink是一个分布式、开源的数据处理框架,旨在提供“一站式”解决方案。
Flink可以并行运行任何数据流程序,Flink的流水线运行时系统可以运行批处理和流处理程序。
此外,Flink运行时本身也支持运行迭代算法。
虽然Spark和Storm的计算设施已经非常成熟,但Flink仍然占有一席之地。
主要原因是flink比较擅长设计eventtime处理模型:watermark计算实时性高,输出延迟低,后期数据接受不像spark那样受到限制。
而且,Flink提供的窗口编程模型非常灵活:不仅支持Spark和Storm没有的会话窗口,还可以创建符合自己业务逻辑的窗口。它提供的WindowAssigner、Trigger和Evictor的实现可以说是非常强大的。