×

scala

CDH6.2集成flink1.11.6管理(cdh最新版本集成flink)

吴昊 吴昊 发表于2024-05-19 浏览4321 评论0
因官方parcel下载地址关闭,所以需要手动编译集成。 文章引用自:cdh6 flink 安装«海底苍鹰(tank)博客 与文中不同的是,我们需要在cdh6.2上集成flink1.11.6,下面一起来试试吧 clone git项目 用于编译parcel包,提供给CDH git clone https://github.com/pkeropen/flink-parcel.git 下载完毕,进入目录 vim flink-parcel/flink-parcel.properties

scala

Flink 1.15本地集群部署Standalone模式(独立集群模式)

百度用户75525 百度用户75525 发表于2024-05-18 浏览5294 评论0
一. 环境准备 1、集群规划,CentOS7环境 192.168.11.104 11.104(DB测试) centf11104 192.168.11.105 11.105(DB测试) centf11105 192.168.11.106 11.106(DB测试) centf11106 jdk安装参考:linux 环境java jdk12.0.2部署_天一道长--玄彬的博客-CSDN博客 2、jdk12 安装》配置免密登入》三个节点配置hosts 文件,通过主机名称可以访问 c

scala

02 - Flink启动(flink启动报错)

√韩少wwwywwpaycom √韩少wwwywwpaycom 发表于2024-05-18 浏览7632 评论0
1. 背景 在[01 - Flink源码编译] 文章中介绍了Flink源码如何编译,这篇文章主要介绍源码编译后的启动验证。 2. 说明 (1)Flink编译后的可执行jar包在flink-dist目录下,具体如下: 查看目录内容: a. bin目录:Flink的执行命令所在目录 c. conf目录:Flink配置文件所在的目录,主要有flink-conf.yaml(指定Flink配置)、masters(指定JobManager地址)、works(指定TaskManager地址)。 c.

未命名

大数据Flink进阶(九):集群基础环境搭建

电脑爱好者 电脑爱好者 发表于2024-05-18 浏览3451 评论0
集群基础环境搭建 Flink可以运行在所有类unix环境中,例如:Linux,Mac OS 和Windows,一般企业中使用Flink基于的都是Linux环境,后期我们进行Flink搭建和其他框架整合也是基于linux环境,使用的是Centos7.6版本,JDK使用JDK8版本(Hive版本不支持JDK11,所以这里选择JDK8),本小节主要针对Flink集群使用到的基础环境进行配置,不再从零搭建Centos系统,另外对后续整合使用到

scala

大数据中必须要掌握的 Flink SQL 详细剖析(flink的sql使用)

ohblue ohblue 发表于2024-05-18 浏览8146 评论0
目录 1. Flink SQL 常用算子 2. Flink SQL 实战案例 Flink SQL 是 Flink 实时计算为简化计算模型,降低用户使用实时计算门槛而设计的一套符合标准 SQL 语义的开发语言。 自 2015 年开始,阿里巴巴开始调研开源流计算引擎,最终决定基于 Flink 打造新一代计算引擎,针对 Flink 存在的不足进行优化和改进,并且在 2019 年初将最终代码开源,也就是我们熟知的 Blink。Blink 在原来的 Flink 基础上最显著的一个贡献就是 Flin

scala

Flink+iceberg环境搭建以及问题处理(flink Iceberg)

!!!!!!! !!!!!!! 发表于2024-05-17 浏览9900 评论0
概述 作为实时计算的新贵,Flink受到越来越多公司的青睐,它强大的流批一体的处理能力可以很好地解决流处理和批处理需要构建实时和离线两套处理平台的问题,可以通过一套Flink处理完成,降低成本,Flink结合数据湖的处理方式可以满足我们实时数仓和离线数仓的需求,构建一套数据湖,存储多样化的数据,实现离线查询和实时查询的需求。目前数据湖方面有Hudi和Iceberg,Hudi属于相对成熟的数据湖方案,主要用于增量的数据处理,它跟spark结合比较紧密,Flink结合Hudi的方案目前应用不多。

scala

Flink第一课!使用批处理,流处理,Socket的方式实现经典词频统计

Peter Peter 发表于2024-05-17 浏览6053 评论0
Flink是什么Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。 Flink的特点 支持事件时间(event-time)和处理时间(processing-time)语义 精确一次(exactly-once)的状态一致性保证 低延迟,每秒处理数百万个事件,毫秒级延迟 与众多常用存储系统的连接 高可用,动态扩展,实现7*24小时全天候运行 Flink的全球热度 Flink可以实现的目标 低延迟 来一次处理一次 高吞吐