11 个实验快速入门 Flink_Scala

你将学到的

Flink 部署模式

基础算子

基于 Key 的算子

多流转换算子

Source 与 Sink

Flink 状态管理

Flink 架构

Flink 窗口

Time 和 WaterMark

Table API 和 SQL

流处理并不是一个新概念，但是要做好并不是一件容易的事情。提到流处理，我们最先想到的可能是金融交易、信号检测以及地图导航等领域的应用。但是近年来随着信息技术的发展，除了前面提到的三个领域，其它方向对数据时效性的要求也越来越高。随着 Hadoop 生态的崛起，Storm、Spark Streaming、Samza、MillWheel 等一众流处理技术开始走入大众视野，但是我们最熟悉的应该还是 Storm 和 Spark Steaming。

“高吞吐”、“低延迟”和”exactly-once“是衡量一个流处理框架的重要指标。 Storm 虽然提供了低延迟的流处理，但是在高吞吐方面的表现并不算佳，可以说基本满足不了日益暴涨的数据量，而且也没办法保证精准一次消费。Spark Streaming 中通过微批次的批处理来模拟流处理，只要当批处理的批次分的足够小，那么从宏观上来看就是流处理，这也是 Spark Steaming 的核心思想。通过微观批处理的方式，Spark Streaming 也实现了高吞吐和 exactly-once 语义，时效性也有了大幅提升，在很长一段时间里占据流处理榜首。但是受限于其实现方式，依然存在几秒的延迟，对于那些实时性要求较高的领域来说依然不够完美。在这样的背景下，Flink 应用而生，本课程我们将开始 Flink 的学习。

Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架，用于对无界和有界数据流进行有状态计算。Flink 最早起源于在 2010 ~ 2014 年，由 3 所地处柏林的大学和欧洲的一些其它大学共同进行研究的名为 Stratosphere 的项目。2014 年 4 月 Stratosphere 将其捐赠给 Apache 软件基金会，初始成员是 Stratosphere 系统的核心开发人员，2014 年 12 月，Flink 一跃成为 Apache 软件基金会的顶级项目。在 2015 年，阿里也加入到了 Flink 的开发工作中，并贡献了至少 150 万行代码。

Flink 一词在德语中有着“灵巧”、“快速”的意思，它的 logo 原型也是柏林常见的一种松鼠，以身材娇小、灵活著称，为该项目取这样的名字和选定这样的 logo 也正好符合 Flink 的特点和愿景。

注意，虽然我们说 Flink 是一个流处理框架，但是它同样可以进行批处理。因为在 Flink 的世界观里，批处理是流处理的一种特殊形式，这和 Spark 不同，在 Spark 中，流处理是通过大批量的微批处理实现的。

图片描述

适用人群

具有 Scala 基础，想学习使用 Flink 的开发人员，学生等

先学课程

了解蓝桥云课的基本操作，推荐学习新手入门指南
了解 Linux 的基本操作，推荐学习 Linux 基础入门
了解 Scala 语言，推荐学习 Scala 开发教程

课程信息

学习周期：课程有效期 2 个月，2 个月后无法进行在线实验，但可查看文档内容。高级会员有效期内可一直学习，到期后课程失效，且无法查看文档。部分云主机实验环境因成本较高，存在开启次数限制。关于课程退款等相关注意事项说明，请阅读用户付费协议。
版权说明：课程内容为蓝桥云课原创或蓝桥云课在原作者授权下制作。未经书面同意，擅自爬取、转载和再分发课程内容，均将受到严肃追责。
企业团报：企业购买，请点击企业用户咨询。