GitHub

flink kafka demo

本程序读取kafka数据按桶写到hdfs上，文件分区按照1分钟一次，分区大小设为20B

version

kafka 0.8.2.2

flink 1.4.0

hadoop 2.6.5

scala 2.10

java 1.8

runtime env

为快速测试程序，本程序使用docker环境下的flink kafka来测试，kafka镜像为自己制作。

flink docker镜像

docker pull flink:1.4-hadoop26
export FLINK_DOCKER_IMAGE_NAME=docker.io/flink:1.4-hadoop26

使用docker-compose快速搭建flink集群，示例docker-compose.yaml

Usage

集群建立

启动集群

docker-compose up

后台启动

docker-compose up -d

集群启动后调整TaskManagers的数目

docker-compose scale taskmanager=<N>

提交作业

将打包好的jar包放在某个目录下运行下列脚本提交作业

JOBMANAGER_CONTAINER=$(docker ps --filter name=jobmanager --format={{.ID}})
docker cp $1 "$JOBMANAGER_CONTAINER":/job.jar
docker exec -t -i "$JOBMANAGER_CONTAINER" flink run /job.jar

将上述脚本保存为submitjob.sh，打包之后的flink jar包为bigdataflink-1.0-SNAPSHOT-jar-with-dependencies.jar，使用下面脚本提交作业

./submitjob.sh /path/to/bigdataflink-1.0-SNAPSHOT-jar-with-dependencies.jar

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
src/main/scala/com/csri/flinkkafka		src/main/scala/com/csri/flinkkafka
FlinkKafkaStreaming.iml		FlinkKafkaStreaming.iml
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

flink kafka demo

version

runtime env

Usage

About

Releases

Packages

Languages

wtx626/FlinkKafkaStreaming

Folders and files

Latest commit

History

Repository files navigation

flink kafka demo

version

runtime env

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages