LINEのData Platform室では、Apache Flinkによるストリーミング処理パイプラインを開発、運用しています。本セッションでは、このパイプラインを高パフォーマンスかつ安定的にするために取り組んでいる2つのプロジェクトについて発表します。
まず前半は、Kafka-to-Elasticsearchのパイプラインを、Kafka StreamsからFlinkに移行したプロジェクトの紹介です。Kafka StreamsとFlinkのスレッディングモデルの違いに触れながら、Flinkに移行した理由、移行の結果について解説します。
後半は、Flinkによるストリーミング処理システムにおいてオートスケーリングを実現したプロジェクトの紹介です。多種多様なFlinkジョブを汎用的にオートスケーリングするための工夫や、Kubernetes上での実装について述べます。