Load data using Kafka connector
Kafkaコネクタを使用してデータをロードする
StarRocksは、Apache Kafka®コネクタ(StarRocks Connector for Apache Kafka®)という独自開発のコネクタを提供し、Kafkaからメッセージを継続的に消費してStarRocksにロードします。Kafkaコネクタは、少なくとも一度のセマンティクスを保証します。
KafkaコネクタはKafka Connectとシームレスに統合できるため、Kafkaエコシステムとの統合が容易です。リアルタイムデータをStarRocksにロードしたい場合、Kafkaコネクタを使用することをおすすめします。以下のシナリオでは、ルーチンロードの代わりにKafkaコネクタを使用することをおすすめします。
- ソースデータのフォーマットが、JSONやCSV、Avroではなく、Protobufの場合。
- Debezium形式のCDCデータなど、データ変換をカスタマイズする場合。
- 複数のKafkaトピックからデータをロードする場合。
- Confluent cloudからデータをロードする場合。
- ロード速度とリソース利用のバランスを実現するために、ロードバッチサイズや並列度などのパラメータを細かく制御する必要がある場合。
準備
Kafka環境を設定する
セルフマネージドのApache KafkaクラスタとConfluent クラウドの両方がサポートされています。
- セルフマネージドのApache Kafkaクラスタの場合、Apache KafkaクラスタとKafka Connectクラスタをデプロイし、トピックを作成してください。
- Confluentクラウドの場合、Confluentアカウントを作成し、クラスタとトピックを作成してください。