Overview of data loading
#データロードの概要
\import InsertPrivNote from '../assets/commonMarkdown/insertPrivNote.md'
データロードは、ビジネス要件に基づいてさまざまなデータソースからの生データをクレンジングおよび変換し、結果のデータをStarRocksにロードして高速なデータ分析を実現するプロセスです。
ロードジョブを実行することで、StarRocksにデータをロードすることができます。各ロードジョブには、ユーザーが指定するか、StarRocksが自動的に生成するユニークなラベルがあります。各ラベルは1つのロードジョブのみに使用できます。ロードジョブが完了した後は、そのラベルを他のロードジョブに再利用することはできません。ラベルの再利用は、失敗したロードジョブの場合にのみ行うことができます。このメカニズムにより、特定のラベルに関連付けられたデータは、1度しかロードできないAt-Most-Onceセマンティクスが実装されます。
StarRocksが提供するすべてのローディングメソッドは、アトミック性を保証できます。アトミック性とは、ロードジョブ内の有効なデータがすべて正常にロードされるか、有効なデータのいずれかがロードされないことを意味します。有効なデータの一部がロードされる一方、他のデータがロードされないことはありません。ただし、有効なデータにはデータ型変換エラーなどの品質上の問題によりフィルタリングされたデータは含まれません。
StarRocksは、ロードジョブを提出するために使用できる2つの通信プロトコル、MySQLおよびHTTPをサポートしています。各ローディングメソッドがサポートするプロトコルについての詳細は、このトピックの"ローディングメソッド"セクションを参照してください。