メインコンテンツまでスキップ

Information Schema

インフォメーションスキーマ

StarRocksのinformation_schemaは、各StarRocksインスタンス内にあるデータベースです。information_schemaには、StarRocksインスタンスが保持するすべてのオブジェクトの詳細なメタデータ情報を保存するいくつかの読み取り専用のシステム定義テーブルが含まれています。

インフォメーションスキーマを介したメタデータの表示

information_schemaのテーブルの内容をクエリして、StarRocksインスタンス内のメタデータ情報を表示することができます。

以下の例は、テーブルsr_memberに関するメタデータ情報を、テーブルtablesをクエリして表示するものです。

mysql> SELECT * FROM information_schema.tables WHERE TABLE_NAME like 'sr_member'\G
*************************** 1. row ***************************
TABLE_CATALOG: def
TABLE_SCHEMA: sr_hub
TABLE_NAME: sr_member
TABLE_TYPE: BASE TABLE
ENGINE: StarRocks
VERSION: NULL
ROW_FORMAT: NULL
TABLE_ROWS: 6
AVG_ROW_LENGTH: 542
DATA_LENGTH: 3255
MAX_DATA_LENGTH: NULL
INDEX_LENGTH: NULL
DATA_FREE: NULL
AUTO_INCREMENT: NULL
CREATE_TIME: 2022-11-17 14:32:30
UPDATE_TIME: 2022-11-17 14:32:55
CHECK_TIME: NULL
TABLE_COLLATION: utf8_general_ci
CHECKSUM: NULL
CREATE_OPTIONS: NULL
TABLE_COMMENT: OLAP
1 row in set (1.04 sec)

インフォメーションスキーマのテーブル

StarRocksは、tablestables_config、およびload_tracking_logsテーブルが提供するメタデータ情報を最適化し、information_schemaからv3.1以降のバージョンでloadsテーブルを提供しています。

インフォメーションスキーマのテーブル名

説明

tables

テーブルの一般的なメタデータ情報を提供します。

tables_config

StarRocks固有のテーブルの追加のメタデータ情報を提供します。

load_tracking_logs

ロードジョブのエラー情報(存在する場合)を提供します。

loads

ロードジョブの結果を提供します。このテーブルはv3.1以降でサポートされています。現時点では、 Broker Load および Insert ジョブの結果のみをこのテーブルから表示することができます。

loads

loadsテーブルでは、以下のフィールドが提供されています。

フィールド

説明

JOB_ID

StarRocksがロードジョブを識別するために割り当てる固有のIDです。

LABEL

ロードジョブのラベルです。

DATABASE_NAME

データベースの名前です。ロードジョブの対象となるStarRocksテーブルが所属するデータベースです。

STATE

ロードジョブの状態です。有効な値は次のとおりです:

  • PENDING: ロードジョブが作成されました。
  • QUEUEING: ロードジョブがスケジュール待ちのキューにあります。
  • LOADING: ロードジョブが実行中です。
  • PREPARED: トランザクションがコミットされました。
  • FINISHED: ロードジョブが成功しました。
  • CANCELLED: ロードジョブが失敗しました。

詳細は、 非同期ロード を参照してください。

PROGRESS

ロードジョブのETLステージおよびLOADINGステージの進捗状況です。

TYPE

ロードジョブのタイプです。BROKER Loadの場合、返り値はBROKERです。INSERTの場合、返り値はINSERTです。

PRIORITY

ロードジョブの優先度です。有効な値はHIGHESTHIGHNORMALLOWLOWESTです。

SCAN_ROWS

スキャンされたデータ行の数です。

FILTERED_ROWS

データ品質が不十分なためにフィルタリングされたデータ行の数です。

UNSELECTED_ROWS

WHERE句で指定された条件によりフィルタリングされたデータ行の数です。

SINK_ROWS

ロードされたデータ行数です。

ETL_INFO

ロードジョブのETLの詳細です。Spark Loadの場合、空でない値が返されます。他のタイプのロードジョブの場合は、空の値が返されます。

TASK_INFO

ロードジョブのタスク実行の詳細情報です。timeoutおよびmax_filter_ratioの設定などが含まれます。

CREATE_TIME

ロードジョブが作成された時間です。形式:yyyy-MM-dd HH:mm:ss 例:'2023-07-24 14:58:58'

ETL_START_TIME

ETLステージの開始時刻です。形式:yyyy-MM-dd HH:mm:ss 例:'2023-07-24 14:58:58'

ETL_FINISH_TIME

ETLステージの終了時刻です。形式:yyyy-MM-dd HH:mm:ss 例:'2023-07-24 14:58:58'

LOAD_START_TIME

LOADINGステージの開始時刻です。形式:yyyy-MM-dd HH:mm:ss 例:'2023-07-24 14:58:58'

LOAD_FINISH_TIME

LOADINGステージの終了時刻です。形式:yyyy-MM-dd HH:mm:ss 例:'2023-07-24 14:58:58'

JOB_DETAILS

ロードされたデータの詳細情報です。バイト数やファイル数などが含まれます。

ERROR_MSG

ロードジョブのエラーメッセージです。ロードジョブにエラーが発生しなかった場合、NULLが返されます。

TRACKING_URL

ロードジョブで検出された不正なデータ行のサンプルにアクセスするためのURLです。curlコマンドまたはwgetコマンドを使用して、URLにアクセスし、不正なデータ行のサンプルを取得することができます。不正なデータが検出されない場合、NULLが返されます。

TRACKING_SQL

ロードジョブのトラッキングログをクエリするために使用できるSQLステートメントです。ロードジョブに不正なデータ行が関与していない場合、NULLが返されます。

REJECTED_RECORD_PATH

ロードジョブでフィルタリングされたすべての不正なデータ行にアクセスできるパスです。ロードジョブで記録される不正なデータ行の数は、ロードジョブで設定されたlog_rejected_record_numパラメータによって決まります。wgetコマンドを使用してパスにアクセスできます。ロードジョブに不正なデータ行が関与していない場合、NULLが返されます。

tables

tablesテーブルでは、以下のフィールドが提供されています。

フィールド

説明

TABLE_CATALOG

テーブルを格納しているカタログの名前。

TABLE_SCHEMA

テーブルを格納しているデータベースの名前。

TABLE_NAME

テーブルの名前。

TABLE_TYPE

テーブルの種類。有効な値は「BASE TABLE」または「VIEW」です。

ENGINE

テーブルのエンジンタイプ。有効な値は「StarRocks」「MySQL」「MEMORY」または空の文字列です。

VERSION

StarRocksで利用できない機能に適用されます。

ROW_FORMAT

StarRocksで利用できない機能に適用されます。

TABLE_ROWS

テーブルの行数。

AVG_ROW_LENGTH

テーブルの平均行長(サイズ)。DATA_LENGTH / TABLE_ROWSと同等です。単位:バイト。

DATA_LENGTH

テーブルのデータ長(サイズ)。単位:バイト。

MAX_DATA_LENGTH

StarRocksで利用できない機能に適用されます。

INDEX_LENGTH

StarRocksで利用できない機能に適用されます。

DATA_FREE

StarRocksで利用できない機能に適用されます。

AUTO_INCREMENT

StarRocksで利用できない機能に適用されます。

CREATE_TIME

テーブルが作成された時刻。

UPDATE_TIME

テーブルが最後に更新された時刻。

CHECK_TIME

テーブルの整合性チェックが最後に実行された時刻。

TABLE_COLLATION

テーブルのデフォルトの照合順序。

CHECKSUM

StarRocksで利用できない機能に適用されます。

CREATE_OPTIONS

StarRocksで利用できない機能に適用されます。

TABLE_COMMENT

テーブルのコメント。

tables_config

tables_configテーブルでは、以下のフィールドが提供されています。

フィールド

説明

TABLE_SCHEMA

テーブルを格納しているデータベースの名前。

TABLE_NAME

テーブルの名前。

TABLE_ENGINE

テーブルのエンジンタイプ。

TABLE_MODEL

テーブルの種類。有効な値は「DUP_KEYS」、「AGG_KEYS」、「UNQ_KEYS」、「PRI_KEYS」です。

PRIMARY_KEY

プライマリキーまたはユニークキーのテーブルの主キー。テーブルがプライマリキーのテーブルまたはユニークキーのテーブルでない場合、空の文字列が返されます。

PARTITION_KEY

テーブルのパーティショニングカラム。

DISTRIBUTE_KEY

テーブルのバケット列。

DISTRIBUTE_TYPE

テーブルのデータ分散方法。

DISTRIBUTE_BUCKET

テーブルのバケット数。

SORT_KEY

テーブルのソートキー。

PROPERTIES

テーブルのプロパティ。

TABLE_ID

テーブルのID。

load_tracking_logs

この機能はStarRocks v3.0以降でサポートされています。

load_tracking_logsテーブルでは、以下のフィールドが提供されています。

フィールド

説明

JOB_ID

ロードジョブのID。

LABEL

ロードジョブのラベル。

DATABASE_NAME

ロードジョブが属するデータベース。

TRACKING_LOG

ロードジョブのエラーログ(存在する場合)。

Type

ロードジョブのタイプ。有効な値:BROKER、INSERT、ROUTINE_LOAD、STREAM_LOAD。

materialized_views

materialized_viewsテーブルでは、以下のフィールドが提供されています。

フィールド

説明

MATERIALIZED_VIEW_ID

マテリアライズドビューのID

TABLE_SCHEMA

マテリアライズドビューが存在するデータベース

TABLE_NAME

マテリアライズドビューの名前

REFRESH_TYPE

マテリアライズドビューのリフレッシュタイプ(ROLLUPASYNCMANUALを含む)

IS_ACTIVE

マテリアライズドビューがアクティブかどうかを示します。非アクティブなマテリアライズドビューはリフレッシュやクエリができません。

INACTIVE_REASON

マテリアライズドビューが非アクティブになっている理由

PARTITION_TYPE

マテリアライズドビューのパーティショニング戦略のタイプ

TASK_ID

マテリアライズドビューのリフレッシュを担当するタスクのID

TASK_NAME

マテリアライズドビューのリフレッシュを担当するタスクの名前

LAST_REFRESH_START_TIME

直近のリフレッシュタスクの開始時刻

LAST_REFRESH_FINISHED_TIME

直近のリフレッシュタスクの終了時刻

LAST_REFRESH_DURATION

直近のリフレッシュタスクの実行時間

LAST_REFRESH_STATE

直近のリフレッシュタスクの状態

LAST_REFRESH_FORCE_REFRESH

直近のリフレッシュタスクが強制リフレッシュであるかを示します

LAST_REFRESH_START_PARTITION

直近のリフレッシュタスクの開始パーティション

LAST_REFRESH_END_PARTITION

直近のリフレッシュタスクの終了パーティション

LAST_REFRESH_BASE_REFRESH_PARTITIONS

直近のリフレッシュタスクで更新されたベーステーブルのパーティション

LAST_REFRESH_MV_REFRESH_PARTITIONS

直近のリフレッシュタスクで更新されたマテリアライズドビューのパーティション

LAST_REFRESH_ERROR_CODE

直近のリフレッシュタスクのエラーコード

LAST_REFRESH_ERROR_MESSAGE

直近のリフレッシュタスクのエラーメッセージ

TABLE_ROWS

マテリアライズドビューのデータ行数(概算のバックグラウンド統計に基づく)

MATERIALIZED_VIEW_DEFINITION

マテリアライズドビューのSQL定義