データマネージャーって何?
Qlik Sense のビジネスユーザー向け データ準備機能です。
データ準備とは
データの集計・可視化・分析の直前に、データを変換することです。
ポイント
分析用に取得したデータが、必要な形になっているわけではないので、加工をする必要がある
データマネージャーの特徴
➀基本的なデータ準備をノンプログラミングで行える。
➁開発者向けのデータ変換機能(ロードスクリプト)と連携していて、
データ準備を Qlik 内で完結できる。
➂ビジネスユーザーと開発者間のコミュニケーションコストが低い。
Point:データマネージャーを上手く活用することで⇓
1.複雑でない処理に関しては、ビジネスユーザー側でデータ準備できる。
2.難しい処理は開発者に依頼して Qlik Sense 内で解決できる。
データマネージャーの機能
データモデリングを行う機能がある。
1.データの取り込み:分析に必要な(複数の)テーブルを取りこむ
2.テーブル間の関連付け:テーブル間の関連を取って互いに参照できるようにする
3.データの変換:各テーブル内のデータを分析に必要な形に変換する
1.データ取り込み
•データ種類別取り込み方法
➀データベース、クラウドストレージ、外部アプリケーション
➁ファイル
➂直接手動入力
➃作成済みの既存データ接続やファイル
【取り込み時のポイント】
・取り込むテーブルと項目を選択:分析使わないテーブルや項目は取りこまない
・項目名を変更 例:「氏名」 「顧客名」?「従業員名」?
・ヘッダーサイズを変更 ファイルの何行目に項目名が記録されているか?
・演算子( や >>)でデータをフィルタリング 特定期間、特定カテゴリのデータを抽出
2.テーブル間の関連付け
•関連付け テーブル間の共通キー項目を指定する作業。
•テーブルを関連付けることで、両テーブルの項目を組み合わせて集計できる。
➀Qlik におけるテーブル間の関連付けは、一般的な SQL の結合( JOIN )とは異なります。
※結合タイプの指定は不要。 Qlik では キーとなる項目を指定するだけでよい。
※連想技術(特許) すべての項目の値の関連あり なしを Qlik 内に保持する。
結合・連結(Not 関連付け)
・結合( JOIN テーブルの 横 結合
→LEFT/RIGHT/INNER/OUTER の結合形式をサポート。
→連結( CONCATENATE テーブルの 縦 連結
自動連結/強制連結/結合・連結したテーブルの分割
3.データ変換
•テーブルエディタ でデータを変換
•テーブル関連付けの画面で任意のテーブル
※(バブル)をダブルクリックするとテーブルエディタが開く。
•画面の見方
➀テーブルエディタツールバー
➁データプレビュー
➂データプロファイリングカード
【ポイント】
•データの置換
-特定の値を別のデータに変換する
-名寄せ(国名: US 、 USA 、 アメリカ合衆国)
•NULL 処理
-特定の値を NULL に変更する
-NULL を想定しているのに NULL 以外で取りこまれた項目(空白、 ‘ 、 無し ”)の処理
•順序変更
-シート編集におけるソートよりも優先的に反映される
-例:都道府県を東から並べる、役職や支店の順序を社内ルールに合わせる
※項目の分割
-インスタンス 区切り文字(スペース、記号)
-位置、これらの位置 何文字目で区切るか
•バケット(グルーピング、ビニング)
-年齢 年代に変更
-金額などの数値に応じて規模やクラスを作成(大・中・小、プラチナ・ゴールド・シルバー)
-バケットが使える条件
•サマリーでメジャーに分類されている
•10 個以上の固有値が項目に含まれる
•項目内に 2 割以上異なる型のデータが含まれない。
データマネージャー利用のコツ
•データモデリングの前に、できるだけ使用するデータのことを知る。
•「データの追加」画面やテーブルエディタでデータを見る。
•社内のデータ定義書を入手する。
•データ利用者や管理者にデータ定義を確認する。
※計算項目の計算式に使用できる項目は操作中のテーブルの項目のみ
•テーブル間をまたがるロジックを定義したいときは、先に結合( JOIN )してから計算項目を作成する
・テーブルエディタを使用したテーブル内の項目や値に関する処理は関連付け操作の前に行う
-既に他テーブルと関連付けされている場合は、一度引きはがすことを推奨します
同一の項目を持つテーブルは自動的に縦に連結される(自動連結処理)
-テーブルを追加してもバブルの数が増えないため、一瞬戸惑う
-連結したと思われるバブルのアイコンに注目
Qlik Sense Business/Qlik Sense Enterprise SaaS にファイルを取り込む際、
データファイル領域に同名のファイルが既に存在する場合の選択肢
以上です。データマネジャーの概要について理解できたでしょうか。