Tableau テクノロジー

終わることのない進歩

Tableau は、2003 年にスタンフォード大学で生まれました。その基盤となったのは、シンプルなドラッグ & ドロップ操作だけで高度なビジュアライゼーションを作成でき、データの操作方法を完全に変えるテクノロジー、VizQL™ です。VizQL は、ユーザーによる操作をデータベースクエリに変換しその結果を目に見える形で表現する、特許取得済みのクエリ言語です。

そして、それに続く進歩と言えるのが、数十億行ものデータのアドホック分析を数秒で実行する能力を持つ Tableau のデータエンジンテクノロジー、Hyper です。Tableau プラットフォームのテクノロジーの柱である Hyper は、独自の動的コード生成手法と最先端の並列処理手法を用いて、抽出の生成やクエリ実行で高速なパフォーマンスを実現します。

Hyper

Hyper は、パフォーマンスに優れたインメモリデータエンジンテクノロジーです。トランザクション処理データベースで直接、分析クエリを効率的に評価するため、大規模なデータセットや複雑なデータセットの分析に役立ちます。Tableau プラットフォームのテクノロジーの柱である Hyper は、独自の動的コード生成手法と最先端の並列処理手法を用いて、抽出の生成やクエリ実行で高速なパフォーマンスを実現します。

Hyper 独自の設計

ここ 10 年間にわたり、サンプリングや集計などの手法によって、インメモリデータエンジンと分析データベーステクノロジーのクエリパフォーマンスは大きく向上しています。しかし、こうしたパフォーマンス向上はデメリットも招きます。多くのシステムは分析ワークロードのパフォーマンス最適化を優先し、抽出の作成や更新の高速なパフォーマンスに欠かせない、書き込みのパフォーマンスを犠牲にしているのです。書き込み速度が遅ければ、データは古くなり孤立した状態になります。その結果、ユーザーは分析したいデータをすぐに分析できなくなってしまいます。 Tableau が Hyper で掲げるミッションは、書き込み処理と分析処理のパフォーマンスを高速化して、ユーザーとデータの距離を縮めることです。つまり、Hyper は最新のデータを速やかに提供し、それによってユーザーも大規模なデータをより包括的に分析できるようになります。

システムアーキテクチャの見直し: トランザクションと分析クエリを単一のシステムで処理

Hyper ではトランザクションと分析クエリが同一の列ストアで処理され、データの取り込み後に後処理は必要ありません。そのため古いデータは減り、専用システム間の接続不足が最小限に抑えられます。このような Hyper 独自のアプローチによって、読み取りが多いワークロードと書き込みが多いワークロードを単一のシステムで処理することが可能になりました。ですから、高速なクエリパフォーマンスを犠牲にせず、高速に抽出を作成することができます。(Tableau では「ウィンウィン」という言い方をしています。)

クエリ実行への新しいアプローチ: 動的コード生成

Hyper は、実行時 (JIT) コンパイルによる新しい実行モデルを採用しています。他のシステムの多くが採用しているのは、最新のマルチコアハードウェアを最大限には活用できない従来型のクエリ実行モデルです。それに比べ Hyper は、クエリを最適化して独自の機械語にコンパイルし、下位のハードウェアをうまく活用できるようにしています。Hyper はクエリを受け取ると、ツリーを作成して論理的に最適化した後、一意のプログラムを作成するための設計図としてそのツリーを利用し、最終的にプログラムを実行します。それによって、最新のハードウェアをうまく活用した、クエリ実行の高速化が実現しました。

ハードウェアの能力をさらに活用: モーセルに基づいた並列処理

Hyper は、大規模なマルチコア環境を念頭に置いて一から設計されました。その並列処理モデルがベースにしているのは、作業の非常に小さな単位 (「小片」を意味するモーセル) です。Hyper はコア速度の差異を加味しながら、モーセルを利用可能な全コアに効率的に割り当てます。これはつまり、ハードウェアのより効率的な利用と高速なパフォーマンスにつながります。

Hyper は、2010 年にミュンヘン工科大学 (TUM) で学術研究プロジェクトとしてスタートしました。そして 2015 年には、Hyper を実用化しそのテクノロジーの商用版を出荷することを目標に掲げ、独立企業としてスピンオフしました。Tableau は 2016 年に Hyper を買収し、現在そのコアテクノロジーは Tableau データエンジンを支えています。

VizQL™

視覚的だからスピーディに理解できる

Tableau の中核にあるのは、インタラクティブなデータビジュアライゼーションによってデータの理解を促進する特許取得済みテクノロジー、 VizQL です。これまでの分析ツールでは、行と列のデータを分析し、表示するデータのサブセットを選択し、選択したデータを表に整理した後、その表からグラフを作成する必要がありました。しかし VizQL ではそのような手順が必要なく、データをすぐに視覚化できるため、データを分析しながら瞬時に結果を確認できます。その結果、ユーザーはデータをはるかに深く理解でき、従来の方法よりも最高 100 倍の速さで作業を行えます。

VizQL では多彩なビジュアライゼーションを作成できます。

データのための新しい言語でより詳細な分析が可能に

画期的なアーキテクチャを備えた VizQL では、テキスト形式の SQL で行っていたデータ操作を視覚的に行えます。VizQL のステートメントは、あらゆる種類の高度な多次元ビジュアライゼーションを記述できます。つまり VizQL なら、ユーザーは 1 つの分析インターフェイスとデータベースビジュアライゼーションツールで、さまざまなグラフを作成することが可能です。 その結果 Tableau は、棒グラフや折れ線グラフからマップやリンクされている高度なビューまで、驚くほど幅広いビジュアライゼーションを作成できます。このような柔軟性により、ユーザーはまったく新しい形でデータを理解できるようになります。柔軟性のないグラフ作成テンプレートにデータを押し込むだけでは得られなかったインサイトを見出せるようになるのです。

自然な思考パターンをサポート

思考とは本来、質問して答えを得るというプロセスを通じて行われます。そのプロセスを徐々に進めていくことによって、さらに新しい情報を採り入れ、考慮できるようになります。分析を始めたときに、どのように分析を進めるべきかがはっきりとわかっていることはほとんどありません。しかし従来の BI ツールを使うには、分析の進め方を最初からわかっている必要があります。 それが VizQL の大きな違いです。VizQL ならデータを視覚的に探索し、最適な表示形式を見つけることができます。分析しながらデータをより深く理解し、必要に応じてデータを追加できるので、従来型ツールより深いインサイトが得られます。Tableau では、これをビジュアル分析のサイクルと呼んでいます。このサイクルに従うと、データのストーリーをよりよく理解することができます。

世界で唯一のツール

VizQL により、高速な分析とビジュアライゼーションが現実のものとなりました。トレーニングをほとんど行っていないユーザーでも、従来より短時間で、そしてこれまでになかった形でデータを見て理解できます。これが他のツールとの最大の違いです。