ビッグデータマガジン

【続編】TIBCO Spotfire7.9でデータ分析を効率化する

time 2017/07/06

【続編】TIBCO Spotfire7.9でデータ分析を効率化する

こんにちは。ビッグデータマガジンの廣野です。

本当に久しぶりの投稿になる今回は、BIツール『TOIBCO Spotfire』の最新バージョンについて、前回の続報という形でご紹介したいと思います。

最新バージョンである7.9は、データ分析の実務者の目線で見ると、特にデータクレンジングを意識した機能が強化されています。

データ活用を阻む最大の壁と言ってもよい、データクレンジングに対して有効な機能が追加されるあたりは、さすがに「わかってるなぁ」といった印象で、個人的にはますます手放せないツールになっています。

これから本格的に“超・エクセル”なツールをお探しの方は、ぜひご一読ください。

 

新たに追加された機能① 欠損値の編集(データ編集)

 欠損値を処理する方法は、多くのBIツールでは、If文のような条件式で適切な数値を埋める処理(多くは新しいカラムを生成する)を行いますが、Spotfire7.9では、新しいカラムを作ることなく、欠損値に指定した数値を“埋めて”くれます。

 やりかたは、2パターンあります。

 

<パターン1 データテーブル上で処理する>

 ビジュアライゼーション機能の中にある「データテーブル」は、これまでは単にローデータを確認したり、並び替えや色分けをしたりして、見やすくするくらいの使い方でしたが、ここに新機能が加わりました。

 欠損値のところでダブルクリックすると、以下のような編集機能が表示されます。

 

 

 この機能を使うと、指定した固有の数値(または文字)を同じカラム内のすべての欠損に代入してくれます。なお、指定できるのは、元のデータ型と一致したデータだけです(Integer(整数)型のカラムに、aaaなどの文字は代入できない)。

 また、ローが識別できる(各行をユニークに特定できる情報。顧客IDや単なる通し番号など)カラムがある場合は、それをキーにして、ある特定の欠損値だけを埋めることもできます。

この機能は、すでにデータが“埋まっている”カラム(またはセル)に対しても適用できるため、ローが識別できれば、エクセルのように1セル単位でのデータ編集ができてしまいます(!)。

 なお、Spotfie上にインポートしたデータに対して適用させる処理なので、もとのデータベースには一切影響しません。上記の機能で一部のデータを編集したデータテーブルは、おインポート元のデータとは別のデータとして保存しなければなりません。

 

<パターン2 データパネル上で処理する>

 データパネル上でも、同様の処理ができます。ただし、こちらは欠損を“埋める”際にできることが多くなります。

 具体的には、特定の値だけでなく、カラム全体での平均値を代入たり、直前・直後のデータを引き継いだりすることができます。

 

   

 このように、欠損値や異常値の確認だけでなく、その処理も簡単にできるようになったため、データを入手したら「とりあえずSpotfireにインポートして確認する」という手続きがますます増えそうです。(実際、私自身もそうしてます)

 なお、こちらも<パターン1>と同様に、インポート元のデータには一切影響を与えません。

 

 

■新たに追加された機能② データテーブルの表示方法の変更

 これは地味に便利!になった機能です。

上記①と同じく、ビジュアライゼーション機能の「データテーブル」に追加された機能ですが、データテーブル(数表)の見た目をかなり自由に変更できるようになりました。

これまでも、特定のカラムを基準にしたデータの並べ替えはできましたが、表示そのものを「右寄せ/中寄せ/左寄せ」にしたり、「縦書き/横書き」表示や「折り返さないで表示できる最大幅まで広げる」など、エクセルだとおなじみの機能が追加されました。

見た目、大事ですよね(笑)

 

■新たに追加された機能③ マップチャート上で位置情報などの取得

 ビジュアライゼーション機能の「マップチャート」上で、いくつかの有益な情報が確認できるようになりました。

 1つは、マップチャート上で「長方形」または「円形」に選択した範囲の距離です。現在選択しようとしている範囲について「長方形」なら縦方向と横方向の距離、「円形」なら直径が表示されます。

 大まかな距離感を確認したいときに便利な機能です。

 

 もう一つは、マップチャート上の正確な位置を知りたい場所で右クリックを押すと、その場の緯度と経度が確認できる機能です。緯度・経度の数値がコピーできますので、Googleマップ等の別サービスでも正確に同じ位置を表示させることができます。

 

 

■まとめ

いかがでしたでしょうか?

このほかにも、ver7.9では接続できるDB・DWHの種類が増えているほか、ここではご紹介できていないver7.6~7.8の間に追加された新しいビジュアライゼーションの機能として「ウォーターフォールチャート」や「KPIチャート」などもあります。

 BIツールの進歩は相変わらず早く、Spotfireも短い期間にマイナーバージョンアップを繰り返していますので、まだどのBIツールを使うか検討中の方は、ぜひご参考にしてください。

 

 BIツールはあくまでもツールですので、どのツールを使うかよりも「何のためにデータ分析をするか」という目的のほうが、はるかに重要です。

このことは、扱うデータがどんな性質のものであれ揺るがない事実なのですが、一方で、データクレンジングに時間がかかってしまい、肝心の仮説検証に十分な時間が割けないことも、また事実です。

 皆さんが、ご自身にとって最適なツールに出会い、業務の生産性が大きく向上することを願ってやみません。

 

(お知らせ)

Spotfireがトライアルで30日間、無償で使えます!

詳しくは、TIBCO社Spotfireのホームページをご覧ください。

http://spotfire.tibco.jp/

    

down

コメントする




CAPTCHA


01_解説

06_統計

ビッグデータ活用 ご相談ください
はじめての機械学習
IoT 企画・活用講座

副編集長のぼやき

Google + ページ

ビッグデータ活用 ビッグデータマガジン

連携サイト

ビッグデータ活用 ビッグデータマガジン
 
ビッグデータ活用 ビッグデータマガジン

お問い合わせ

  • 記事に関するお問合せ、
    ビッグデータにまつわるお悩みやご相談等
    お気軽にお問い合わせください

    【お問合せフォームへ】
  •