ビッグデータマガジン

「ビッグデータ」を時間軸から語らせる?~「データに語らせよう、新たな価値創造のために」(2)

time 2015/02/19

「ビッグデータ」を時間軸から語らせる?~「データに語らせよう、新たな価値創造のために」(2)

国際大学グローバル・コミュニケーション・センター
准教授/主任研究員 中西 崇文

■ 最近聞かれる言葉 − IoT

最近、IoT(Internet of Things)という言葉が頻繁に聞かれるようになりました。IoTとは、モノのインターネットとも訳され、様々なモノがインターネット、クラウドにつながるという意味です。
ここでいう「モノ」とは、身の回りの物すべてを指します。テレビでも構いません、カメラでも、家具でも、ちょっとした小物でも、それらがインターネットにつながっていくという世界を指しているのです。では、「モノ」がインターネットにつながるとどうなるのでしょうか。それは、「モノ」が自分の置かれた状況をデータとして語り出すということです。

では「モノ」が語ったデータには、どんな特徴があるでしょうか。

まず、「モノ」といっても、たくさんの「モノ」があります。たくさんの「モノ」が、現在置かれた状況をデータとして発することになります。つまり、Volumeです。

次に、「モノ」といっても、様々な種類の「モノ」があります。様々な種類の「モノ」が発するデータは、色々な種類のデータで彩られるでしょう。つまり、Varietyです。

そして、「モノ」の置かれた状況は、時々刻々と変わり続けます。その変わり続ける状況を、データは実況し、更新し続けます。つまり、Velocityです。

そうです、ビッグデータの定義の3Vに落ち着きました。「ビッグデータ」のもたらす環境の変化の一例が、IoTという言葉に凝縮されているのです。

では、なぜ今になって、IoTというキーワードが注目されてきたのでしょうか。これは根本となる「ビッグデータ」の新しい波でもあるのです。

 

■ 2015年はビッグデータ利活用元年

ビッグデータという単語自体の初出は、2010年と言われています。なんと5周年!単なるバズワードがこれほどの期間もてはやされるわけはないです。実は、ビッグデータという言葉による波がもう既に2つ去ってしまっているのです。そして、現在、3つ目の波が来ようとしているのです。その3つの波を整理しましょう。

(1) インフラストラクチャの波
最初の波は、大量の様々な随時更新されるデータ群をどのように処理すればよいのかという技術的な限界をブレイクスルーするための技術革新の波です。「クラウド」コンピューティングもこの波の流れの一つです。

この波のポイントは、大規模データ処理技術の発展によって、「ビッグデータ」を扱うためのインフラストラクチャが気軽に使えるようになった点にあります。

(2) センサー・RFIDの波
次に訪れた波が、データを大量に生成する技術の波です。その代表的なものがセンサーです。様々なところにセンサーがつけられるように小型化、廉価化したのです。

「センサーって増えた感じがしないけど・・・」と思われるかもしれませんが、自分のポケットに入ったスマートフォンを考えてください。GPS、加速度センサー、ジャイロセンサーなど、様々なセンサーが内蔵されています。数年前に、そんなものを一人一台以上持つ時代が来ることが想像できたでしょうか?

また、ウエアラブルデバイスという、直接身体にセンサーつける技術、文化まで迫ってきています。

実は、先ほどご説明したIoTは、この波の用語と言ってもいいかと思います。すべてのモノにセンサーが付き、そのセンサーすべてがインターネットやクラウドとつながっている世界です。

あと、RFIDがあります。電車に乗るとき、バスに乗るとき、交通系ICカードで済ますことが多くなりました。

この波のポイントは、センサー、RFIDカード・タグの普及によって「ビッグデータ」が身近に発生するようになった点にあります。

(3) データ利活用の波
さて、そもそも何故、センサーやRFIDカード・タグを普及させて「ビッグデータ」をより身近に発生させようとしたのでしょうか。考えたことがありますか?

データは、ビッグデータの2つの波以前にも存在していました。しかしながら、量は少なかったのです。どれくらい少なかったかというと、現在1秒間にインターネット上を行き来しているデータ量が、1990年代の10年間のインターネット全体のデータ量と大体同じなのです。

また、インターネット上のデータは、必ずしも現実とリンクしたものではありませんでした。初期のインターネット上でデータを発生させるためには、専門的な知識が必要でした。そのため、データの多くは、インターネット環境に依存したものであり、必ずしも世間一般、現実で必要とされるものではありませんでした。

しかしながら、CGM(Consumer Generated Media)という、ユーザが気軽にコンテンツを作成し、インターネット上に配信できるメディアが登場してから、インターネットが現実世界と隔離されたものではなく、リンクをはじめます。

そして、SNS(Social Networking Service)により、現実世界の人の関係を取り込むことに成功してしまいます。

さらに、センサーデータによって、現状がデータとしてインターネットに駆け巡るようになりました。

つまり、【インターネットが現実の写像になった】のです。SFチックですが、インターネットが現実の写像になったからこそ、インターネット上のデータを使わないとならない時代が来たとも言えるのです。

現実をよりよくするためには、より現実を知る必要があります。その方法としてじっと観察するという手もありますが、今やセンサーデータがインターネット上に溢れかえっているのです。この溢れかえったデータを利活用する、そういう波がやってきています。実は、IoTという言葉で訴えていることは同じなのです。データを利活用することで、現実をうまくコントロールしてより良くしていくということなのです。

この波が、2015年にやってくるのです。

 

■ ビッグデータを利活用するってどういうこと?

 

では、ビッグデータを利活用するとはどういうことなのでしょうか。一言で言えば、「仮説」や「勘」に頼らず、データに頼るということです。

データに頼るには、ELT(Extract(データを取得する)、Load(データを貯める)、Transformation(データを整理する)が不可欠です。

E、データを取得するについては、第2の波「センサー・RFIDの波」が解決してくれました。L、データを貯めるについては、第1の波「インフラストラクチャの波」が解決してくれました。問題はTです。どうやってデータを分析・整理するのか?ということです。

つまり、第3の波である「データ利活用の波」は、処理されたデータをどうやって分析、整理すると、売上拡大やコスト削減、エコにつながり、価値を生むかを考えるということなのです。

とは言っても、これまでもデータ分析はずっとされてきたわけです。そこで、それに加えてビッグデータでおさえるべきポイントがあります。ヒントは先ほど上げた【インターネットが現実の写像になった】ことです。

現実世界を見渡してみましょう。我々や我々を支える機械、共存する生物、動物はどのような制約下で生活しているでしょうか。いきなり哲学的になってしまいましたが、答えは「【時間】【場所】という制約下で生活している」ということです。

そこで、もしデータが散在しているのであれば、一度、5W1Hで整理をすることを試みるのです。

 

■ 「お盆」と「ランドセル」 5W1HのWhen(いつ)で整理してみえるもの

 

いきなりですが、ランドセルのCMの時期が年々早くなっているのを気付いた方もいらっしゃるかと思います。

そこで、「ランドセル」という言葉を使って、ちょっとした実験をしましょう。ビッグデータをいきなり用意しましょうというと、皆さま面食らってしまいますし、そもそもそんな処理環境はないと言われてしまいます。When(いつ)で整理するということを気軽に体験できるものに、Googleトレンド があります。これは、どの時期に検索ワードとしてよく検索されたかが分かります。

つまり、Googleトレンドで「ランドセル」がどの時期によく検索されるかを調査してみます。

Googleトレンドでは2004年から現在までの検索のトレンドをみることができます。ここで、「ランドセル」という検索ワードを固定して、2005年の場合と2014年の場合を比べてみましょう。

2005年の場合は、1月9日〜15日がピークになっています。

Google トレンドで2005年「ランドセル」を検索

<Google トレンドで「ランドセル」を検索 2005年 http://goo.gl/WRty2V>

Google トレンドで2014年「ランドセル」を検索

<Google トレンドで2014年「ランドセル」を検索 2014年 http://goo.gl/CWvMf3>

一方、2014年の場合は、8月31日〜9月6日がピークとなっています。2004年から順番に2014年に期間を変えていけばわかる通り、だんだん「ランドセル」という検索ワードのピークが早くなり、2014年にはお盆過ぎになってしまいました。

一説には「ランドセル」のCM放映時期を早めた理由として、お盆のおじいちゃん、おばあちゃんが孫に選んであげるためにということですが、それが見事に一致しはじめていることがわかるでしょう。これからお盆が「ランドセル」を選ぶ時期になりそうな予感もします。

時間という軸で、データを見ることによって発見した例を体験いただけたでしょうか。

 

■ 現実をデータで覗く

今回は時間という軸でデータを覗いてみました。5W1Hでデータを整理するというのは、データを現実に即して見る操作なのです。

もし、データの利活用に迷ったら、まずは「時間」の流れに注目してみませんか?


【執筆者情報】

中西 崇文 国際大学グローバル・コミュニケーション・センター 准教授中西 崇文
国際大学グローバル・コミュニケーション・センター 准教授/主任研究員 博士(工学)
1978年12月28日生まれ、三重県伊勢市出身。2006年3月、筑波大学大学院システム情報工学研究科にて博士(工学)の学位取得。独立行政法人 情報通信研究機構にてナレッジクラスタシステムの研究開発、大規模データ分析・可視化手法に関する研究開発等に従事し、2014年4月、現職に至る。
つまり、「ビッグデータ」という言葉が流行する前から、異種異分野大規模データ分析に関する研究を続けている。
専門は、データ分析システム、統合データベース、感性情報処理、メディアコンテンツ分析。近年は、ビッグデータ分析手法を通したデータ分析工学分野の創出、ソーシャルメディアコンテンツ伝搬モデルデザインに興味を持つ。知的財産管理に関する諸問題にも造詣を持つ。
著書として、「Perspectives on Social Media: A Yearbook」(Piet Kommers, Pedro Isaias, Tomayess Issa (編))のChapter 4「Toward Realizing Meta Social Media Contents Management System in Big Data」担当(共著)(Routledge刊、2014年8月発売)がある。
また、趣味は楽曲制作、ピアノ演奏。ララバイブラザーズのピアノララバイとして、「三枚目のダイアローグ」(GOK RECORD)など、これまで3枚のアルバムCDリリースがある。
Twitter: @piano_lullaby
Facebook: http://facebook.com/pianolullaby
Homepage: http://www.glocom.ac.jp/researchfellows/takafumi_nakanishi

LINEで送る
Pocket

down

コメントする




CAPTCHA


06_統計

ビッグデータ活用 ご相談ください
はじめての機械学習
IoT 企画・活用講座

Google + ページ

ビッグデータ活用 ビッグデータマガジン

連携サイト

ビッグデータ活用 ビッグデータマガジン
 
ビッグデータ活用 ビッグデータマガジン

お問い合わせ

  • 記事に関するお問合せ、
    ビッグデータにまつわるお悩みやご相談等
    お気軽にお問い合わせください

    【お問合せフォームへ】
  •