「Prepper(プレッパー)」が実現する未来のデータ分析とは?データサイエンティストの可能性が、拡張される未来の話。
1974年にピーター・ナウアが使用したことで注目を集めたといわれる「データ分析」。著書『Concise Survey of Computer Methods』において、ナウアはデータ処理手法とその応用を述べる中でデータサイエンスという用語を用いていました。
80年代に入り、言葉の定義が明確化され、研究により新たな手法が開発されるようになっていき、現在では、データサイエンティストという仕事が生まれているのと同時に細分化もされていますーーーーそんなデータサイエンスは、今後どのように発達し、どのように進化していくのでしょうか?
今回は、データ分析者の後方支援専門サービス「Prepper(プレッパー)」を提供する株式会社 truestarの藤氏にお話を伺いました。本取材では、データプレップと呼ばれる分析の下準備からの解放を可能にする、サービスの魅力、そしてデータ分析の未来を支える可能性について垣間見ることができましたーーーー
2015年truestar activation株式会社(現truestar)を設立。
著書(共著)『データビジュアライゼーションの教科書』(2019年/秀和システム)
『Prepper』とは?データプレップをアップデートするデータ分析者の強い味方
―――本日は株式会社truestarの代表取締役社長である藤俊久仁さんにお話を伺っていきます。まずは株式会社truestarがどのような会社なのか教えてください。
株式会社truestarは、truestar hd株式会社の子会社です。株式会社truestarとしては2022年10月で9期目を迎えます。当社は、親会社からデータアナリティクス及びデータエンジニアリング領域を事業承継しているため実質的には10年以上の実績があります(TSHDは2022年10月で15期目)。当社の得意領域は、データ可視化やデータ分析に関わるコンサルティングと実装です。特にBIツールのTableauに関しては約10年の実績がありますね。
―――そんな株式会社truestarにて現在力を入れているサービスのひとつがデータ分析者後方支援専門サービス『Prepper』と伺いました。どのようなサービスか教えてください。
データ分析者の後方支援専門サービス『Prepper(プレッパー)』は、サービス名の通りデータ分析の前段階で発生するデータプレパレーション領域を専門とした新しいサービスです。データプレパレーションとは、データの探索や収集、加工、集計といった工程です。データ分析では、この分析の下準備のためのデータ抽出や加工にかかる時間が作業全体の8割を占めると言われることもあります。
定型的なデータ加工作業に対して貴重な人材の時間を費やすのは、企業にとっても大きな損失ですよね。分析者が何のストレスもなく、直ちに分析可能となる加工済みデータを供給するサービス、それが私たちの提供する『Prepper』です。
―――『Prepper』はまさにデータ分析者の最高の相棒といえますね。具体的にはどのようなサービスを提供されていますか?
『Prepper』には「Prepper Open Data Bank」と「Prepper POI(ポイ)」という2つのサービスがあります。
「Prepper Open Data Bank」は、加工済みオープンデータのクラウド共有サービスです。e-Statで公開されている国勢調査などの商用・二次利用可能なオープンデータを、データプレップ無しですぐにデータ分析ができるよう当社が抽出・加工したデータをSnowflake Marketplace上で無料共有しています。
「Prepper POI(ポイ)」は、クライアントのPOI(Point of Interests:店舗や候補地などの興味のあるポイント)に対して、データの収集、加工、集計、統合など、データ分析のための下準備作業を代行するサービスです。さまざまな業務に対応できるよう「Prepper POI(ポイ)」には、『ジオコーディング』『人口統計データセット』『気象データセット』『市区町村データセット』の4種類を用意しています。
―――『Prepper』を実際に使用された方からはどのような声をいただいていますか?
『Prepper』は業種を問わずさまざまな企業でご利用いただいています。
直近では大手コンサルティング会社のデータサイエンティストの方からご依頼があり『Prepper』のサービスをご提供致しました。
複雑な案件ではあったのですがお客様のニーズに合わせ加工、分析し2~3日でデータをお届けしたところ「すぐに使えるデータが全て揃っているところに感動しました」というお声をいただきました。
データ分析者はさまざまな案件を抱えていることが多く、腕利きであればあるほど時間がないという方が多いのです。時間のかかるデータプレップを当社が担うことで、データ分析者はより本質的な分析業務であるモデリングや仮説検証に時間をかけられるのが『Prepper』の魅力と言えるでしょう。
Prepperでデータ分析者を開放するーーー
データ分析者をデータプレップ作業から解放してくれる『Prepper』はとても素晴らしいサービスだと思いますが、そんなサービスがどのように誕生したのか経緯を教えてください。
当社でもデータ分析や可視化を行うなかで、データプレップに膨大な時間と労力をかけてきました。データ分析を行う以上、必ず必要となるデータプレップにかかる時間をどうにかならないかと課題意識をもったのが『Prepper』が誕生する最初のきっかけです。他にもデータプレップにはさまざまな課題があります。
―――具体的にはどのような課題があるのでしょうか?
まず挙げられるのは元データのわかりにくさと探しにくさです。元データは、お客様の環境の中にあることもありますし、外部から仕入れる(オープンデータから取得、データプロバイダーから購入)こともあります。お客様の環境の中に元データがある場合、手作業で生成されていて定義が不明瞭であったり、定義書が更新されていない、読み取りづらいという問題が起こりがちです。外部から仕入れる場合は、データプロバイダー毎に似たようなデータがある、オープンデータも様々な機関から公開されており、どれを使えばいいのかわからない上に検索性も低いという問題が起こります。
次に挙げられるのがデータプレップは属人化しやすいことです。データにはそれぞれに扱い方など特徴があります。いつも扱っている人や仕様書をよく読めばわかる事ではあるものの、仕様書を読みこむには非常に時間がかかります。仕様書をよく見ずに作業を進めてしまった結果、間違いやミスが発生してしまうというケースが多くあるのです。誰でもできることではあるのですが、いつもそのデータを扱っている人しかすぐに対応できないというのがデータプレップのもう一つの課題でした。
また、データプレップは地味な領域であるがゆえに、予算が立ちにくいというのも問題でしょう。非常に手間と時間がかかるプロセスではあるものの、プロジェクトオーナーやエンドユーザーからはその苦労と重要性が見えづらいのです。
「Data is the new oil」と言われ、データ分析市場は拡大の一途を辿っており、当然データプレップニーズも高まっていくでしょう。上記のようなデータ分析者の抱える課題を解決するには当社の経験と実績が活かせると考え『Prepper』というサービスが誕生しました。
目指すのは「Prepper Open Data Bank」が不要な世界
―――データプレップ領域においての社会課題はどのようなところにあるとお考えですか?
これは多くの人が誤解している部分かもしれませんが「データ分析のためのデータ、ツール、サービスを利用することで簡単にデータ分析がビジネスに成果をもたらす」という訳ではありません。データ分析はパッとできるような〝魔法の杖″ではないのです。上手くいくかどうかはやってみないとわかりません。これは成功するまで何度も試行錯誤を繰り返し、改善していくしかありません。
データ分析経験の少ない方からは「データやツールを導入しているのにいいものがでないのはどうして?」などのお声をいただくこともあります。それは当社としても苦しいところで、なるべく早く良い結果を出したいとは思っていますが確約は難しいのです。間違いなく、なにもツールがない状態よりはスムーズに分析が進むのですが、結果が出るまでの道のりは長いのです。データ分析とはどういうものなのかをより多くの人に知っていただくにはもう少し時間がかかるのかなと思っています。そのため、データプレップ領域の課題の顕在化は、このようなデータ分析に対する認識が広がり、ある程度の失敗体験も重ねた先にあるものだと思っています。
―――では『Prepper』としての課題はどのようなところにありますか?
当社はBIツールなどを提供しているためニッチな領域では知られている企業ではありますが、『Prepper』は特定の分析ツールや環境に依存しないサービスなので、非常に大きなマーケットが対象になります。しかし当社の認知度はまだ低く、コンテンツも少ないのが現状です。そこでより多くの方に知っていただきたいと始めたのが、前述の無料で利用いただける「Prepper Open Data Bank」です。まずは加工済みのオープンデータ共有サービスで、さまざまな業種の方に当社のサービスを知っていただきたいと思っています。
―――5年後、10年後、データ分析領域はどのように進化・発展していくと思われますか?
5年後には、使いやすく精製されたデータをデータマーケットで誰でも気軽に購入、利用でき、データ連携もシームレスに簡単に更新できるようにもなると思います。データ分析の民主化により、ユーザー数も増大すると予想されるので、データの価格も格段に下がっていくでしょう。
当社が提供している「Prepper Open Data Bank」は、元データがキレイに精製され共有されていれば本来は不要なサービスです。5年後には「Prepper Open Data Bank」が不要になっていて欲しいと思いますね。現実的には10年以上はかかりそうですが……。
―――今後の展望や挑戦していきたいことを教えてください。
『Prepper』としては、オープンデータの源泉でもある官公庁内のデータプレップ業務に携わってみたいという想いがあります。オープンデータの煩雑な整備から官公庁の担当者を開放し、より公益に資するデータ分析や施策立案などの領域に時間を費やせる環境を作り出したいと思っています。
当社が携わることによってオープンデータが使いやすくなれば、官も民も業務効率が上がるなど、データ分析がもたらす便益もより拡大し、日本全体のDXに貢献出来るでしょう。
―――最後にあなたにとって『Prepper』はどんな存在ですか?
少し表現は違うかもしれませんが、ロボット掃除機やドラム式の洗濯機のような存在かなと思います。それを使わなくても自分で掃除することも、洗濯ものを乾かすこともできますよね。ただ使ってみるとその便利さに感動して、使わずにはいられなくなります。データプレップ作業も同じで、頑張れば自分でもできる作業ではあるんです。ただ『Prepper』がある世界を知ってしまったら、もう無い世界には戻れない、自分が頑張るところはそこではない……そんな存在を目指しています。
なるほど!データ分析には『Prepper』が欠かせないといわれる未来が見えました。本日は貴重なお話をありがとうございました。
「株式会社 truestar」の詳細を見る
「Prepper」の詳細を見る
今回の取材で藤さんのお話を伺うまでは、私自身も「データ分析はツールを使えば結果が出せるもの」という認識をもっていました。『Prepper 』のようなツールを使いつつ、トライ&エラーを繰り返しながら改善していくことで、結果に繋がる……ロボット掃除機のように代わりに掃除をしてくれる強い味方ではあるが、ひと振りでパッとすべてが片付く〝魔法の杖″ではないことをこれからデータ分析に関わる多くの人が知っていく必要があるのでしょう。藤さんの『Prepper』への想い、そして展望から、データ分析領域において『Prepper』は間違いなく欠かせない存在になっていくだろうと確信させられました。
はい
80%
いいえ
20%
はい
80%
いいえ
20%