アナリティクスプラットフォーム

OmniSci 活用ブログ

2020.04.02公開

2019年 OmniSciカンファレンスでの発表事例

OmniSciどう活用するか?:先進事例紹介

OmniSciはGPUのマルチコアによる並列処理の加速性能を最大限に活用した高速処理データベースとして業界をリードしています。ここではその先進事例のご紹介を現地にて肌で感じたレポートを通して、業界の課題とその解決にOmniSciがどのように貢献しているかをご紹介したいと思います。
(記:エンタープライズ営業部ソフトウェアソリューショングループ 鈴木信雄)

GTC 2019でのOmniSci紹介

GTC 2019で、NVIDIA CEOのジェン・スン・フアンのキーノートスピーチの中でOmniSciが紹介されています。全米のモバイルネットワークに関する、25万のアクセスポイントに関する5億行のレコードの検索、表示の処理をGPUデータベースでリアルタイム処理をライブデモで見せました。

そこでは単に過去データを高速に処理するだけでなく、NVIDIAの提供するデータサイエンス処理ワークフローをGPU上で稼働させるRAPIDSを利用することで、AIによる将来予知にもパワーを発揮させる可能性を持つとも紹介されました。

NVIDIA GTC 2019 Keynote | OmniSci Demo (recap)

OmniSci/Converge紹介

それでは、OmniSciのユーザーカンファレンスであるConvergeのご紹介です。開催は2019年10月21-24日の4日間、経営視点での価値紹介をはじめその大半は既存ユーザーの事例とユーザーケースの紹介で、全体の3分の2程度、残りがテクニカルセッションでした。OmniSci/Convergeは年に1回(とはいえ、今回が初めての開催でしたが)のユーザーカンファレンス。初回開催ということで、まだ米国国内からの参加が多く、欧州からも事例ユーザーの参加がありました。

OmniSci/Converge紹介

ご覧の通り、データベースという機能特性上、特に業界の縛りがあるわけではありません。いかにビッグデータで価値を見つけようとしているかが重要です。それでも現状一番適用事例が増えているのはテレコム業界だそうです。要因は扱われるデータ量の大きさと日々増加しているそのスピードが影響しているようです。また、データの時代と言われるゆえんですが、テレコム関係のデータ収集しビッグデータサービス展開をしている会社が存在していることも大きいと思われます。テレコム関連のモバイルアクセスデータがキャリア独占でなく、第三者の会社が独自に収集、分析を行い、ビジネスモデルを組み立てているのも日本と異なる状況です。

また、ここ2、3年はテレコム業界の会社メインに共同でシステム構築を行って、業界知識を積んできたきたという事情もあります。

キーノート

Todd Mostak CEOによるキーノートスピーチ。

OmniSci Keynote: The Future of Accelerated Analytics & Data Science

要旨は、OmniSciは2012年にMapDとしてスタートして、2019年はOmniSci5.0の発表となります。その製品拡張に多大な貢献をしたのはVERIZON、SKYHOOK Wireless(位置情報データソリューション)、Charter Communications(テレコム)など、テレコム分野から多くの参加を得ています。

OmniSciのSWスタック構成は、OmniSciDB(データ処理コア)、Render(データの見える化)、Immerse(全てのデータ処理表示の統合)で構成されており、これらで高速化されたデータサービスの基盤を提供してきましたが、さらなる拡張を目指して、新バージョンOmniSci5.0を発表しました。

OmniSci5.0の特徴

  1. リッチでビジュアルなデータ融合環境の提供を意図した、各種データカタログの提供、コホートアナリティクス基盤の強化、外部データとのインターフェースの拡充がなされています。
  2. データサイエンス処理を加速するために機械学習との融合をするための、プログラミング環境との融合、PyDataスタックとの統合、最適化されたApache Arrow統合などがなされています。
  3. スケーラブルなパフォーマンス向上のためにSQL結果サイズの縮小、バンプアロケーションなどの実装、ImmerseとOmniSciDB間のデータ転送速度改善などが図られています。

天空に浮かぶ銀河系をリアルタイムに検索し、結果をグラフィック表示

業界事例の前に、欧州での電波望遠鏡による太陽系銀河のデータのOmniSciによるビジュアライズ、分析の事例紹介です。

欧州で2013年にスタートしたGAIAプロジェクトは、銀河系の3Dマップ作成に挑戦しています。ESA(European Space Agency)の人工衛星が銀河を観測しデータ収集収集を行い、そのデータを一般に公開しています。星の数にて17億の星団データを(そのうち13億が位置、距離、速度情報で構成され、77百万がそれに加え半径、温度など)ビジュアライズおよび分析する機能を提供しています。

天空に浮かぶ銀河系をリアルタイムに検索し、結果をグラフィック表示

単純に位置データだけを対象に分析するのではなく、半径や温度などから惑星の種類の判定が行えたり、位置情報と速度情報で属する星雲の判定をしたり、明るさでガスや塵の判定に使えるそうです。

それらをダッシュボード上で検索基準を対話的に変更し、その結果がリアルタイムにグラフィック表示されるのは、この研究にとって画期的な意味を持つそうです。

The Galaxy in a Dashboard: Visualizing the Milky Way using OmniSci

テレコム業界での活用事例

もともとテレコム業界との連携で機能強化・拡充を行ってきた関係で、この分野での利用が一番進んでいる印象です。

テレコム業界の代表としてOmniSci活用をこの2、3年探ってきたアメリカのベライゾンとカナダのテラス(TELUS)2社のデータサイエンティストがパネラーとして登壇。

ベライゾンワイヤレス:ネットワーク信頼性を通して会社の評価向上に貢献

ベライゾンは色々な形態の通信サービスの品質改善に2年前からOmniSciに取り組み始めました。10年前からのデータを対象に分析しており、それ以降もデータ量は指数関数的に増加しています。

従来は欲しい分析情報をデータ分析部署に依頼すると、結果の入手まで2、3時間要していたが、現在はほぼリアルタイムに結果を出せるようになったそうです。

ベライゾンワイヤレス:ネットワーク信頼性を通して会社の評価向上に貢献

TELUS社:異なる事業分野の情報を見える化し、投資計画作成を支援

TELUS社は高速インターネット回線、固定回線、モバイル通信の3種類のサービスを提供しているカナダの会社です。この会社ではマーケットの大きさを計測・評価するツールとしての活用。

3つの異なるビジネスを支えるシステムは、各ビジネスの歴史的な経緯より、それぞれ独立して構築されたため、お互いのデータ統合はあまりなされていません。

それぞれのデータ量、レイヤー数、都市名のフォーマットも違なり、それらの情報を串刺しにして見える化するには、同じ地図上にそれらをマップして分析する手法が有効だそうです。3つの異なるビジネス領域の情報を地図上にリアルタイムにまとめるOmniSci/Immerse機能が非常に有効で、従来のツールは全体の見える化が処理パフォーマンス不足でできませんでした。まさに、クエリー処理とマップとしての描画処理がトータルに高速化されているOmniSciならではのメリットです。

経営的な視点からすると、異なる事業分野の情報が串刺しで見られることで、投資計画作成に非常に有用だということです。

従来はBIツールのT社のシステムを利用しているとのこと。機能は確かに優れるが、利用はそれほど簡単ではないという評価です。

OmniSciのImmerse機能は直感的で優れており、データサイロで問題を抱えている顧客には有用です。

TELUS:異なる事業分野の情報を見える化し、投資計画作成を支援

Interactive Telco Market Sizing and Visualization Across Layers of Disparate Data

TUTELA社:モバイル通信のパフォーマンスデータを収集しビジネス展開

TUTELA社は全米各地のモバイル通信用のアンテナでの通信品質データを収集して、通信業社にそのビッグデータをもとに分析サービスを提供している会社です。

最初は通信品質情報(Upload/Download/Latency)を現地で計測・収集していたものを、最近ではSDKをモバイルアプリ開発会社に公開して、そこから匿名化したアクセスデータを収集しているとのことです。この会社ではOmniSciのOEM提供を受けて、自社でエンドユーザー向けのデータ分析サービスを提供しています。具体的には、その使いやすさもあり、エンドユーザーに対してダッシュボードをエンドユーザー自身で作成することに対応して、その部分に対して顧客サポートを充実させています。

モバイル通信のパフォーマンスデータを収集しビジネス展開するTUTELA社

OmniSci: Accelerated Analytics for Telecommunications Data

自動車・運輸業界

この分野で一番の注目はテレマティクス分野です。

現在でも自動車、トラック、船舶の運行データは日々生成され、さらにIoTデバイスの登場でデータは爆発的な増加を見せています。そのデータをリアルタイムで分析し、経営にいかに役立てるかは業界共通の課題です。

ひとつの事例が、BMWが自社の車に搭載されているConnected Driveの機能から収集されるデータを有効活用し、顧客満足を高める取り組みを行っています。ひとつの特徴的な使用方法がBMWの電気自動車に搭載されている豊富なセンサーから集められるデータを利用し、駐車場の中での自動運転実現を目指しているテレマティクス事例の紹介があります。

How BMW Group Visualizes & Interacts with Extreme Data Sets with Near Zero Latency

不動産情報の見える化

ロサンゼルスのGIS情報の活用、商用不動産の分析に用いた事例です。

MAPDの2017年、旧名称のMapD時代からのユーザーで、この機能に要求されるのはデータ統合とスピード、そして処理能力でした。

対象地区にある建物のポリゴンデータと多様なソースデータの持つ、10種類の属性情報から対象情報を絞り込み必要なものだけを地図表示と属性ごとのグラフ表示を、要求されるパフォーマンスで実行しなければ、リアルタイムに情報が確認したいお客様の要求に応えられません。

気象データや災害情報のリアルタイム分析による防災活動への適用

森林火災や洪水などの自然災害にリアルタイムのデータ解析を反映する試みで、データサイズの大きさ、リアルタイム処理の重要性、地図情報との親和性からOmniSci適用の重要領域になります。

Leveraging OmniSci to Deliver Real Time Analysis for Large Scale Disaster Response

降雨情報のリアルタイム分析で洪水が発生するリスクを分析する事例

NOAA アメリカ海洋大気庁のデータを使って、洪水予測など行っている(Stormsense

生データは大きすぎ、機能向上とともに従来処理では扱いが困難になってきていることの解決策として取り組みを行っています。

Data Deluge: Utilizing NOAA and StormSense Data for Monitoring Hurricane Flood Risk

データサイエンス・AI分析のインフラとしての活用

NVIDIAパートナーとして、同社のGPU上での稼働に最適化されているOmniSciは、AI分析のためのツールとしての機能も備えています。

AIや機械学習などデータサイエンス分野でのビッグデータの扱いを前提として、NVIDIA提唱のデータサイエンスワークフローでGPUを活用して、処理を高速化するためのRAPIDSに対応しています。

RAPIDSによるデータサイエンスワークフローの高速化

RAPIDS: The Platform Inside and Out

また、OmniSciをコアにして、周辺のシステムとの連携を取るには各種Open Sourceシステムとの連携が重要です。データサイエンス関連のOpen SourceシステムとのI/Fも用意しています。

データ処理ツールの次世代プラットフォームであるApache Arrowの採用にも積極的に取り組んでいます。

ARROWの開発を主導している非営利組織のリーダーの講演で、データを処理から独立させることがキーとのこと。Arrowの利用の成功例が、RAPIDSやOmniSciに見ることができるそうです。

データ移動の新たな標準として、JDBC/ODBCを置き換えることが目標です。

OmniSci Keynote: Apache Arrow: Leveling Up the Data Science Stack

リアルタイム処理に関して重要なのが、データをストリーミングにも対応することでもあります。以下のセッションでは、実際にライブデモでデータをOmniSciにストリーミングして分析する手法の紹介がありました。

End-To-End Analytics Made Easy: BI Workflows with OmniSci

製品ロードマップ

キーノートセッションでの製品戦略の話題です。データサイエンスワークフローには必要なデータを以下に容易に手当てするか重要ですが、OmniSciでは一般に公開されているオープンソースデータを可能な限りすぐに使えるライブラリとしてデータカタログを用意してゆきます。

もう一つの大きな方向性がCPUベースのラップトップPCでも動かせて誰でもが利用できるシステムを目指すとのこと。そのために新たにインテルとのパートナーシップも発表されています。これに関しても継続的にウォッチしてゆきます。

また、OmniSciを多くの業界、プロジェクトで広めるために、先進的な取り組みに対してライセンスの無償提供を行い、共同でプロジェクトを推進するプログラムの紹介や、OmniSciのデータサイエンスプラットフォームをお客様が自社でのサービス展開を行うためのOmniSci OEMプログラムも用意されています。

OmniSci Keynote: OmniSci's Roadmap & Thriving in a Data-Driven World

最後に

これ以外でも、医療など含めてここでは紹介しきれていない分野でのユースケースの紹介がされています。

また、改めてご紹介します。

※ 記載された製品名、社名等は各社の商標または登録商標です。

※ 仕様、外観など改良のため、予告なく変更する場合があります。

※ 製品に付属・対応する各種ソフトウェアがある場合、予告なく提供を終了することがあります。提供が終了された各種ソフトウェアについての問い合わせにはお応えできない場合がありますので予めご了承ください。

●OmniSci社 概要
「GPUカードの大規模な並列処理を使用してクエリを高速化する独自のクエリエンジンを作成したらどうなるか」という考えからOmniSciソフトウェアの原型が誕生し、その研究はMITのコンピューターサイエンスおよび人工知能研究所(CSAIL)で、設立者で現CEOのTodd Mostakに引き継がれOmniSciは誕生しました。GPUの利用は検索結果の高速グラフィック表示にも適用されています。従来のCPUベースのアーキテクチャでは処理しきれない巨大化するビッグデータ処理を様々な業界で実現しています。
メーカーウェブサイト:https://www.omnisci.com/

関連製品のご紹介

関連製品の一覧を見る

製品に関するご質問や納期のご確認、お見積り依頼など、お気軽にお問い合わせください

ご購入前のお問い合わせお問い合わせ一覧を見る