BraidDBは大規模データを高速に分散処理できますが、それだけではありません。BraidDBの真の価値はあらゆる要求性能に極限までフィットできる柔軟性にあり、この柔軟性を最大限に活かせば次の特徴を持つ分野にも適用できます。
- (A) 大規模なデータ処理
- (B) 複雑なデータ処理
- (C) 様々な形式のデータ処理
- (D) 即応しなければならないデータ処理
- (E) 様々なスペック環境でのデータ処理
以降では、どんな分野に適用するとよいかをより具体的に説明します。
データウェアハウス・データマイニング
この分野はBraidDBが最も得意とする分野の1つです。とにかく大量のデータを蓄積できること(A)と、それを高速に分析できること(D)が求められます。場合によっては、複雑な分析をすること(B)や、様々な形式のデータを入出力すること(C)が求められます。
- 全国各地の販売店から収集した販売履歴を集計し、販売計画を立てる。
- 半導体工場全体の製造装置・搬送装置から収集した製造履歴・搬送履歴を集計し、プロセスを再設計する。
- 全国各地の携帯電話基地局から収集した通信履歴を集計し、設備投資を計画する。
- 学内行動履歴から人間関係を推定し、孤立した学生をケアする。
- 症例と処方の効果から因果関係を推定し、未知の症例を予測する。
- 分子・遺伝子・タンパク質などの構造を解析し、未知の構造の物質の特徴を予測する。
レガシーシステム統合
この分野はBraidDBが最も得意とする分野の1つです。とにかく様々な形式のデータを入出力すること(C)が求められます。多くの場合、複雑なデータを高速に変換できること(B)(D)が求められます。
- 複数のERPを統合する。
- 複数の生産システムを連結する。
- 複数の会社間で生産システム記録を交換する。
組込処理
この分野はとにかく限られたリソースでデータを処理すること(E)が求められます。場合によっては、高速に処理すること(D)や、様々な形式のデータを入出力すること(C)が求められます。
- 工作機械のセンサー情報を集計し、自動チューニングする。
- 携帯電話アプリケーションのデータを格納する。
ファイル処理
この分野は様々な形式のデータを入出力すること(C)が求められます。場合によっては、高速に処理すること(D)や、様々なCPUアーキテクチャ上(E)で処理することが求められます。
- ローカルの音声・動画のメタ情報を検索・編集する。
- Webから株価情報を取り込みCSVファイル化し、それを分析し株価を予測する。
関係データベースの方が適している分野
BraidDBと関係データベースはどちらもスキーマが与えられたデータを扱うのに適している点で同じですが、2つの大きな違いがあります。
1つ目の大きな違いはデータ構造です。BraidDBはツリー構造のデータを直接扱えますが、関係データベースではかなり工夫をしないと扱えません。そのため、関係データベースでは複雑なデータを扱うデータウェアハウス・データマイニング・レガシーシステム統合には適していません。
2つ目の大きな違いはトランザクションの有無です。あらゆる性能要求に柔軟に対応できることを優先しているBraidDBはスケーラビリティに悪影響を与えるトランザクションを標準ではサポートしていません(現状ではトランザクションをアプリケーションが作り込むことにしています)。それに対して、データの一貫性を重んじる関係データベースは標準でトランザクションをサポートしています。このことから、データの一貫性に関する複雑な排他やロールバックが必要な次のような分野には関係データベースの方が適しています。
- 工場内搬送システム
- 生産システム
- 在庫管理システム
Hadoopの方が適している分野
BraidDBとHadoopはどちらも大規模データの処理に適しているという点で同じですが、適しているデータ処理に違いがあります。大まかに言えば、BraidDBはスキーマが与えられたデータを大量に扱うのに適していて、Hadoopは単なるテキストデータやバイナリデータを大量に扱うのに適しています。BraidDBはデータ間の関係を扱うことにも適していますが、Hadoopはそうではありません。BraidDBは即応性が高いですが、Hadoopはそうではありません。これらの違いから分かるように、Hadoopはデータウェアハウス・データマイニング・レガシーシステム統合などには全く適していません。しかし、次のような分野にはBraidDBよりも適しています。
- 大量のテキストからの索引抽出
- 大量の画像からの特徴点抽出
- 大量のExcelファイルをPDFファイルへ変換
他のデータベースとの比較
項目 | Relational DB Oracle, MySQL, DB2, etc. |
In-Memory DB solidDB, MySQL, H2, etc. |
KeyValue DB memcached, Tokyo Cabinet, Amazon S3, etc |
BraidDB |
---|---|---|---|---|
トランザクション | あり | あり | なし | なし |
範囲絞り込み(Range Query) | あり | あり | なし | あり |
結合(Join) | あり | あり | Key結合のみ | あり |
クエリ言語 | SQL | SQL | なし | Braid言語 |
単体性能 | 中 | 高 | 高 | 高 |
分散オーバヘッド | 大 | 大 | 小 | 小 |
多態性 | なし | なし | あり | あり |
カスタマイズ性 | 低 | 低 | 低 | 高 |
効率的データ量 | ~テラバイトオーダ | ~ギガバイトオーダ | ~ペタバイトオーダ | ~ペタバイトオーダ |
0件のコメント