ビッグデータ分析とは。AIとの関係性や想定される課題について
近年、デジタル技術の進歩に伴いさまざまなヒト・モノ・組織などがインターネットにつながり、膨大なデータを収集・蓄積できる環境となりました。
なかでも人間の知的活動をコンピュータによって再現するAI(人工知能)の技術は飛躍的に進化しており、あらゆる産業・生活分野でビッグデータの利活用を進める重要なカギとされています。
一方で、情報システム部門や技術部門に携わる管理者のなかには「収集したビッグデータをどのように分析するのか」「AIとビッグデータにはどのような関係性があるのか」と疑問を持つ方もいるのではないでしょうか。
この記事では、ビッグデータ分析の概要や主な分析手法、AIとの関係性と想定される課題などについて解説します。
目次[非表示]
ビッグデータ分析とは
ビッグデータ分析とは、インターネットやデバイス、各種センサーなどから収集した複雑かつ膨大なデータを分析することです。“ビッグデータ”は、5つの特性を備えているものと定義されています。
▼ビッグデータの特性
要素 |
意味 |
1.Volume(量) |
膨大な量のデータがある |
2.Velocity(速度) |
リアルタイムでデータを収集する |
3.Variety(多様性) |
複数の形式のデータが含まれる |
4.Value(価値) |
データを活用して新たな価値を生み出す |
5.Veracity(正確性) |
正確なデータである |
産業・生活分野などでビッグデータ分析を取り入れることで、これまで見えなかった傾向・動向を可視化でき、さまざまな課題解決や戦略の策定につながると期待されています。
▼ビッグデータ分析の活用例
分野 |
活用例 |
製造業 |
工場内の設備・各種センサーからデータを収集・分析して、故障の予測や不良原因の特定を行う |
小売業 |
店舗のPOSシステムやECサイトからデータを収集・分析して、仕入れの見直しや需要予測を行う |
農業 |
畑・ビニールハウス内の各種計測器やカメラからデータを収集・分析して、自動で温湿度管理、潅水を行う |
交通 |
道路の交通量を計測するカメラからデータを収集・分析して、渋滞や事故の予測を行う |
医療 |
全国の医療機関における臨床データを蓄積・分析して、製薬会社や研究機関による新薬の開発に役立てる |
ビッグデータ分析の主な手法
ビッグデータ分析では、収集した膨大なデータのなかから傾向や関連性などを導き出します。何を把握したいかによってさまざまな分析手法があります。
▼主な手法
手法 |
概要 |
クロス集計 |
2つ以上の属性間において関係性や傾向を導き出す |
回帰分析 |
1つの要素に関連するほかの要素が、どの程度影響を与えているか相関の度合いを把握する |
アソシエーション分析 |
複数の異なる属性に対して相互の関連性を導き出す |
クラスター分析 |
複数の異なる属性に対する類似性を特定して、セグメント化する |
決定木分析 |
特定の条件に基づいて、樹木が枝分かれするようにデータを2つに分岐する行為を繰り返す |
ビッグデータ分析とAIの関係性
ビッグデータ分析を行うにあたって、AIは重要な存在といえます。
ビッグデータ分析では、前述したような数学的な手法を用いて、属性間の関係性やデータのパターンなどを分析します。しかし、異なる形式や属性が含まれる複雑なビッグデータを人間が手動で分析するには、技術面や労力面で限界があります。
AIを活用すれば、複雑かつ膨大なデータを高速で処理して、傾向・推移をより高精度で導き出すことが可能です。これにより、意思決定の精度やスピードの向上を図れるようになります。
▼AIによるビッグデータ分析で実現できること
- 大規模で多様なデータを高速で処理・分析する
- 客観的なデータに基づいた高精度の予測を行う
- リアルタイムで現状を可視化する
AIによるビッグデータ分析には課題もある
AIは、より効率的かつ高精度なビッグデータ分析を行ううえで役立ちます。しかし、一般的に使用されるAI解析ツールでは、現場で発生する複雑かつ膨大なデータを分析しても、うまく利活用に紐づけられないケースがあります。
▼製造業の予知保全による課題例
設備機器やセンサーからデータを収集して、異常を検知した際にアラートを出す仕組みを構築しているものの、「なぜ検知したのか」といったエラーの内容まで把握できない。 |
AIは、大規模なデータを学習して自身の判断で判定結果を返しますが、どのように導き出されたのか思考の筋道や根拠が見えず、ブラックボックス化してしまう問題点があります。
判定結果に至った内部のロジックが可視化されていないと、ビッグデータを活用して課題の特定や改善策につなげることが難しい場合があります。
また、AIに与えたデータセットにより、出力される結果や信頼性に大きな差が生まれることがあります。
データセットがAIの判定結果に影響を及ぼす事例は、以下のようなものです。
▼データセットに起因する不具合事例
- データの偏りによる過学習
- データ量の不足によるモデルの未学習
- データの粒度が解析対象物に見合っていない抽出漏れ
- ノイズや欠損値、不整合なデータが含まれている誤判断
現時点において、データセット作成は、解析事象を理解したユーザーが実行するデータエンジニアリングに依存している状況となっています。解析の対象や事象を鑑みて適切にデータセットを準備できない場合は、豊富なデータがノイズになることがあります。
そのため、データセットを準備する際は、不適切なものはAIの解析結果やモデリング結果に悪影響を及ぼし、改善活動への貢献が難しくなる点を認識しておくことが重要です。
アットフィールズテクノロジーが提供する解析サービスの強み
『アットフィールズテクノロジー』では、AIを使用せずにビッグデータを利活用する解析サービスを提供しています。
現場のエンジニアが統計データに対して、物理現象に基づいた必要なデータを抽出して解析を行います。出力したデータのロジックまで把握できるため、確度の高い利活用につながります。
以下では、製造業で解析サービスを活用した事例を紹介します。
事例1|品質異常の原因解析
半導体製造工程において設備データの解析システムを導入した事例です。
▼従来の製造工程
担当者が目視で設備の状況を記録しており、最終検査に到達した段階で異常の検知を行っていました。品質異常が後工程で発見されるため、ロスが増加するほか、原因の解析にも時間を要していました。
▼解析システムの導入による製造工程
解析システムを導入して、複数の設備から500項目のパラメータを収集・一元管理できる仕組みを構築しました。担当者による目視確認が不要になったほか、リアルタイムで異常の検知を行うことでロスの削減を実現しました。
また、単なるシステムとしての仕組みを提供するだけではなく、ユーザーである技術者と協議を重ね、物理モデルに照らし合わせ利活用するデータの選定、データセットの構築を行っています。
さらに、システム内のデータベースを利用して迅速に原因解析を行えるようになり、技術者による解析時間の短縮につながっています。
事例2|予知保全と異常判断の形式知化
データの監視と分析によって予知保全を実現した事例です。
▼従来のメンテナンス
これまで保全担当者の知見に基づいてメンテナンスを行っており、業務が暗黙知に依存している状態でした。また、過剰なパーツ交換により、メンテナンスコストの負担も招いていました。
▼データを活用したメンテナンス
設備機器のパーツから抵抗・電流・電圧データを収集して、劣化具合を示すパラメータを特定・監視できる仕組みを構築しました。
この際、設備仕様やプロセス条件を技術者と協議を行い、データの項目や粒度など利活用に向けたデータセットを構築しています。
適切にインプットされているデータを用いた予知保全によって、必要なタイミングでパーツ交換を行うことで、メンテナンスコストの削減につながりました。また、保全担当者に依存していた異常の判断を形式知化できたことで、設備機器の安定稼働を実現しています。
まとめ
この記事では、ビッグデータ分析について以下の内容を解説しました。
- ビッグデータ分析の概要
- 主な分析手法
- ビッグデータ分析とAIの関係性
- AIを用いたビッグデータ分析の課題
- アットフィールズテクノロジーの事例
ビッグデータは、製造業や農業といった産業全体に加えて、交通、医療サービスなどの生活分野に至るまで幅広い利活用が期待されています。AIの活用により、複雑で多様なビッグデータをスピーディかつ高精度で分析することが可能です。
ただし、AIによるビッグデータ分析では、判定結果に至った内部のロジックまで把握できないため、高度な利活用につなげられない場合があります。
『アットフィールズテクノロジー』の解析サービスでは、AIを使用せずに、現場を熟知したエンジニアが階層化したデータを掘り下げいく“ドリルダウン形式”による解析を行います。AIでは難しかった内部のロジックを可視化できるため、不良要因の解明や戦略的な改善策につなげられます。
詳しくは、こちらをご確認ください。