
28.04.2020 by Milena Riedl
ビッグデータからスマートデータへ
ビッグデータ・シリーズの第1回目では、ビッグデータという用語について初めてご理解いただき、生産現場や特に熱分析におけるデータ処理によってどのような利点が生まれるかを指摘しました。
By Michaela Lang & Jigyasa Sakhuja, データサイエンティスト atNETZSCH Analyzing & Testing
データサイエンスの定義
データサイエンスという用語がすでに説明しているように、データから価値ある情報を抽出することを扱う科学である。その目的は、この情報を使って特定のプロセスを品質と効率で改善すること、あるいはそこから新たな洞察を得ることである。データサイエンスの助けを借りれば、簡単には認識できない相関関係を明らかにすることができる。データサイエンスの領域は、数多くの異なる専門分野から構成されている。数学・統計学やコンピューターサイエンスの他に、専門的な知識が非常に重要な役割を果たします。特に熱分析では、測定されたデータセットから誤った結論を導き出さないために、化学的・物理的プロセスを正しく理解・解釈し、正しい分析手法を用いることが必要です。
NETZSCH Analyzing & Testing社では、必要な専門分野をすべて備えているため、NETZSCH Analyzing & Testing社は、熱分析の分野でデータサイエンスの手法を適用することができます。
次のセクションでは、データサイエンスで使用されるデータ分析手法をいくつか紹介します。
データ分析技術
large 、データサイエンティストは主要なタスクを開始することができます - データセットを価値ある情報に変える。データの前処理の後、データ分析を開始することができる。以下では、この課題へのアプローチ方法を説明する。
データ探索
データ探索の目的は、データを基本的に理解することである。データの構造を特定し、値の分布を調べなければならない。データ探索では、まずデータ間の相関関係を確認し、分析にどの手法を適用するのが最適かを見つけることができる。
予測分析
ビジネスインテリジェンスとビジネスアナリティクスのサブセットである。予測分析では、データセットのパターンを評価し、トレンドや将来のアウトプットを予測します。予測分析にはいくつかの方法があります。以下では、これらのアプリケーションのいくつかを簡単に紹介します:
- 機械学習:
機械学習:これは人工知能の応用であり、手動でプログラムすることなく、システムが自動的に知識を獲得し、時間の経過とともに経験から自己改善することを可能にする。
機械学習の手法は、large データセットからパターンを抽出することで、既存のデータから情報を取得する。一般的に、依存関係は機械学習モデルと呼ばれるシステムによって認識・学習され、新しい未知のデータがあっても、モデルによって将来の出来事や結果についての予測ができるようになる。
- 線形/非線形回帰:
線形回帰は、予測分析のための最も強力で基本的なアルゴリズムの1つです。その主な目的は,変数を予測すること,すなわち,1つまたは複数の独立変数に基づくターゲット変数を予測することである.線形回帰では,従属性を記述する線形関数を生成できるように,既存のデータ集合でターゲット変数と1つまたは複数の予測変数の間の線形関係を識別することができる.
対照的に,非線形回帰では,変数間の関係を説明するために非線形関数が定義される.
既知の関係性の情報があれば、新しいデータで予測を簡単に行うことができる。
- 分類:
分類は、データを特定のカテゴリーに割り当てることを含む。古典的な機械学習手法である。データを特定のカテゴリーに割り当てる基準とパターンは、既存のカテゴリー・データから学習され、新しいデータを正しく分類するために適用できる。
- 線形/非線型分類:
線形分類は、多数の特徴を扱う場合に使用され、非線型分類器は、データが線形に分離できない場合に使用される。
- ロジスティック回帰:
これは、新しいオブザベーションが特定のカテゴリに属する確率を予測するために使用される分類手法です。例としては、電子メール・スパム、詐欺検出、オンライン・トランザクション詐欺などがあります。
規定分析
主な焦点は、現在のデータシナリオに最適なソリューションを見つけることである。予測分析に加え、規定分析では、予測された情報をどのように活用し、未来に影響を与えるかについて提言する。その目的は、予測情報を使って、予測された結果を得るために、あるいはそれを防ぐために、どのような決断を下さなければならないかを分析することである。
優れたデータ分析を行うための最良の前提条件は、データサイエンティストと分析対象データの出所である専門部署との密接な交流です。熱分析における長年の経験と知識により、NETZSCH 、データサイエンスの手法をその専門分野に応用することができる。
プレビュー
次回は、機械学習と人工知能の世界を紹介したい。機械学習と人工知能の基礎と、機械学習の手法のサンプルをお見せしたいと思います。
それでは、次回のビッグデータ・シリーズにご期待ください!
参考文献
- https://www.logility.com/blog/descriptive-predictive-and-prescriptive-analytics-explained/
- https://datasolut.com/was-ist-machine-learning/
- https://entwickler.de/online/development/predictive-analytics-praxis-tipps-579847089.html
- https://medium.com/ml-research-lab/chapter-4-knowledge-from-the-data-and-data-exploration-analysis-99a72379733
- https://medium.com/ml-research-lab/chapter-4-knowledge-from-the-data-and-data-exploration-analysis-99a734792733
- https://www.researchgate.net/post/What_is_the_difference_between_linear_and_nonlinear_classification_techniques
- https://towardsdatascience.com/logistic-regression-detailed-overview-46c4da4303bc