28.04.2020 by Milena Riedl

من البيانات الضخمة إلى البيانات الذكية

في المقال الأول من سلسلة البيانات الضخمة، قدمنا لكم في المقال الأول من سلسلة البيانات الضخمة نظرة أولية على مصطلح البيانات الضخمة وأشرنا إلى الفوائد التي يمكن أن تتحقق من معالجة البيانات للإنتاج وخاصةً للتحليل الحراري. في هذا المقال التالي، نود في هذا المقال التالي تقديم مصطلح علم البيانات بمزيد من التفصيل وعرض بعض أساليبه الشائعة.

بقلم ميكايلا لانج وجيغياسا ساخوجا، عالما البيانات في شركة NETZSCH للتحليل والاختبار

تعريف علم البيانات

كما يصف مصطلح علم البيانات بالفعل، فهو العلم الذي يتعامل مع استخراج المعلومات القيمة من البيانات. والهدف من ذلك هو استخدام هذه المعلومات لتحسين عملية معينة من حيث الجودة والكفاءة، أو حتى اكتساب رؤى جديدة منها. بمساعدة علم البيانات، من الممكن الكشف عن الارتباطات التي لا يمكن التعرف عليها بسهولة. يضم مجال علم البيانات العديد من مجالات الخبرة المختلفة. وإلى جانب الرياضيات/الإحصاء وعلوم الكمبيوتر، تلعب المعرفة المتخصصة دورًا مهمًا للغاية. خاصةً في التحليل الحراري، من الضروري فهم العمليات الكيميائية والفيزيائية وتفسيرها بشكل صحيح من أجل عدم استخلاص استنتاجات خاطئة من مجموعات البيانات المقاسة واستخدام الطرق الصحيحة للتحليل.

وتتوفر في شركة NETZSCH للتح ليل والاختبار جميع مجالات الخبرة اللازمة، بحيث يمكن لشركة NETZSCH للتحليل والاختبار بهذه الميزة تطبيق أساليب علم البيانات في مجال التحليل الحراري.

في القسم التالي، نود أن نقدم بعض طرق تحليل البيانات المستخدمة في علم البيانات.

تقنيات تحليل البيانات

مع وجود كمية كبيرة من البيانات النوعية، يمكن لعالم البيانات أن يبدأ المهمة الرئيسية - تحويل مجموعة البيانات إلى معلومات قيّمة. بعد المعالجة المسبقة للبيانات، يمكن البدء في تحليل البيانات. فيما يلي وصف لكيفية التعامل مع هذا التحدي.

استكشاف البيانات

مع استكشاف البيانات، الهدف هو فهم البيانات بطريقة أساسية. يجب تحديد بنية البيانات وفحص توزيع القيم. من خلال استكشاف البيانات، نرى أولاً الارتباطات بين البيانات، ويمكّننا ذلك من معرفة الطريقة الأفضل لتطبيقها في التحليل.

التحليل التنبؤي

وهي مجموعة فرعية من ذكاء الأعمال وتحليلات الأعمال. أثناء التحليل التنبؤي، يتم تقييم مجموعات البيانات بحثًا عن الأنماط لتكون قادرة على التنبؤ بالاتجاهات والمخرجات المستقبلية. يمكن استخدام عدة طرق للتحليل التنبؤي. في ما يلي، نود أن نقدم لمحة موجزة عن بعض هذه التطبيقات:

  • التعلم الآلي:

هو تطبيق للذكاء الاصطناعي، والذي يمكّن النظام من اكتساب المعرفة تلقائيًا وتحسين نفسه من التجربة بمرور الوقت دون أن تتم برمجته يدويًا.

تكتسب أساليب التعلم الآلي المعلومات من البيانات الموجودة من خلال استخراج الأنماط في مجموعات البيانات الكبيرة. بشكل عام، يتم التعرف على التبعيات وتعلمها من قبل النظام، الذي يسمى نموذج التعلم الآلي، بحيث يمكن إجراء تنبؤات حول الأحداث أو النتائج المستقبلية بواسطة النموذج حتى مع وجود بيانات جديدة غير معروفة.

  • الانحدار الخطي/غير الخطي:

الانحدار الخطي هو أحد أقوى الخوارزميات الأساسية للتحليل التنبؤي. ويتمثل هدفه الرئيسي في التنبؤ بالمتغيرات، أي المتغير المستهدف الذي يعتمد على متغير مستقل واحد أو أكثر. باستخدام الانحدار الخطي، من الممكن تحديد علاقة خطية بين المتغير المستهدف ومتغير تنبؤي واحد أو أكثر مع مجموعات البيانات الموجودة بحيث يمكن إنشاء دالة خطية لوصف التبعية.

في المقابل، في الانحدار غير الخطي يتم تحديد دالة غير خطية لشرح العلاقة بين المتغيرات.

وبفضل المعلومات حول العلاقة المعروفة، يسهل إجراء تنبؤات باستخدام البيانات الجديدة.

  • التصنيف:

يتضمن التصنيف تعيين البيانات إلى فئة محددة. وهي طريقة كلاسيكية للتعلم الآلي. تم تعلم معايير ونمط تعيين البيانات إلى فئة معينة من البيانات الفئوية الموجودة ويمكن تطبيقها الآن لتصنيف البيانات الجديدة بشكل صحيح.

  • التصنيف الخطي/غير الخطي:

يُستخدم التصنيف الخطي عندما تتعامل مع عدد كبير من الميزات، بينما يُستخدم المصنف غير الخطي عندما لا تكون البيانات قابلة للفصل الخطي.

  • الانحدار اللوجستي:

وهي تقنية تصنيف تُستخدم للتنبؤ باحتمالية انتماء ملاحظة جديدة إلى فئة معينة. بعض الأمثلة على ذلك هي البريد الإلكتروني غير المرغوب فيه، والكشف عن الاحتيال، وعمليات الاحتيال في المعاملات عبر الإنترنت، وما إلى ذلك.

التحليل الإرشادي

يتمثل مجال التركيز الرئيسي في إيجاد أفضل الحلول لسيناريو البيانات الحالي. بالإضافة إلى التحليل التنبؤي، يقدم التحليل التوجيهي توصيات حول كيفية استخدام المعلومات المتوقعة للتأثير على المستقبل. والهدف من ذلك هو استخدام معلومات التنبؤ لتحليل القرارات التي يجب اتخاذها للحصول على النتيجة المتوقعة أو لمنعها.

أفضل شرط أساسي لتحليل البيانات بشكل جيد هو التبادل الوثيق لعلماء البيانات مع القسم المتخصص الذي تأتي منه البيانات المراد تحليلها. وبفضل سنوات من الخبرة والمعرفة في مجال التحليل الحراري، يمكن لـ NETZSCH تطبيق أساليب علم البيانات في مجال خبرتها.

معاينة

في المقال التالي، نود أن نقدم لك في المقال التالي تعريفك بعالم التعلم الآلي والذكاء الاصطناعي. نريد أن نوضح لك الأساسيات المتعلقة به ونقدم لك عينة من أساليب التعلم الآلي.

لذا، ترقبوا مقالنا التالي من سلسلة البيانات الضخمة!

المراجع