ماذا يعني التنقيب في البيانات؟
التنقيب في البيانات Data Mining هو عملية تحليل الأنماط الخفية للبيانات وفقًا لوجهات نظر مختلفة من أجل تحويل تلك البيانات إلى معلومات مفيدة وقابلة للتنفيذ في كثير من الأحيان. يتم جمع البيانات وتجميعها في مناطق مشتركة، مثل مستودعات البيانات، وتبحث خوارزميات التنقيب عن البيانات عن الأنماط التي يمكن للشركات استخدامها لاتخاذ قرارات أفضل، مثل القرارات التي تساعد على خفض التكاليف أو زيادة الإيرادات أو خدمة العملاء أو العملاء بشكل أفضل.
يُعرف التنقيب في البيانات أيضًا باسم اكتشاف البيانات أو اكتشاف المعرفة. وهو أمر بالغ الأهمية في مجال ذكاء الأعمال لإنشاء قرارات تعتمد على البيانات.
شرح Techopedia للتنقيب في البيانات
الخطوات الرئيسية المتضمنة في عملية التنقيب عن البيانات هي:
- استخراج البيانات وتحويلها وتحميلها إلى مستودع بيانات
- تخزين البيانات وإدارتها في قواعد بيانات متعددة الأبعاد
- توفير إمكانية الوصول إلى البيانات لمحللي الأعمال باستخدام برامج التطبيقات
- تقديم البيانات المحللة في أشكال سهلة الفهم، مثل الرسوم البيانية
تتمثل الخطوة الأولى في التنقيب عن البيانات في جمع البيانات ذات الصلة المهمة للأعمال. بيانات الشركة إما أن تكون بيانات معاملات أو غير تشغيلية أو بيانات وصفية. تتعامل بيانات المعاملات مع العمليات اليومية مثل المبيعات والمخزون والتكلفة. عادةً ما تكون البيانات غير التشغيلية متوقعة بينما تهتم البيانات الوصفية بالتصميم المنطقي لقاعدة البيانات. غالبًا ما يمكن للأنماط والعلاقات بين عناصر البيانات تقديم معلومات ذات صلة لتحسين العمليات التجارية. تتعامل المؤسسات ذات التركيز القوي على المستهلكين مع تقنيات التنقيب عن البيانات التي توفر صورًا واضحة للمنتجات المباعة والأسعار والمنافسة والتركيبة السكانية للعملاء.
على سبيل المثال، تنقل شركة وول مارت العملاقة للبيع بالتجزئة جميع معلوماتها ذات الصلة إلى مستودع بيانات يحتوي على تيرابايت من البيانات. ويمكن للموردين الوصول إلى هذه البيانات بسهولة، مما يمكنهم من تحديد أنماط شراء العملاء. ويمكنهم توليد أنماط عن عادات التسوق، والأيام الأكثر تسوقًا، والمنتجات الأكثر طلبًا وغيرها من الأفكار باستخدام تقنيات التنقيب في البيانات.
تتمثل الخطوة الثانية في التنقيب عن البيانات في اختيار خوارزمية مناسبة – آلية تنتج نموذجًا للتنقيب عن البيانات. ينطوي العمل العام للخوارزمية على تحديد الاتجاهات في مجموعة من البيانات واستخدام المخرجات لتحديد المعلمات. الخوارزميات الأكثر شيوعًا المستخدمة في التنقيب عن البيانات هي خوارزميات التصنيف وخوارزميات الانحدار، والتي تُستخدم لتحديد العلاقات بين عناصر البيانات. يدمج بائعو قواعد البيانات الرئيسيون مثل Oracle و SQL خوارزميات التنقيب عن البيانات، مثل التجميع وأشجار الانحدار، لتلبية الطلب على التنقيب عن البيانات.