ما هي بالضبط "البيانات الكبيرة"؟

ولماذا هو صفقة كبيرة؟

"البيانات الضخمة" هي علم جديد من الفهم والتنبؤ السلوك البشري من خلال دراسة كميات كبيرة من البيانات غير المهيكلة. تُعرف البيانات الكبيرة أيضًا باسم "التحليلات التنبؤية".

إن تحليل مشاركات Twitter ، و Facebook feeds ، و eBay searches ، و GPS trackers ، و ATM machines هي بعض الأمثلة الكبيرة على البيانات. إن دراسة مقاطع الفيديو الأمنية ، وبيانات حركة المرور ، وأنماط الطقس ، ووصول الرحلات ، وسجلات برج الهاتف الخلوي ، وأجهزة تعقب معدل ضربات القلب هي أشكال أخرى. البيانات الضخمة هي عبارة عن علم جديد فوضوي يتغير أسبوعيًا ، ولا يفهمه سوى عدد قليل من الخبراء.

ما هي بعض الأمثلة على البيانات الكبيرة في الحياة العادية؟

لقطة شاشة http://project.wnyc.org/transit-time

في حين أن معظم مشاريع البيانات الضخمة غامضة للغاية ، هناك أمثلة ناجحة من البيانات الضخمة التي تؤثر على الحياة اليومية للأفراد والشركات والحكومات:

التنبؤ بفيروسات الفيروسات: من خلال دراسة البيانات الاجتماعية والسياسية وبيانات الطقس والمناخ وبيانات المستشفيات / الإكلينيكي ، يتنبأ هؤلاء العلماء الآن بظهور حمى الضنك مع إشعار مسبق قبل 4 أسابيع.

مشاهدة جرائم القتل: ملامح مشروع البيانات الضخمة هذه تقتل الضحايا والمشتبه فيهم والمجرمين في واشنطن العاصمة. كلاهما كطريقة لتكريم المتوفى وكمصدر وعي للناس ، فإن مشروع البيانات الضخم هذا رائع.

تخطيط السفر العابر ، NYC: دمج مبرمج WNYC الإذاعي ستيف ميلينديز جدول مترو الأنفاق عبر الإنترنت مع برنامج رحلة السفر. ويسمح تكوينه لمديري نيويورك بالنقر فوق موقعهم على الخريطة ، وسيظهر التنبؤ بوقت السفر للقطارات ومترو الأنفاق.

خفضت زيروكس من خسارتها في القوى العاملة: عمل مركز الاتصال مرهق عاطفيا. وقد درس زيروكس رقاقات البيانات بمساعدة المحترفين المحترفين ، والآن يمكنهم التنبؤ بأي من مراكز خدمة الاتصال من المرجح أن تبقى مع الشركة الأطول.

دعم مكافحة الإرهاب: من خلال دراسة وسائل الإعلام الاجتماعية والسجلات المالية وحجوزات الطيران والبيانات الأمنية ، يمكن لتطبيق القانون التنبؤ وتحديد مواقع الإرهابيين المشتبه بهم قبل قيامهم بأعمالهم الشريرة.

ضبط التسويق بالعلامة التجارية استنادًا إلى مراجعات وسائل الإعلام الاجتماعية : يشارك الناس بأفكارهم عبر الإنترنت بصراحة وبسرعة في حانة أو مطعم أو نادي للياقة البدنية. من الممكن دراسة هذه الملايين من مشاركات وسائل الإعلام الاجتماعية وتقديم تعليقات إلى الشركة حول ما يظنه الناس حول خدماتهم.

من يستخدم بيانات كبيرة؟ ماذا تفعل به؟

تستخدم العديد من الشركات المتجانسة بيانات كبيرة لتعديل عروضها والأسعار لتحقيق أقصى قدر من رضا العملاء.

لماذا البيانات الكبيرة مثل هذه الصفقة الكبيرة؟

4 أشياء تجعل البيانات الكبيرة مهمة:

1. البيانات هائلة. لن تتناسب مع محرك أقراص صلبة واحد ، أقل بكثير من عصا USB . حجم البيانات يتجاوز بكثير ما يمكن للعقل البشري إدراكه (فكر مليارا مليار ميغا بايت ، ثم ضاعف ذلك بمليارات أكثر).

2. البيانات فوضوي وغير منظم. يعمل 50٪ إلى 80٪ من أعمال البيانات الكبيرة على تحويل وتنظيف المعلومات بحيث يمكن البحث عنها وفرزها. فقط بضعة آلاف من الخبراء على كوكبنا يعرفون تماما كيفية القيام بعملية تنظيف البيانات هذه. يحتاج هؤلاء الخبراء أيضًا إلى أدوات متخصصة جدًا ، مثل HPE و Hadoop ، لتنفيذ مهامهم. ربما في غضون عشر سنوات ، سيصبح خبراء البيانات الكبار عبارة عن عشرة سنتات ، لكنهم في الوقت الحالي نوع نادر جدًا من المحللين ولا يزال عملهم غامضًا ومملاً للغاية.

3. أصبحت البيانات سلعة ** يمكن بيعها وشراؤها. أسواق البيانات موجودة حيث يمكن للشركات والأفراد شراء تيرابايت من وسائل الإعلام الاجتماعية وغيرها من البيانات. تعتمد معظم البيانات على السحابة ، نظرًا لأنها كبيرة جدًا بحيث لا يمكن احتواءها على أي قرص صلب واحد. عادةً ما يشتمل شراء البيانات على رسم اشتراك حيث تقوم بتوصيله إلى مزرعة خادم سحابي.

** قادة أدوات البيانات الكبيرة والأفكار هم Amazon و Google و Facebook و Yahoo. ولأن هذه الشركات تخدم ملايين الأشخاص بخدماتهم عبر الإنترنت ، فمن المنطقي أنها ستكون نقطة التجميع والرؤى وراء تحليلات البيانات الضخمة.

4. احتمالات البيانات الكبيرة لا حصر لها. ربما يتنبأ الأطباء يومًا بالأزمات القلبية والسكتات الدماغية للأفراد قبل أسابيع من حدوثها. قد يتم تخفيض حوادث الطيران والسيارات عن طريق التحليلات التنبؤية لبياناتها الميكانيكية وحركة المرور وأنماط الطقس. قد يتم تحسين المواعدة عبر الإنترنت من خلال وجود تنبؤات كبيرة بالبيانات حول شخصيات متوافقة لك. قد يحصل الموسيقيون على فكرة عن التركيبة الموسيقية الأكثر إرضاءً للأذواق المتغيرة للجمهور المستهدف. قد يتمكن أخصائيو التغذية من التنبؤ بمزيج الأطعمة التي يتم شراؤها من المتجر والتي قد تؤدي إلى تفاقم أو مساعدة الحالات الطبية للشخص. تم خدش السطح فقط ، وتحدث الاكتشافات في البيانات الكبيرة كل أسبوع.

البيانات الكبيرة هي فوضوي

مونتي راكوسن / غيتي

البيانات الكبيرة هي التحليلات التنبؤية: تحويل البيانات غير المنظمة الهائلة إلى شيء قابل للبحث والفرز. هذا هو الفضاء الفوضوي والفوضى التي تتطلب نوعا خاصا من المعرفة والصبر.

خذ على سبيل المثال خدمة توصيل UPS المتآلف. يقوم المبرمجون في UPS بدراسة البيانات من نظام تحديد المواقع العالمي (GPS) للهواتف الذكية والهواتف الذكية الخاصة بهم لتحليل أكثر الطرق فعالية للتكيف مع الازدحام المروري. تعتبر بيانات GPS والهاتف الذكي هذه عملاقة ، ولا تكون جاهزة للتحليل تلقائيًا. هذه البيانات تتدفق من مختلف قواعد بيانات GPS وخريطة ، من خلال أجهزة مختلفة للهواتف الذكية. قضى محللو UPS أشهرًا في تحويل كل هذه البيانات إلى تنسيق يمكن البحث عنه وفرزه بسهولة. لقد كان الجهد يستحق العناء ، مع ذلك. اليوم ، قامت UPS بتوفير أكثر من 8 ملايين غالون من الوقود منذ أن بدأت باستخدام تحليلات البيانات الكبيرة هذه.

نظرًا لأن البيانات الضخمة تتسم بالفوضى وتتطلب الكثير من الجهد للتنظيف والاستعداد للاستخدام ، فقد أصبح علماء البيانات يلقبون بـ "عمال انضباط البيانات" لجميع الأعمال الشاقة التي يقومون بها.

إن علم البيانات الضخمة والتحليلات التنبؤية يتحسن كل أسبوع. توقع أن تصبح البيانات الكبيرة متاحة للجميع بسهولة بحلول عام 2025.

ليست البيانات الضخمة تهديدا تدخلي للخصوصية؟

Feingersh / غيتي

نعم ، إذا لم يتم إدارة قوانيننا ودفاعات الخصوصية الفردية بعناية ، فإن البيانات الكبيرة تدخل في الخصوصية الشخصية. في الوقت الحالي ، تتتبع Google و YouTube و Facebook بالفعل عاداتك اليومية عبر الإنترنت . يترك هاتفك الذكي والحياة الحاسوبية بصمات رقمية كل يوم ، وتدرس الشركات المتطورة تلك البصمات.

القوانين حول البيانات الكبيرة آخذة في التطور. الخصوصية هي حالة من أنه يجب عليك الآن أن تتحمل المسؤولية الشخصية ، حيث لم يعد بإمكانك توقعها كحق افتراضي.

ما يمكنك فعله لحماية خصوصيتك:

أكبر خطوة واحدة يمكنك اتخاذها هي حماية عاداتك اليومية باستخدام اتصال شبكة VPN . ستقوم خدمة VPN بتدفق الإشارة الخاصة بك بحيث يتم إخفاء هويتك وموقعك بشكل جزئي على الأقل من المتتبعين. هذا لن يجعلك مجهولاً بنسبة 100٪ ، لكن VPN سوف تخفض إلى حد كبير مدى قدرة العالم على مراقبة عاداتك على الإنترنت.

أين يمكنني معرفة المزيد عن البيانات الضخمة؟

مونتي راسكوسن / غيتي

البيانات الكبيرة هي شيء رائع للأشخاص الذين لديهم عقول تحليلية وحب للتكنولوجيا. إذا كنت أنت ، فعليك زيارة هذه الصفحة من مشاريع البيانات الضخمة المثيرة للاهتمام.