عالِمُ البيانات

مهنة المستقبل

هناك طلب متزايد وحاجة ماسة للمختصين الذين يمكنهم مساعدة صناع القرار والتنفيذيين على فهم البيانات والقيمة التنافسية التي يمكن أن تقدمه لأعمالهم. بوسع علماء البيانات الغوص في بحيرات البيانات للتنقيب فيها بحثاً عن الأنماط والعلاقات والظواهر الغير ملاحظة والتي تحوي قيمة مضافة وأسلوب فاعل في دعم آليات اتخاذ القرار بأسلوب مبني على حقائق ورؤى قابلة للتنفيذ. اتباع هذا الأسلوب يعني زيادة اعتماد المنظمات على صناعة القرارات المبنية على المعرفة والحقائق الموضوعية (Data Driven)، بدلاً من الحدس أو التخمين.

In God we trust. All others must bring data

“التسليم لله وحده وبه نثق. إلى الآخرين، هاتوا بالبيانات برهانكم”

تتربع الشركات والمنظمات اليوم على جبال شاهقة من البيانات، كل ذلك بفضل التقدم التقني المتسارع في أساليب توفير الخدمات، التحول الرقمي، الخدمات السحابية، عمليات وطرق جمع البيانات و الانخفاض المتزايد في تكاليف تخزينها. تختلف البيانات بطبيعتها فهناك النصوص، الصور، الفيديو، المقاطع الصوتية. أيضاً تتعدد وجوه البيانات فمنها المهيلكة كما في بطاقة الهوية الوطنية ومنها الغير مهيكلة كنصوص المقالات الصحفية. تكمن في هذه البيانات العديد من الفرص للمنظمات لتحسين استراتيجياتها وعملياتها. على سبيل المثال، يمكن للشركات التي تقدم خدمات لعملائها أن تخلق ميزة تنافسية وتصنع تميز في تجربة العميل من خلال تقديم محتوى مناسب وخاص لكل عميل بواسطة تحليل البيانات المتوفرة عن ذلك العميل. كما أنه بوسع الشركات أن تعرف مدى رضى العملاء عن منتجاتها وخدماتها من خلال تحليل آراء العملاء على صفحات مواقع التواصل الإجتماعي.


ساهمت ثورة البيانات بزيادة مستوى المنافسة والبحث عن التميز بين الجهات المتنافسة، وبات توظيف عمليات تحليل البيانات بطرق وأساليب مبتكرة أحد الأدوات الرئيسة التي تتسابق الشركات الرائدة لتبنيها كي تتميز في مضمار تطوير الأعمال وتحسين الخدمات والمنتجات وأساليب صناعة القرار.


أهمية البيانات وقيمتها تتزايد عندما يشعر متخذ وصانع القرار بفائدتها وتأثيرها على آلية عمل المنظمة وهذا لا يمكن أن يتم إذا لم توجه الجهود نحو استكشاف البيانات الضخمة الخام ومحاولة استخراج ما فيها من قيمة مضافة. نتيجةً لذلك، هناك طلب متزايد وحاجة ماسة للمتخصصين الذين يمكنهم مساعدة صناع القرار والتنفيذيين وغيرهم على فهم معنى هذه البيانات والقيمة التنافسية التي يمكن أن تقدمه لأعمالهم. حيث بوسع علماء البيانات الغوص في بحيرات البيانات للتنقيب فيها بحثاً عن الأنماط والعلاقات والظواهر الغير ملاحظة والتي تحوي قيمة مضافة وأسلوب فاعل في دعم آليات اتخاذ القرار بأسلوب مبني على حقائق ورؤى قابلة للتنفيذ. اتباع هذا الأسلوب يعني زيادة اعتماد المنظمات على صناعة القرارات المبنية على المعرفة والحقائق الموضوعية (Data Driven)، بدلاً من الحدس أو التخمين.


يُقال “البيانات هي النفط الجديد” ومع تحول عالم الأعمال نحو مستقبل قائم على البيانات فالسؤال المطروح هنا يدور حول المهارات التي يمتلكها عالم البيانات ويتوجب على من يرغب بأن يتخصص في هذا المجال تطويرها وصقلها؟ يمكن تقسيم المهارات بشكل عام إلى مجموعتين: مهارات تقنية ومهارات غير تقنية. تحاول هذه المقالة فيما يلي استعراض أهم هذه المهارات وذلك وفقاً لعدة دراسات واستطلاعات رأي أعدها باحثون مختصون في هذا المجال.

التفكير النقدي وحل المشاكل


يقول أينشتاين "ليس لدي موهبة خاصة. أنا فقط فضولي بحماس." أحد أهم المهارات التي يتمتع بها علماء البيانات المتميزين هي المعرفة بطريقة طرح الأسئلة وكيفية إجراء التجارب (Experiments) واختبار الفرضيات (Hypothesis) لجعل الاستدلالات الإحصائية من البيانات المتوفرة تخدم أعمالهم. على نطاق أوسع، يمكن أن يفكروا بشكل خلاق وأسلوب إبداعي لحل المشاكل وتحديات الأعمال وترجمة الأسئلة المتعلقة بها لدى صناع القرار إلى أسئلة مفيدة يمكن الإجابة عليها من خلال البيانات. هناك من يقسم التفكير الناقد في علم البيانات إلى جانبين. الأول هو القدرة على تطوير السؤال وهذا عملياً يتضمن إجراء مقابلات مكثفة مع مستخدمي نتائج تحليل البيانات، لفهم تحديات الأعمال والمشاكل المرغوب حلها والأهداف المراد الوصل إليها. يستلزم هذا التعاون مهارة التعامل مع الآخرين وتكامل لاستخراج وتبادل المعرفة لتحديد المشاكل المرغوب معالجتها. الجانب الثاني من التفكير النقدي هو القدرة على طرح الأسئلة الخاصة بالفحص والتحقق من دقة ما تقدمه البيانات من نتائج. دور عالم البيانات الحقيقي ليس مبنياً على وضع البيانات في برامج وأنظمة التحليل وأخذ المخرجات كحقائق مسلم بها، المحلل المتمرس هو من يوظف تجاربه وخبراته في تحليل البيانات ليتحقق من أن النتائج ليست مضللة وأن النماذج المطورة خالية من الأخطاء.

الإحصاء


تحليل البيانات يتمحور بشكل رئيسي حول التحليل الإحصائي والرياضي للبيانات لكشف الأنماط والظواهر وللقيام بعمليات التنبؤ. لذلك تعد المهارات الاحصائية القوية واحدة من أهم أدوات محلل البيانات، وتختلف الحاجة إلى مستوى التعمق في فهم أساليب وطرق الإحصاء والرياضيات باختلاف الوظائف وطبيعة التحديات التي يتم حلها بواسطة البيانات. يرى كثير من المهتمين بمجال تحليل البيانات أن الحد الأدنى من المهارات الإحصائية التي يجب أن تتوفر لدى محلل البيانات لا يفترض أن تقل عن فهم قوي للإحصاءات الأساسية مثل الاحتمالات (Probability)، الاستدلال الاحصائي (Inference Statics)، اختبار A / B (A/B Testing)، نماذج التنبؤ (Predictive Modeling)، تحليل الاتجاهات (Trend Analysis) وتحليل المجموعات (Cluster Analysis) والتصنيف (Classification). المعرفة النظرية بهذه المفاهيم أمر مهم لكنه لا يُغني بأي حال عن الحاجة لمهارات تطبيقها وتوظيفها للإجابة عن الأسئلة وحل مشاكل الأعمال.

التعامل مع البيانات


محلل البيانات المتميز يتمتع بمستوى عال من مهارات وأساليب جمع البيانات وتنظيفها من الشوائب وتوفيرها وإداراتها لخدمة عمليات التحليل. هذا يعني أنه لديه الإلمام بطريقة جمع وتنظيم ومعالجة كميات كبيرة من البيانات باستخدام قواعد البيانات(Database) والملفات (Files) وغيرها من مصادر البيانات. وتعتبر اللغة الاستعلامية (SQL) الأكثر شيوعاً واستخداماً لاستخراج البيانات من قواعد البيانات وبالتالي معرفتها والتمكن من استخدامها يُعد مطلبًا رئيسياً. تسمح (SQL) للمحللين بكتابة استعلاماتهم (Query) خاص لجلب البيانات وبشكل تفصيلي من قواعد البيانات. البيانات ليست دائماً منظمة ومهيكلة، التعامل مع البيانات الغير مهيكلة (Unstructured) –على سبيل المثال، النصوص، ربما يتم باستخدام أدوات خاصة بهذا النوع من البيانات وبالتالي تعلم مهارات (NoSQL) يصبح ضرورياً. يوجد لغات استعلامية أخرى مخصصة للتعامل مع البيانات الضخمة كتقنيات هادووب (Hadoop) مثل (Hive) و (Impala). وبما أن هذا المجال متسارع بالتغيير وهناك العديد من التقنيات الخاصة للتعامل مع البيانات يتم تطويرها باستمرار، ولذا يتعين على محللي البيانات والمختصين في هذا المجال أن يكونوا بارعين في التعليم الذاتي (Self-learning) لرفع مستوى مهاراتهم في البيانات وتعلم تقنيات البيانات الجديدة. إن مشاريع معالجة البيانات وأنظمة تخزينها وتحليلها تعتمد وبشكل كبير على أنظمة لينكس (Linux)، وبالتالي فإن كتابة أوامر لينكس (Commands) والمهارة المتوسطة على الأقل في التعامل معها يعتبر من المسلمات في علم البيانات ولا يستدع الاسهاب.

البرمجة


يمكن في علم البيانات الاعتماد على بعض البرامج والأنظمة الخاصة بتحليل البيانات للقيام بعدد من المهام المتعلقة بتلك المشاريع، لكنه من المؤكد بأن عالم البيانات لن يجد حلول وإجابات لجميع الأسئلة والفرضيات التي يرغب ببحثها في هذه الأدوات ولن يجد المرونة التي يبحث عنها. وبالتالي فإن المعرفة القوية بالبرمجة مفيدة وضرورية في كثير من الأحيان، لحل المشكلات التي لا تكون البرامج الجاهزة مهيئة للتعامل معها. في مثل هذه الحالات، سيتحتم عليه كتابة وتطوير برامج خاصة به تمكنه من التعامل مع البيانات. من أكثر اللغات البرمجية المستخدمة في مجال علم البيانات هما R وPython. يُعرف عن لغة R تفوقها في تطوير برامج التحليل الإحصائي، في حين أن Python غالباً ما يكون مفيدًا في أتمتة المهام المتكررة وبناء نماذج تعلم الآلة وعرض نتائج التحليل بصور ورسوم بيانية (Visualization). ربما من البديهي أن مهارات البرمجة ستصبح أكثر أهمية لعلماء البيانات في السنوات القادمة، نظراً للتعقيدات الناتجة عن طبيعة البيانات الضخمة والتي ستزيد من التحديات التي ستواجه المنظمات وستزيد التعقيد في مشاريع تحليل البيانات في واستخراج رؤى (Insights) من ركام البيانات الخام.

ذكاء تجاري وفهم الأعمال


توفر المهارات الإحصائية والتقنية في عالم البيانات هو بدون أدنى شك كمعرفة قيادة الطائرة وأنظمة الطيران العالمية بالنسبة للطيارين. لكن ليصبح لعالم البيانات دوراً أكبر ونجاحاً في حل مشاكل وتحديات الأعمال فإنه لابد أن يتمتع بذكاء تجاري يفهم من خلاله طبيعة عمل المنظمة التي يعمل بها والسوق التي تتم المنافسة به وبمتغيرات ذلك الميدان. توفر هذه المهارة في عالم البيانات يساعده في فهم البيانات بشكل أشمل وتوظيفها لخدمة مهام واستراتيجية المنظمة. على سبيل المثال، عالم البيانات المكلف بمشروع تحليل بيانات العملاء لتنظيم حملة تسويقية، سيكون دوره أكثر فاعلية إذا توفر لدية فهم عميق بأساليب وطرق التسويق وأساليب الوصول للشريحة المستهدفة لتصبح التوصيات التي يقدمها لمدير الحملة التسويقية أكثر نفعاً وأدق في الوصول للفئة المستهدفة وأكثر تأثيراً.

عرض وتصوير النتائج والتواصل


يُقال الصورة أبلغ من ألف كلمة. لمساعدة صناع القرار فهم نتائج تحليل البيانات والأنماط ونماذج التنبؤات وغيرها، يتعين على علماء البيانات تحويل النتائج التي يتم الوصول إليها إلى قصص مرسومة يسهل لغير المختص وصناع القرار فهمها والاستفادة منها في أعمالهم. المقصد هنا استخدام الرسوم البيانية (Charts) وتصميم لوحات المعلومات (Dashboard) لتصوير مخرجات التحليل. تتطلب هذه المهمة استخدام أدوات برمجية مثل (Python) أو برامج ذكاء الأعمال مثل (Power BI) أو برامج تصوير البيانات مثل (Tableau). إجادة هذه المهارة ومعرفة طريقة صناعة المحتوى المعروض أمرٌ ضروري في علم البيانات ليتم الاستفادة من المخرجات بشكل أكبر. أيضاً القدرة على قراءة هذه الرسومات وشرحها لغير المختصين مهارة ذات أهمية متزايدة.

تعلم الآلة والذكاء الاصطناعي


تتميز الأنظمة الذكية المطورة بواسطة خوارزميات تعلم الآلة (Machine Learning) بقدرتها على التعلم من البيانات المتوفرة وتطوير جودة أداءها ودقة قراراتها بشكل مستمر من خلال التجارب والممارسة وبشكل آلي وهذا بدوره سيزيد في المستقبل من المهام التي ستفوضها المنظمات ويفوضها البشر للآلات والحواسيب. يحتاج علماء البيانات وبشكل متزايد إلى فهم كيفية تطوير وتطبيق خوارزميات (Algorithms) وأساليب الذكاء الاصطناعي (Artificial Intelligence).

التعليم الذاتي


على الرغم من استخدامه لأساليب وأدوات قديمة ومعروفة منذ زمن إلا أن علم البيانات لايزال فتياً وموضوع نشط على الصعيد البحثي والتطويري. وبالتالي فإن هذا المجال متسارع بالتغيير وهناك العديد من التقنيات الخاصة للتعامل مع البيانات يتم تطويرها باستمرار، ولذا يتعين على علماء البيانات والمختصين في هذا المجال أن يكونوا بارعين في التعليم الذاتي (Self-learning) لرفع مستوى مهاراتهم في البيانات ومواكبة التقنيات والحلول الجديدة.

Join