عالم البيانات v مهندس البيانات ، ما الفرق؟

قد يكون متخصصو البيانات ومهندسو البيانات مسميات وظيفية جديدة ، ولكن الأدوار الوظيفية الرئيسية كانت موجودة لبعض الوقت. تقليديا ، أي شخص يقوم بتحليل البيانات يسمى "محلل البيانات" ويصبح "مطور ذكاء الأعمال (BI)" ، الذي ينشئ منصة خلفية لدعم تحليلات البيانات.

مع ظهور البيانات الضخمة ، ظهرت بيانات جديدة في الشركات ومراكز البحث - علماء البيانات ومهندسي البيانات.

فيما يلي نظرة عامة موجزة عن دور محلل البيانات ومبرمج BI وأخصائي البيانات ومهندس البيانات.

محلل بيانات

محللو البيانات هم من المهنيين ذوي الخبرة مع القدرة على الاستعلام عن البيانات ومعالجتها في مؤسستهم ، للإبلاغ عن البيانات وتلخيصها وتصورها. إنهم يعرفون كيفية استخدام الأدوات والتقنيات الموجودة لحل المشكلات ، ومساعدة الأشخاص عبر الشركة على فهم الاستفسارات المحددة باستخدام التقارير والجداول الزمنية المخصصة.

ومع ذلك ، لا يُتوقع منهم التعامل مع تحليلات البيانات الضخمة ، وعادة لا يُتوقع أن يكون لديهم بيانات حسابية أو بيانات بحثية لتطوير خوارزميات جديدة لمشاكل محددة.

المهارات والأدوات: يحتاج محللو البيانات إلى بعض المعرفة الأساسية بالمهارات الأساسية: الإحصائيات ، وجمع البيانات ، وتصور البيانات ، والبحث عن البيانات ، Microsoft Excel و SPSS و SPSS Modeler و SAS و SAS Miner و SQL و Microsoft Access و Tableau و SSAS.

مطورو ذكاء الأعمال

إن مُصنِّعي ذكاء الأعمال هم متخصصون في البيانات لديهم علاقة أوثق مع أصحاب المصلحة الداخليين لفهم احتياجات إعداد التقارير ثم جمع المتطلبات وإنشاء حلول BI وشركات التقارير. يجب عليهم تصميم وتطوير وصيانة قواعد البيانات الجديدة والحالية وحزم ETL والمكعبات ولوحات المعلومات وتقارير التحليلات.

بالإضافة إلى ذلك ، فإنهم يعملون مع قواعد البيانات المتقاطعة والمتعددة الأبعاد ويجب أن يكون لديهم مهارات واسعة في تطوير SQL لدمج البيانات من مجموعة متنوعة من المصادر. يستخدمون كل هذه المهارات لتلبية احتياجات الخدمة الذاتية للمشروع. عادة لا يتوقع منتج BI أن يقوم بتحليل البيانات.

المهارات والأدوات: ETL ، معالجة التقارير ، OLAP ، المكعبات ، ذكاء الويب ، تصميم عناصر الأعمال ، Tableau ، أدوات لوحة المعلومات ، SQL ، SSAS ، SSIS.

مهندس معلومات

مهندسو البيانات هم متخصصون في البيانات يعدون البنية التحتية "للبيانات الضخمة" التي يتم تحليلها بواسطة متخصصي البيانات. هم مهندسو برمجيات يقومون بتصميم وبناء ودمج وإدارة البيانات الضخمة من مجموعة متنوعة من المصادر. ثم يكتبون استفسارات معقدة ، ويتأكدون من سهولة الوصول إليها ، والعمل بسلاسة ، وهدفهم هو تحسين أداء النظام البيئي للبيانات الضخمة للشركة.

يمكنهم أيضًا تشغيل بعض برامج ETL (استخراج وتحويل وتحميل) على مجموعات بيانات كبيرة وإنشاء قواعد بيانات كبيرة يمكن استخدامها من قبل علماء البيانات لإعداد التقارير أو التحليل. . أيضًا ، نظرًا لأن مهندسي البيانات يركزون بشكل أكبر على التصميم والهندسة المعمارية ، فإنهم عادة لا يتوقعون معرفة أي تعلم آلي أو تحليل للبيانات الضخمة.

المهارات والأدوات: Hadoop، MapReduce، Hive، Pig، MySQL، MongoDB، Cassandra، Data Flow، NoSQL، SQL، Programming.

عالم البيانات

عالم البيانات الخيميائي في القرن الحادي والعشرين: شخص يحول البيانات الخام إلى مفاهيم مصقولة. يستخدم علماء البيانات مناهج تحليلية لحل المشكلات المهمة في الإحصاء والتعلم الآلي والأعمال. مهمتهم الرئيسية هي مساعدة المنظمات على تحويل كميات كبيرة من البيانات الضخمة إلى رؤى قيمة وفعالة.

في الواقع ، علم البيانات ليس اتجاهًا جديدًا تمامًا ، ولكن يمكن النظر إليه على أنه مستوى متقدم من تحليل البيانات يتم التحكم فيه وأتمتة من خلال التعلم الآلي وعلوم الكمبيوتر. بمعنى آخر ، يمتلك علماء البيانات مهارات برمجة قوية ، وخوارزميات جديدة ، ومعالجة البيانات الكبيرة ، ومعرفة المجال ، بالإضافة إلى تحليلات البيانات ، مقارنة بـ "محللي البيانات". متوقع.

بالإضافة إلى ذلك ، من المتوقع أن يقوم علماء البيانات بتفسير النتائج التي توصلوا إليها ومشاركتها بحرية مع قصص مثيرة للاهتمام حول كيفية تصورها أو إنشاء تطبيقات البيانات أو حل مشاكل البيانات (الأعمال) الخاصة بهم.

تتطلب مهارات حل المشكلات لدى عالم البيانات فهمًا لتقنيات تحليل البيانات التقليدية والجديدة على حد سواء لبناء نماذج إحصائية أو تحديد الأنماط في البيانات. تشمل الأمثلة إنشاء نظام إحالة أو التنبؤ بسوق الأسهم أو التشخيص المستند إلى المريض أو العثور على المعاملات المزيفة.

يمكن في بعض الأحيان توفير البيانات للعلماء عن طريق البيانات الضخمة في غياب أي مشكلة تجارية. في هذه الحالة ، يتوقع من عالم البيانات الغريب دراسة المعلومات والعثور على الأسئلة التي تحتاج إليها وتقديم نتائج مثيرة للاهتمام! هذا أمر صعب لأن الخبراء الذين يعتمدون على البيانات يتمتعون بالقوة الكافية لتحليل البيانات بطرق متنوعة في التعلم الآلي وجمع البيانات والإحصاءات والبنية التحتية للبيانات الضخمة. يجب أن يكون لديك الكثير من المعرفة.

يجب أن يكون لديهم خبرة في العمل مع مجموعات مختلفة من البيانات ذات الأحجام والأشكال المختلفة واستخدام خوارزمياتهم للبيانات واسعة النطاق بفعالية وكفاءة ، مما يعني عادة أن تكون على دراية بجميع أحدث التقنيات. هذا هو السبب في أنه من المهم معرفة أساسيات علوم الكمبيوتر والبرمجة ، بما في ذلك تقنيات اللغات وقواعد البيانات (الكبيرة / الصغيرة).

المهارات والأدوات: Python ، R ، Scala ، Apache Spark ، Hadoop ، أدوات وخوارزميات البحث عن البيانات ، التعلم الآلي ، الإحصائيات.

MUORO - البيانات والتحليل عبقرية muoro.io