يمكن للشخص يرجى توضيح استخراج البيانات، وجهاز مباحث أمن الدولة، BI، ETL وغيرها من التكنولوجيات ذات الصلة؟

StackOverflow https://stackoverflow.com/questions/416566

سؤال

وكنت أتحدث مع زميل في العمل أمس بخصوص الوضع حيث كان جهاز مباحث أمن الدولة (أو شيء من هذا القبيل) للقيام ببعض شيء رائع حقا مع حزمة جهاز مباحث أمن الدولة حيث صدر في اسم مثل "الدكتور ريجنالد ويليامز، دكتوراه. " واستنادا إلى بعض هذه الأوزان هو نظام ذكي بما فيه الكفاية لمعرفة كيفية tokenize ذلك وتخزينها في قاعدة بيانات "Salutation- الاسم الأول - اسم العائلة - لاحقة". وألقى بعض التعبيرات الطنانة مثل BI، ومباحث أمن الدولة، ETL، واستخراج البيانات. أردت حقا مزيد من المعلومات، ولكن لم أكن أعرف حتى من أين نبدأ في طرح.

وأنا مطور صافي ومتمكن تماما في C #، Vb.Net، WPF، الخ ...، ولكن ليس لدي أي فكرة ما هي هذه التقنيات، وكيفية إضافتها إلى بلدي مجموعة من المهارات، وأم لا هذا شيء أنا حقا يجب أن يكون التركيز على. إن أي وجميع الاتجاه تكون مفيدة.

هل كانت مفيدة؟

المحلول

ومباحث أمن الدولة == خدمات SQL Server التكامل وانه هو من استخراج وتحويل وتحميل (ETL) أداة، بل هو تنفيذ أعلى بكثير من ما كان خدمات تحويل البيانات أو DTS في SQL7، عصر SQL2K. بل هو أداة عظيمة للتعبير عن عمليات سير العمل حيث يتم نقل البيانات من النقطة ألف إلى النقطة B (ج و د الخ) ويخضع لتغيرات خلال تلك العملية مثل توحيد للتصميم أو البيانات بدون تسوية التطهير.

وBI أو ذكاء الأعمال هو اللقب لفئة بأكملها في عالم التكنولوجيا وأنه هو مكان عظيم أن يكون في الوقت الحالي. ومهارات استقصاء المعلومات القيمة جدا ويصعب الحصول عليها، واحدة من أسباب هذه الحالة هو أنه من الصعب إعادة قضية استقصاء المعلومات الحقيقية في المختبر لذلك هو دائما تقريبا يتم التدريس في وضع العالم الحقيقي.

ومن مستوى عال، والمشاريع استقصاء المعلومات عادة ما تنطوي على نقطة نهاية التقرير. في كثير من الأحيان كما المطورين تعودنا على تقرير المعاملات كتابة مثل تفاصيل PO لكن BI يمكن ان يحصل في تقارير واسعة جدا التي تغطي الاتجاهات مبيعات المنتجات على مدى عقود والتعامل مع مئات الملايين من السجلات. الطريقة نقوم بتصميم قواعد البيانات للتطبيقات ليست مثالية لهذا النوع من التقارير الأدوات والتقنيات الأخرى لذلك اخترعت وتستخدم في الفضاء BI. هذه هي أشياء مثل مكعبات الذي كثيرا ما نسمع دعا مكعبات OLAP. مكعبات OLAP عادة ما تنشأ من مستودع البيانات التي ليست أكثر من قاعدة بيانات أخرى - ولكن مستودعات نموذجية تحتوي على البيانات التي جاءت من أكثر من واحد، وغالبا ما العشرات من قواعد بيانات التطبيقات الأخرى. التطبيق المخزون الخاص بك، وشراء التطبيق، التطبيق HR ومجموعة كاملة من غيرها تحتوي على جميع اجزاء وقطع من البيانات التي تخلق صورة كاملة للعمل، ومهندس معماري BI استخدام شيء مثل جهاز مباحث أمن الدولة لسحب البيانات من جميع هذه النظم، والتدليك وتخزينها في مستودع البيانات التي تم تصميم مع نوع مختلف من تصميم أفضل للإبلاغ. مرة واحدة هو في مستودع انه سيستخدم خدمات تحليل لإنشاء مكعبات في ذلك البيانات وشيء من هذا القبيل خدمات التقارير أن تظهر لك تقارير على تلك البيانات.

وتحرير: آسف، نسيت استخراج البيانات، فمن فترة ولاية أخرى غير محددة تصف ومفهوم أو عملية وليس ذلك بكثير على الأداة. في مثال بسيط، بل هو نهج منهجي لتحديد أنماط في البيانات. في الماضي analysy عمل جيد من شأنه أن ننظر من خلال بيانات الاتجاهات، ولكن مع قواعد البيانات الحديثة التي تتحدث عن مجموعات البيانات بطريقة كبيرة جدا لتمشيط يدويا من خلال - التنقيب عن البيانات يسمح لك لتعليم الكمبيوتر لتمشيط من خلال تلك البيانات وتحديد أنماط التي تهم .

وعلى أمل أن يساعد

نصائح أخرى

وماذا فعل زميل العمل الخاص بك قد يكون أفضل وصف بأنه "تحليل ذكي" من سلسلة. يمكن أن يتم ذلك على عدة مستويات من التطور - على سبيل المثال، وذلك باستخدام نماذج إحصائية لتعطيك احتمال أن "الدكتور" هو تحية وليس الاسم الأول. أو أنها يمكن أن مجرد استخدام قائمة بحث بسيطة من التحية المشتركة، وفي هذه الحالة فإنه من قانون الإجراءات العادية فقط، لا شيء أكثر من ذلك.

وSSIS قصيرة لخدمات تكامل SQL خادم. انها في الاساس DTS على المنشطات. بعض الناس يحبون ذلك، وبعض الناس يكرهون ذلك. انها تريد ان تكون صعبة لاستخدام ذلك في حد ذاته أن تفعل هذا النوع من الشيء الذي نتحدث عنه. انها أساسا فقط لأخذ البيانات من مختلف المصادر والجمع بين ذلك، وتحويلها، وتحميلها في مكان آخر. ويمكن أن تفعل بعض الأشياء أنيق، وكثير منها تميل إلى أن تكون الألغام البيانات مثل، ولكن في النهاية انها وسيلة لإنتاج البيانات هدفهم اتجاه واحد أو آخر. لا سيما يحظى باحترام كبير في المجتمع استخراج البيانات.

استخراج البيانات هو الانضباط الأكاديمي بأكمله، ركزت على استخدام بعض كمية (كبير عادة) البيانات إما التنبؤ الإجابات المستقبلية أو فهم أنماط في البيانات الحالية. انها بالتأكيد مساحة كبيرة للوصول الى، ولكن لا شيء يمكنك اختيار للتو والاستغناء عن بعض دراسة مكثفة من الرياضيات والخوارزميات. كتاب جيد حول هذا الموضوع هو هذا واحد .

و"ذكاء الأعمال" هو حقا أكثر من الكلمة الطنانة من تقنية محددة، ويمكن أن تعني أشياء مختلفة لأناس مختلفين. في الأساس، فكرة توحي به الاشياء أقل البكم مع البيانات التجارية، وعموما فإنه يشير إلى تحليل الاتجاهات على مر الزمن، وغالبا ما تستخدم OLAP. ويمكن أن تشمل أيضا استخراج البيانات أو AI الخوارزميات، ولكن منذ ليس هناك تعريف دقيق، فقط حول أي شخص الذي يريد أن يبيع لك شيئا ما سوف اقول لكم انه تقدم "ذكاء الأعمال"، وآمل أن لا حفر أكثر من ذلك.

خدمات SQL Server تكامل و مفيد لفعل ETL (استخراج، تحويل ، وتحميل) التي هي الواجهة الأمامية للعديد من البيانات حلول التخزين / ذكاء الأعمال التي تعمل على دمج البيانات في سهلة الاستخدام نماذج ثلاثية الأبعاد. مباحث أمن الدولة هو مفيد أيضا للمشاريع الصغيرة باعتبارها وسيلة مريحة لتحميل البيانات القديمة أو بيانات من مستودعات أو غيرها من الملفات.

استخراج البيانات يعني عادة باستخدام بيانات من مصادر متكاملة لاستنتاج المعلومات التي لن يكون واضحا من بيانات المعاملات (عن طريق دمج مصادر متعددة إعطاء المزيد من "أبعاد" للبيانات.

وBI هو موضوع كبير لذلك قد لا يكون شيئا للتركيز على إلا إذا كنت ترغب في الحصول على هذا المجال، ولكن مباحث أمن الدولة يمكن أن تكون مفيدة في المشاريع الصغيرة والجدير تعلم على أي حال.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top