سؤال

بالنظر إلى عنوان URL للشركة المعروفة (مثل http://mcdonalds.com/)، كيف يمكنك العثور على اسم الشركة تلقائيا وموثوقية (في هذه الحالة "MC Donalds")؟

شكرًا

عدل: صوت شخص ما لإغلاق هذا السؤال، لذلك ربما أحتاج إلى شرح الدافع. لدي قائمة كبيرة من عناوين URL وأرغب في العثور على بيانات حول كل شركة باستخدام خرائط Google. والبحث في خرائط Google مع اسم الشركة يعمل بشكل أفضل بكثير من عنوان URL.

إن إزالة "HTTP" و "COM" يعمل في كثير من الحالات، خاصة بالنسبة للشركات المعروفة، ولكن ليس كل شيء. لقد وجدت أن سجلات Whois لم تكن مفيدة للغاية.

كنت آمل أن يكون هناك نوع من الشركات المطابقة لقاعدة البيانات العامة إلى عناوين URL، لكنها لم تصادف واحدة حتى الآن.

هل كانت مفيدة؟

المحلول

ستحتاج إلى إنشاء جدول البحث الخاص بك: سيتعين عليك تجربة هذه المعلومات وتحليل هذه المعلومات من HTML عند عنوان URL للبيانات الدقيقة للموضوع، على سبيل المثال: احصل على عنوان صفحة HTML أو البحث عن رسالة حقوق الطبع والنشر؟

نصائح أخرى

من المحتمل جدا أن يكون لديهم في <title/> عنصر. تحليل هذا وقارنه بمجال الموقع. إذا كان هناك تداخل كبير، فمن المباراة الخاصة بك. إذا لم يكن الأمر كذلك، فحاول بعض الاستدلال على العنوان (مثل الاسم هو كل شيء من قبل >> أو مثل).

إذا كانت شركة أكبر، فيمكنك أيضا أن تكون محظوظا بالنظر إلى إدخال NIC (AKA WHOIS) لمجالهم.

الذي هو قد تكون قاعدة البيانات من بعض المساعدة، على الرغم من أن هناك حالات حافة دائما سيتعين عليك التعامل مع المزيد من الجهد.

إذا كنت تريد أن تكون دقيقا، أود أن أقول تورك الأمازون الميكانيكية.

حاول استخدام حليقة ودومادوثمان.

loadhtml (نتيجة $)؛ $ العنوان = $ dom-> getellementbytagname ("العنوان")؛ عنوان ECHO $-> البند (0) -> العديمية؛ ؟>

إلقاء نظرة على علامة التعريف

يمكنك استخدام الذي هو معلومة. يجب أن تكون هناك مكتبات لإعلامك بذلك بطريقة نظيفة. لم تذكر ما نوع التكنولوجيا التي ستستخدمها ...

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top