الحصول على البيانات المالية من جوجل المالية التي هي خارج نطاق API

StackOverflow https://stackoverflow.com/questions/1009524

سؤال

جوجل المالية API غير مكتملة -- العديد من الأرقام في الصفحة مثل:

http://www.google.com/finance?fstype=ii&q=NYSE:GE

لا تتوفر عبر API.

أحتاج هذه البيانات إلى رتبة الشركات في البورصات الكندية وفقا للمعادلة جرينبلات ، متاح عبر البحث في google عن "غرينبلات مؤشر بفحص".

سؤالي:ما هو الأكثر ذكاء/تنظيف/طريقة فعالة للوصول إلى ومعالجة البيانات على صفحات الويب هذه.هو مملة النهج ضروري في هذه الحالة ، إذا كان الأمر كذلك ، ما هي أفضل طريقة للذهاب حول ذلك ؟ أنا حاليا تعلم بايثون للمشاريع ذات الصلة إلى هذا واحد.

هل كانت مفيدة؟

المحلول

قد تتمكن من محاولة يسأل جوجل لتوفير المفقودة من واجهات برمجة التطبيقات.وإلا كنت عالقا مع كشط الشاشة, الذي هو متعة أبدا ، عرضة كسر دون إشعار ، المرجح في انتهاك بنود خدمة Google.

ولكن إذا كنت لا تزال تريد أن تكتب شاشة مكشطة ، فإنه من الصعب الفوز على مزيج من مكننة و BeautifulSoup.BeautifulSoup هو HTML محلل و مكننة هو بيثون يستند إلى مستعرض ويب التي تمكنك من تسجيل الدخول, تخزين الكوكيز و عموما التنقل في جميع أنحاء مثل أي متصفح ويب.

نصائح أخرى

BeautifulSoup سيكون الأسلوب المفضل للHTML تحليل مع بيثون

هل بحثت في خيارات جانب جوجل (مثل ياهو المالية API)؟

والقشط صفحات الويب دائما تمتص، ولكن أنصح تحويلها إلى XML (عبر مرتبة أو بعض HTML أخرى -> برنامج XML). ومن ثم استخدام XPath على المشي العقد التي كنت مهتما في

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top