質問

こんにちはいリストのFacebookページのurl

eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...

何が最良の方法:

  • チェックがこれらのurl 実際に のためのFacebookページ ない プロファイル

  • 収集などの詳細 #のファン これらのページ

の助けが非常によろしくお願いいたします。

役に立ちましたか?

解決

な削他のコンテンツ(対Facebookの利用規約とにかく):

  1. エキス、ユーザー名のURL すなわちこのビットの後に www.facebook.com/
  2. いFQLのクエリ形式の select fan_count from page where username='michaeljackson'
  3. 場合、結果は返却いたしますので、 ページのいないユーザー。

を参照 ページFQLテーブル その他のデータを取得することができ、同じます。

他のヒント

使用 urllib2 または pyfacebook コンテンツを取得する

使用 BeautifulSoup または lxml 構文解析で

をご利用 モジュール(正規表現)の抽出内容のご確認及びデータ収集

ファンの#は、クラスのFanManager "とタグです。あなたは、文字列からデータを取得するには、このタグ、および正規表現の内容を取得するには美しいスープを使用することができます。:intとして(例:1,000,000ファン)、またはあなたがどんな希望

ページが存在する場合は、404ページにあるかどうかを確認するために、タグのいくつかをチェックします。

、表示するには
あなたが使用することができます scrapy のか<のhref = "http://www.crummy.com/software/ BeautifulSoup /」のrel = "nofollowをnoreferrer"> BeautifulSoup のコンテンツを掻き取るます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top