質問

思を掻き、議論の一覧のgoogleグループこのマルチページにリストとかしてこの後、再度なスクリプティングというのがかかるものと思われます。

このプライベートグループ、ログインする必要がありますが私のgoogleアカウントします。残念なことでは管理できないログインを使用wgetはruby Net::HTTP.驚くことにgoogleグループにアクセスすることはできませんの お客様ログインフ, いすべてのコードサンプルのどちらがいいでしょうか?

僕のrubyスクリプトが埋め込末ます。への対応認証問い合わせにつき200OKでクッキーは、応答ヘッダとボディのメッセージ"ご利用のブラウザのクッキーの機能はオフになってしまいます。にしてください。

また、同じ出力wget.のbashスクリプトでこのメッセージ。

わからないか回避策です。私何かが足りない?ずっと面白いアイデアないか?

よろしくお願いします。

ジョン

こちらはrubyスクリプト:

# a ruby script
require 'net/https'

http = Net::HTTP.new('www.google.com', 443)
http.use_ssl = true
path = '/accounts/ServiceLoginAuth'


email='john@gmail.com'
password='topsecret'

# form inputs from the login page
data = "Email=#{email}&Passwd=#{password}&dsh=7379491738180116079&GALX=irvvmW0Z-zI"
headers =  { 'Content-Type' => 'application/x-www-form-urlencoded',
'user-agent' => "Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533.2 (KHTML, like Gecko) Chrome/6.0"}

# Post the request and print out the response to retrieve our authentication token
resp, data = http.post(path, data, headers)
puts resp
resp.each {|h, v| puts h+'='+v}

#warning: peer certificate won't be verified in this SSL session

こちらはbashのスクリプト:

# A bash script for wget
CMD=""
CMD="$CMD --keep-session-cookies --save-cookies cookies.tmp"
CMD="$CMD --no-check-certificate"
CMD="$CMD --post-data='Email=john@gmail.com&Passwd=topsecret&dsh=-8408553335275857936&GALX=irvvmW0Z-zI'"
CMD="$CMD --user-agent='Mozilla'"
CMD="$CMD https://www.google.com/accounts/ServiceLoginAuth"
echo $CMD
wget $CMD
wget --load-cookies="cookies.tmp" http://groups.google.com/group/mygroup/topics?tsc=2
役に立ちましたか?

解決

あなたはルビー?
は、 Mechanizeのにしてみました Mechanizeのライブラリーは、ウェブサイトとの相互作用を自動化するために使用されます。あなたがGoogleやGoogleのプライベート・グループは、あなたが必要なものを保存し閲覧することでログインできます。

ここここで例ををMechanizeのは、Gmailのスクレーピングのために使用されます。

他のヒント

私はその後、使用チキンフットのFirefoxを使って手動でログインすることで、以前にこれをしなかったし、閲覧およびスクレーピング自動化します。

scroll top