La presentación de Google con PyQt QWebElement
-
02-10-2019 - |
Pregunta
El siguiente código no llega searchResults. He impreso documentElement.findFirst ( 'input [name = 'btnG']') y se encontró que sea <input name="btnG" type="submit" value="Google Search" class="lsb">
así que estamos bien hasta ese momento. Tenga en cuenta que mi objetivo no es raspar Google, pero es más fácil de aprender a través de la conocida y pública Google.
#!/usr/bin/python
from PyQt4.QtCore import QUrl, SIGNAL
from PyQt4.QtGui import QApplication
from PyQt4.QtWebKit import QWebPage, QWebView
class Scrape(QApplication):
def __init__(self):
super(Scrape, self).__init__(None)
self.webView = QWebView()
self.webView.loadFinished.connect(self.searchForm)
def load(self, url):
self.webView.load(QUrl(url))
def searchForm(self):
documentElement = self.webView.page().currentFrame().documentElement()
inputSearch = documentElement.findFirst('input[title="Google Search"]')
inputSearch.setAttribute('value', 'test')
self.webView.loadFinished.disconnect(self.searchForm)
self.webView.loadFinished.connect(self.searchResults)
documentElement.findFirst('input[name="btnG"]').evaluateJavaScript('click()')
def searchResults(self):
for element in documentElement.find('li[class="g"]'):
print unicode(element.toOuterXml())
self.exit()
my_scrape = Scrape()
my_scrape.load('http://google.com/ncr')
my_scrape.exec_()
Solución
fin he dado cuenta! y sometido a http://drupal4hu.com/node/266
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow