Frage

Ich versuche, die Quelle jeder Seite in eine Textbox für eine Client-Seite nur HTML-Editor zu laden. Ich muss in der Lage, die gesamte Quelle einer Webseite zu erhalten, nicht nur den Körper. Diese yql Abfrage gibt nur den Körper:

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22

Gibt es eine Möglichkeit, die gesamte Quelle zu erhalten, oder gibt es andere freie json-p-x webservices das können?

War es hilfreich?

Lösung

Ich sehe eine offensichtliche Art und Weise nicht, dass mit YQL zu tun, aber hier ist ein Yahoo-Rohr, das zu funktionieren scheint. Es weigert Seiten zu bekommen, die durch ihre robots.txt nicht anerkannt werden, aber es wird die gesamte Quelle für andere Websites bekommen:

http://pipes.yahoo.com/pipes/pipe.info ? _id = dCsGDO123hG6BNv70EypaA

Der Standard auf www.example.com gesetzt, die auf dieser Seite wegen der robots.txt verweigert. Allerdings nimmt es die URL als Parameter. Hier ist ein Link zu einem Beispiel für die Verwendung dieses Rohrs, das die Quelle von pipes.yahoo.com bekommt und gibt das Ergebnis in JSON gewickelt:

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

Ist diese Hilfe?

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top