JSOUP Stock Cita Scrapping Yahoo Finanzas
-
21-12-2019 - |
Pregunta
usando oraclesql y java
Tengo una "base de datos de tickersymbol" y una "base de datos Stockquote".
Selección de tickersymbols de "goog", "appl", "fb", y "amzn" de la "tickersymboldatabase"
y circulando los símbolos de Ticker al final de la URL de Yahoofinanciamiento.
http://finance.yahoo.com/q?s= (Ticker)
Luego encontrar la cotización de valores, e insertando los datos de la cotización en la "Base de datos Stockquote".
No estoy seguro de cómo usar el selector de JSOUP, o cómo circular los símbolos del ticker al final de la URL de Yahoofinanciamiento
Solución
Aquí hay un ejemplo simple.Por favor, compruebe los TOS, y usted puede preferir la sugerencia de Stanley de recuperarse a través de CSV.Quería mostrar cómo buscarlo en JSOUP.Entrar en Oracle es una pregunta diferente.
String[] codes = {"TSLA", "F", "TM"};
String baseUrl = "http://finance.yahoo.com/q?s=";
String ua = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.33 (KHTML, like Gecko) Chrome/27.0.1438.7 Safari/537.33";
for (String code : codes) {
String url = baseUrl + code;
Document doc = Jsoup.connect(url).userAgent(ua).timeout(10*1000).get();
String price = doc.select(".time_rtq_ticker").first().text();
String name = doc.select(".title h2").first().text();
System.out.println(String.format("%s [%s] is trading at %s", name, code, price));
}
ESTA SALIDAS:
Tesla Motors, Inc. (TSLA) [TSLA] is trading at 135.45
Ford Motor Co. (F) [F] is trading at 17.07
Toyota Motor Corporation (TM) [TM] is trading at 127.98
Me gusta usarla Pruebe JSOUP para probar y depurar las respuestas de la URL y las consultas de los selectores.
Otros consejos
El archivo de salidacomo AppleIncLos datosenhttp://finance.yahoo.com/q;_ylt=Ag5D9mq4OAYIeUaL64JN7QYDyr0F;_ylc=X1MDMjE0MjQ3ODk0OARfcgMyBGZyA3VoM19maW5hbmNlX3dlYl9ncwRmcjIDc2EtZ3AEZ3ByaWQDBG5fZ3BzAzEwBG9yaWdpbgNmaW5hbmNlLnlhaG9vLmNvbQRwb3MDMQRwcXN0cgMEcXVlcnkDQUFQTCwEc2FjAzEEc2FvAzE-?p=http% 3a% 2f% 2ffinance.yahoo.com% 2fq% 3fs% 3daapl% 26ql% 3d0 & type= 2button & fr= uh3_finance_web_gs & uhb= uhb2 & s= AAPL es un archivo CSV.Solo podrías leer el contenido y analizar por coma delimitor.