Importieren von Daten, die mit einer bestimmten CAS-Nummer von der NIST-Webbook-Website in R verbunden sind

StackOverflow https://stackoverflow.com//questions/20004779

  •  20-12-2019
  •  | 
  •  

Frage

Ich möchte Informationen, die mit einer bestimmten CAS-Registrierungsnummer (Chemical Abstracts Service NR) von der NIST-Webbook-Website in R verbunden sind, mithilfe der bereitgestellten API.

z. für CAS nr. "19431-79-9" (Caryophylladienol II), http:// webbuch. nist.gov/cgi/cbook.cgi?id=19431-79-9&lechs=sims=si&mask=2000#Gas-chrom . Ich bin so weit wie

generasacodicetagpre.

Aus den folgenden Bits der Rohausgabe würde ich dann die folgenden Variablen & Listen extrahieren:

generasacodicetagpre.

Irgendwelche Gedanken darüber, wie ich die letztere Art von Analyse am besten mache? Im Idealfall sollte dies dann alle in eine Funktion umwickelt werden, die eine Liste von CAS NRS als Input annimmt, sondern sie mit Informationen aus dem NIST-Webbook annotieren und sie in eine Textdatei schreibt. Aber es brauche es nicht, es so poliert zu haben - alles, was mich anfängt, würde wirklich helfen!

edit: Ich habe versucht, die HTML-Datei mithilfe von HTMLTREEPARSE in Paket XML zu analysieren, aber ich bin nicht ganz erfolgreich. Wäre jemand mit etwas mehr Erfahrung mit dieser Funktion, die mir in der Lage sein kann, mir irgendwelche Chance zu helfen?

edit: Ich habe eine Lösung herausgefunden, um die Daten in Mathematica zu importieren, siehe https://mathematica.steckexchange.com/questions/37091/look -up-info-assoziiert-With-A-Given-Cas-Chemical-Identifier -von-the-nist-webbo . Wenn jemand die Fähigkeit zu Port haben würde, den dieser Code zu r angeht, lass es mich wissen!

War es hilfreich?

Lösung

für die erste URL-Zeichenfolge in Ihrer Frage, versuchen Sie es mit

generasacodicetagpre.

Greifen Sie alle Listen mit einem fetten Titel (einige für die Anzeige abgeschnittene Ausgabe)

generasacodicetagpre.

Wenn Sie nur in eine Datei schreiben, können Sie die begrenzte Liste in Element 8 (Ersetzen von Newlines mit Semikolon ersetzen) und entfernen Sie die restlichen Neulinien.

generasacodicetagpre.

Verwenden Sie readhtmltable für Tabellen

generasacodicetagpre.

Zählen Sie dann Zeilen, um die richtige Tabelle zu finden und Werte zu erhalten

generasacodicetagpre.

kombinieren Sie schließlich und schreiben Sie eine Datei

generasacodicetagpre.

Es gibt andere Möglichkeiten, die Werte in ungeordneten Listen zu ergreifen, um beispielsweise alle Stereoisomere als Vektor zu erhalten ...

generasacodicetagpre.

und schreibe stattdessen mehrere Zeilen in eine Datei.

generasacodicetagpre.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top