استيراد البيانات المرتبطة برقم CAS معين من موقع ويب NIST WebBook إلى R

StackOverflow https://stackoverflow.com//questions/20004779

  •  20-12-2019
  •  | 
  •  

سؤال

أود استرداد المعلومات المرتبطة برقم تسجيل CAS المعطى (خدمة الملخصات الكيميائية NR) من موقع الويب الخاص ب NIST Webbook في R، باستخدام API المقدمة.

e.g. ل CAS NR. "19431-79-9" (Caryophylladienol II)، http:// webbook. nist.gov/cgi/cbook.cgi؟id=19431-79-9&؛units=si&mask=2000#gas-chrom حصلت بقدر

giveacodicetagpre.

من البتات التالية من الإخراج الخام، أود بعد ذلك استخراج المتغيرات والقوائم التالية:

giveacodicetagpre.

أي أفكار حول كيفية القيام بأفضل أنواع التحليل الأخير؟ من الناحية المثالية، يجب إلغاء هذا كل شيء في وظيفة تأخذ قائمة BAS NRS كمدخلات، وصرح لهم باستخدام معلومات من كتاب WebBook NIST، ويكتبها إلى ملف نصي. ولكن لا حاجة للحصول عليها مصقول جدا - أي شيء يجب أن يبدأ لي سيساعد حقا!

تحرير: لقد كنت أحاول تحليل ملف HTML باستخدام HTMLTreeparse في حزمة XML، لكنني لست نجما تماما. هل سيكون أي شخص آخر مزيد من الخبرة مع هذه الوظيفة قادرا على مساعدتي قليلا بأي فرصة؟

تحرير: لقد اكتشفت حلا لاستيراد البيانات في الرياضيات، وانظر https://mathematica.stackexchange.com/Questions/37091/Look-Up-info-association-With-Aith-CAn-Civen-Chemical من From-the-nist-webbo . إذا كان لدى أي شخص مهارة لموافذ هذا الرمز إلى ص من فضلك اسمحوا لي أن أعرف!

هل كانت مفيدة؟

المحلول

لأول سلسلة URL الأولى في سؤالك، حاول

giveacodicetagpre.

الاستيلاء على جميع القوائم بلقب جريء (تم اقتطاع بعض الإخراج لعرضه)

giveacodicetagpre.

إذا كنت تكتب فقط إلى ملف، فيمكنك إصلاح القائمة المحددة في العنصر 8 (استبدل خطوط نيو مربعات فاصلة منقوطة) وإزالة الخطوط الجيونية المتبقية.

giveacodicetagpre.

استخدم Readhtmltable للجدول

giveacodicetagpre.

ثم عد الصفوف للعثور على الجدول الصحيح والحصول على القيم

giveacodicetagpre.

أخيرا، جدم وكتابة إلى ملف

giveacodicetagpre.

هناك طرق أخرى للاستيلاء على القيم في قوائم غير مرتبة، على سبيل المثال، للحصول على جميع أجهزة التصوير المجسمة كمتجاهج ...

giveacodicetagpre.

ثم اكتب أسطر متعددة إلى ملف بدلا من ذلك.

giveacodicetagpre.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top