الانتقال من Scrubyt إلى Nokogiri- الكتابة إلى XML أو Hash؟
-
18-09-2019 - |
سؤال
أحاول نقل هذا القليل من الكود من SCRUPYT إلى Nokogiri، وأنا عالق في محاولة لكتابة نتائجي إما بتجميل أو XML. في SCRUPYT يبدو الأمر كما يلي:
require 'rubygems'
require 'scrubyt'
result_data = Scrubyt::Extractor.define do
fetch "http://www.amazon.com/gp/offer-listing/0061673730"
results "//div[@class='resultsset']" do
item "//tbody/tr" do
condition "//div[@class = 'Condition']"
price "//span[@class = 'price']"
shipping "//span[@class = 'price_shipping']"
end
end
end
@description = result_data.to_xml
return @description
end
مع Nokogiri يمكنني تحليل المعلومات التي أريدها، ولكن لا يبدو أن هناك طريقة سريعة لإرجاع العناصر في مستند التجزئة أو XML. إليك كل ما لدي في Nokogiri.
require 'rubygems'
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.amazon.com/gp/offer-listing/0061673730'))
doc.css('div.condition, span.price, span.price_shipping ').each do |item|
puts item.content
end
كيف سيتم إرجاع معلومات عنصر واحد إما XML أو Hash؟
المحلول
يمكنك استعمال ال باني لبناء XML.
builder = Nokogiri::XML::Builder.new do |xml|
xml.root {
xml.items {
doc.css('div.condition, span.price, span.price_shipping').each do |o|
xml.item_content = o
end
}
}
end
puts builder.to_xml
نصائح أخرى
اكتشفه...
require 'rubygems'
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.amazon.com/gp/offer-listing/0061673730'))
builder = Nokogiri::XML::Builder.new do |xml|
xml.root {
doc.xpath('//tbody[@class="result"]').each do |res|
xml.result {
res.css('span.price').each do |p|
xml.price = p.content
end
res.css('span.price_shipping').each do |s|
xml.ship = s.content
end
}
end
}
end
puts builder.to_xml
نتائج:
<?xml version="1.0"?>
<root>
<result>
<price=>$6.09</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$6.48</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.12</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.31</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.52</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.52</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$11.53</price=>
</result>
<result>
<price=>$7.56</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.61</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.61</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.95</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$7.95</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$8.59</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$8.99</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$10.05</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$10.32</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$10.32</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$10.55</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$10.56</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$11.42</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$11.59</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$11.90</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$11.95</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$12.07</price=>
<ship=>+ $3.99</ship=>
</result>
<result>
<price=>$12.35</price=>
<ship=>+ $3.99</ship=>
</result>
</root>
شكرا! هذا هو بالضبط ما أحتاجه. أواجه مشكلة في حلقات بشكل صحيح.
require 'rubygems'
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open('http://www.amazon.com/gp/offer-listing/0061673730'))
builder = Nokogiri::XML::Builder.new do |xml|
xml.root {
xml.item {
doc.css('span.price').each do |o|
xml.price = o
doc.css('span.price_shipping').each do |o|
end
end
}
}
end
puts builder.to_xml
هذا يعيد هذا:
<?xml version="1.0"?>
<root>
<item>
<price=><span class="price">$6.09</span></price=>
<price=><span class="price">$6.48</span></price=>
<price=><span class="price">$11.95</span></price=>
<ship=><span class="price_shipping">+ $3.99</span></ship=>
<ship=><span class="price_shipping">+ $3.99</span></ship=>
<ship=><span class="price_shipping">+ $3.99</span></ship=>
</item>
</root>
كيف يمكنني إعادة كتابة التعليمات البرمجية لإرجاع شيء مثل هذا:
<?xml version="1.0"?>
<root>
<item>
<price=><span class="price">$6.09</span></price=>
<ship=><span class="price_shipping">+ $3.99</span></ship=>
</item>
<item>
<price=><span class="price">$6.48</span></price=>
<ship=><span class="price_shipping">+ $3.99</span></ship=>
</item>
<item>
<price=><span class="price">$11.95</span></price=>
<ship=><span class="price_shipping">+ $3.99</span></ship=>
</item>
</root>
قد ترغب في حذف "=" في XML.Price = p.content
لا تنتمي إلى StackOverflow