محلل دوم بسيط-تجريد الروابط وأقسام محددة من النتيجة

StackOverflow https://stackoverflow.com//questions/23012492

سؤال

أحاول تحليل بعض المحتوى من شعبة محددة وحفظه إلى ملف خارجي.على الرغم من أن هذا يعمل ، لم أتمكن من القيام بما يلي

من ديف مع الطبقة league_container

  1. قم بإزالة جميع الأقسام مع الفصل bar
  2. تجريد جميع الروابط.(اترك النص ولكن أزل a بالإضافة إلى صفاته)

ما لدي حتى الآن هو:

   <?php
    include( 'simple_html_dom.php'); 
    $html = file_get_html('https://some.domain.com/');

    $divContents = array();

    foreach ($html->find('div.league_container') as $div) 
    {
        $divContents[] = $div->outertext;
    }       


file_put_contents('parser/est-results.htm', implode(PHP_EOL, $divContents));
?>

أي مساعدة سيكون موضع تقدير.

هل كانت مفيدة؟

المحلول

استخدام outertext = :

$div->outertext = '';
$a->outertext = $a->text();
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top