Получить содержимое между двумя строками PHP

https://stackoverflow.com/questions/1445506

22-07-2019
|

Вопрос

Каков наилучший способ получить содержимое между двумя строками, например

ob_start();
include('externalfile.html'); ## see below
$out = ob_get_contents();
ob_end_clean();

preg_match('/{FINDME}(.|\n*)+{\/FINDME}/',$out,$matches);
$match = $matches[0];

echo $match;

## I have used .|\n* as it needs to check for new lines. Is this correct?

## externalfile.html

{FINDME}
Text Here
{/FINDME}

По какой-то причине кажется, что это работает в одном месте моего кода, а не в другом.Правильно ли я поступаю в этом направлении?Или есть способ получше?

Также является ли выходной буфер способом сделать это или file_get_contents?

Заранее спасибо!

Решение

Использование # вместо того, чтобы / так что вам не нужно от них убегать.
Тот Самый модификатор s делает . и \s также включите новые строки.
{ и } имеет различную функциональность, например, от n до m раз в {n,m}.

Основной

preg_match('#\\{FINDME\\}(.+)\\{/FINDME\\}#s',$out,$matches);

Расширенный для различных тегов и т.д. (стиль не так хорош в javascript).

$delimiter = '#';
$startTag = '{FINDME}';
$endTag = '{/FINDME}';
$regex = $delimiter . preg_quote($startTag, $delimiter) 
                    . '(.*?)' 
                    . preg_quote($endTag, $delimiter) 
                    . $delimiter 
                    . 's';
preg_match($regex,$out,$matches);

Поместите этот код в функцию

Для любого файла, который вы не хотите запускать, любой бродячий в php-коде вы должны использовать file_get_contents.включать / требовать там даже не должно быть опции.

Другие советы

Для этого вы также можете использовать substr и strpos.

$startsAt = strpos($out, "{FINDME}") + strlen("{FINDME}");
$endsAt = strpos($out, "{/FINDME}", $startsAt);
$result = substr($out, $startsAt, $endsAt - $startsAt);

Вам нужно будет добавить проверку ошибок, чтобы обработать случай, когда это не FINDME.

Я люблю эти два решения

function GetBetween($content,$start,$end)
{
    $r = explode($start, $content);
    if (isset($r[1])){
        $r = explode($end, $r[1]);
        return $r[0];
    }
    return '';
}


function get_string_between($string, $start, $end){
    $string = " ".$string;
    $ini = strpos($string,$start);
    if ($ini == 0) return "";
    $ini += strlen($start);   
    $len = strpos($string,$end,$ini) - $ini;
    return substr($string,$ini,$len);
}

Я также сделал несколько тестов с обоими решениями выше, и оба дают почти одинаковое время. Вы также можете проверить это. Я дал обеим функциям файл для чтения, который содержал около 60000 символов (проверено по количеству слов г-жи Ворд), и обе функции дали около 0,000999 секунд на поиск.

$startTime = microtime(true);
GetBetween($str, '<start>', '<end>');
echo "Explodin Function took: ".(microtime(true) - $startTime) . " to finish<br />";

$startTime = microtime(true);
get_string_between($str, '<start>', '<end>');
echo "Subsring Function took: ".(microtime(true) - $startTime) . " to finish<br />";

Разрывы строк могут вызвать проблемы в RegEx, попробуйте удалить или заменить их на \ n перед обработкой.

Я хотел бы избежать использования регулярных выражений, если это возможно, вот альтернативное решение для извлечения всех строк между двумя строками и возврата массива.

function getBetween($content, $start, $end) {
    $n = explode($start, $content);
    $result = Array();
    foreach ($n as $val) {
        $pos = strpos($val, $end);
        if ($pos !== false) {
            $result[] = substr($val, 0, $pos);
        }
    }
    return $result;
}
print_r(getBetween("The quick brown {{fox}} jumps over the lazy {{dog}}", "{{", "}}"));

Результаты:

Array
(
    [0] => fox
    [1] => dog
)

function getInbetweenStrings($start, $end, $str){
    $matches = array();
    $regex = "/$start([a-zA-Z0-9_]*)$end/";
    preg_match_all($regex, $str, $matches);
    return $matches[1];
}


$str = "C://@@ad_custom_attr1@@/@@upn@@/@@samaccountname@@";
$str_arr = getInbetweenStrings('@@', '@@', $str);

print_r($str_arr);

Это решение PHP, которое возвращает строки, найденные между тегами в стоге сена. Это работает, но я не проверял эффективность. Я нуждался в этом и был вдохновлен ответом Адама Райта на этой странице.

Возвращает array (), содержащую все строки, найденные между $ tag и $ end_symbold. $ tag в $ haystack, или FALSE, если тега $ end_symbol. $ не найдено, следовательно, в $ haystack нет пары тегов.

function str_between_tags($haystack, $tag, $end_symbol){
    $c_end_tags = substr_count($haystack, $end_symbol.$tag);
    if(!$c_end_tags) return FALSE;

    for($i=0; $i<$c_end_tags; $i++){
        $p_s = strpos($haystack, $tag, (($p_e)?$p_e+strlen($end_symbol.$tag):NULL) ) + strlen($tag );
        $p_e = strpos($haystack, $end_symbol.$tag, $p_s);
        $result[] = substr($haystack, $p_s, $p_e - $p_s);
    }
    return $result;
}

Быстрый способ поместить все в одну строку.

$newlines = array("\t","\n","\r","\x20\x20","\0","\x0B");
$one_string = str_replace($newlines, "", html_entity_decode($content));

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow