获取两个字符串之间的内容的最佳方法是什么,例如

ob_start();
include('externalfile.html'); ## see below
$out = ob_get_contents();
ob_end_clean();

preg_match('/{FINDME}(.|\n*)+{\/FINDME}/',$out,$matches);
$match = $matches[0];

echo $match;

## I have used .|\n* as it needs to check for new lines. Is this correct?

## externalfile.html

{FINDME}
Text Here
{/FINDME}

由于某种原因,这似乎适用于我的代码中的一个地方,而不是另一个地方。我是否以正确的方式处理这件事?或者,还有更好的方法?

输出缓冲区也是执行此操作的方法还是 file_get_contents ?

提前致谢!

有帮助吗?

解决方案

  • 使用 # 代替 / 所以你不必逃避他们。
  • 修饰语 s 使 .\s 还包括换行符。
  • {} 具有各种功能,例如 n 到 m 次 {n,m}.
  • 基础的

    preg_match('#\\{FINDME\\}(.+)\\{/FINDME\\}#s',$out,$matches);
    
  • 各种标签等的高级(JavaScript 的样式不太好)。

    $delimiter = '#';
    $startTag = '{FINDME}';
    $endTag = '{/FINDME}';
    $regex = $delimiter . preg_quote($startTag, $delimiter) 
                        . '(.*?)' 
                        . preg_quote($endTag, $delimiter) 
                        . $delimiter 
                        . 's';
    preg_match($regex,$out,$matches);
    

将此代码放入函数中

  • 对于任何您不想执行的文件 流浪 php 代码中,您应该使用 file_get_contents。include/require 甚至不应该是那里的一个选项。

其他提示

您可以如用SUBSTR和strpos此。

$startsAt = strpos($out, "{FINDME}") + strlen("{FINDME}");
$endsAt = strpos($out, "{/FINDME}", $startsAt);
$result = substr($out, $startsAt, $endsAt - $startsAt);

您需要添加错误检查和其中不FINDME。

办理情况

我爱这两种解决方案

function GetBetween($content,$start,$end)
{
    $r = explode($start, $content);
    if (isset($r[1])){
        $r = explode($end, $r[1]);
        return $r[0];
    }
    return '';
}


function get_string_between($string, $start, $end){
    $string = " ".$string;
    $ini = strpos($string,$start);
    if ($ini == 0) return "";
    $ini += strlen($start);   
    $len = strpos($string,$end,$ini) - $ini;
    return substr($string,$ini,$len);
}

我也发几个基准以及以上两种溶液并且两者都给出几乎相同的时间。您可以也测试它。我给两个功能的文件读取其中有大约60000个字符(与Word女士的字数审查)和两种功能导致约0.000999秒找到。

$startTime = microtime(true);
GetBetween($str, '<start>', '<end>');
echo "Explodin Function took: ".(microtime(true) - $startTime) . " to finish<br />";

$startTime = microtime(true);
get_string_between($str, '<start>', '<end>');
echo "Subsring Function took: ".(microtime(true) - $startTime) . " to finish<br />";

换行符可能会导致问题在正则表达式,试图消除或以\ N个处理之前替换它们。

我喜欢以避免使用正则表达式如果可能的话,这里是替代解决方案中取出两个串之间的所有字符串,返回一个数组。

function getBetween($content, $start, $end) {
    $n = explode($start, $content);
    $result = Array();
    foreach ($n as $val) {
        $pos = strpos($val, $end);
        if ($pos !== false) {
            $result[] = substr($val, 0, $pos);
        }
    }
    return $result;
}
print_r(getBetween("The quick brown {{fox}} jumps over the lazy {{dog}}", "{{", "}}"));

结果:

Array
(
    [0] => fox
    [1] => dog
)
function getInbetweenStrings($start, $end, $str){
    $matches = array();
    $regex = "/$start([a-zA-Z0-9_]*)$end/";
    preg_match_all($regex, $str, $matches);
    return $matches[1];
}


$str = "C://@@ad_custom_attr1@@/@@upn@@/@@samaccountname@@";
$str_arr = getInbetweenStrings('@@', '@@', $str);

print_r($str_arr);

这是返回一个草堆标签之间发现的串的PHP溶液。它的工作原理,但我没有效率测试。我需要这一点,是由亚当·赖特的这个网页上回答启发。

如果没有$ end_symbol。$标签被发现,因此没有标记对在$草堆存在,则返回包含所有$标签和$草堆$ end_symbold。$标签,或FALSE之间发现的字符串的数组()。

function str_between_tags($haystack, $tag, $end_symbol){
    $c_end_tags = substr_count($haystack, $end_symbol.$tag);
    if(!$c_end_tags) return FALSE;

    for($i=0; $i<$c_end_tags; $i++){
        $p_s = strpos($haystack, $tag, (($p_e)?$p_e+strlen($end_symbol.$tag):NULL) ) + strlen($tag );
        $p_e = strpos($haystack, $end_symbol.$tag, $p_s);
        $result[] = substr($haystack, $p_s, $p_e - $p_s);
    }
    return $result;
}

快速的方法来把一切都成一个字符串。

$newlines = array("\t","\n","\r","\x20\x20","\0","\x0B");
$one_string = str_replace($newlines, "", html_entity_decode($content));
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top