Obter conteúdo entre duas cordas PHP
-
22-07-2019 - |
Pergunta
O que está é a melhor maneira de obter o conteúdo entre duas cordas por exemplo.
ob_start();
include('externalfile.html'); ## see below
$out = ob_get_contents();
ob_end_clean();
preg_match('/{FINDME}(.|\n*)+{\/FINDME}/',$out,$matches);
$match = $matches[0];
echo $match;
## I have used .|\n* as it needs to check for new lines. Is this correct?
## externalfile.html
{FINDME}
Text Here
{/FINDME}
Por alguma razão isso parece trabalhar em um lugar no meu código e não outra. Eu vou sobre isso da maneira certa? Ou há uma maneira melhor?
Também é buffer de saída a maneira de fazer isso ou file_get_contents?
Agradecemos antecipadamente!
Solução
- Use
#
vez de/
para que você não tem que escapar deles. - modificador
s
faz.
e\s
também incluir novas linhas. -
{
e}
tem várias funcionalidades como de n a m vezes em{n,m}
. -
O básico
preg_match('#\\{FINDME\\}(.+)\\{/FINDME\\}#s',$out,$matches);
-
O avançado para várias marcas etc (estilo não é tão bom pelo javascript).
$delimiter = '#'; $startTag = '{FINDME}'; $endTag = '{/FINDME}'; $regex = $delimiter . preg_quote($startTag, $delimiter) . '(.*?)' . preg_quote($endTag, $delimiter) . $delimiter . 's'; preg_match($regex,$out,$matches);
Coloque este código em uma função
- Para qualquer arquivo que você não quer execue qualquer vadios código php, você deve usar file_get_contents. incluem / exigem não deve mesmo ser uma opção lá.
Outras dicas
Você pode também usar substr e strpos para isso.
$startsAt = strpos($out, "{FINDME}") + strlen("{FINDME}");
$endsAt = strpos($out, "{/FINDME}", $startsAt);
$result = substr($out, $startsAt, $endsAt - $startsAt);
Você vai precisar adicionar a verificação de erros para lidar com o caso em que ele não FindMe.
Eu amo estas duas soluções
function GetBetween($content,$start,$end)
{
$r = explode($start, $content);
if (isset($r[1])){
$r = explode($end, $r[1]);
return $r[0];
}
return '';
}
function get_string_between($string, $start, $end){
$string = " ".$string;
$ini = strpos($string,$start);
if ($ini == 0) return "";
$ini += strlen($start);
$len = strpos($string,$end,$ini) - $ini;
return substr($string,$ini,$len);
}
Também fiz alguns benchmarks bem com ambas as soluções acima e ambos estão dando quase ao mesmo tempo. Você pode testá-lo também. Eu dei as duas funções de um arquivo para ler que tinha cerca de 60000 caracteres (revistos com contagem de palavras de Ms. Word) e ambas as funções resultou em cerca de 0,000999 segundos para encontrar.
$startTime = microtime(true);
GetBetween($str, '<start>', '<end>');
echo "Explodin Function took: ".(microtime(true) - $startTime) . " to finish<br />";
$startTime = microtime(true);
get_string_between($str, '<start>', '<end>');
echo "Subsring Function took: ".(microtime(true) - $startTime) . " to finish<br />";
As quebras de linha pode causar problemas no RegEx, tente remover ou substituí-los por \ n antes do processamento.
I como para evitar o uso de expressão regular, se possível, aqui é uma solução alternativa para buscar todas as cadeias entre duas cordas e retorna uma matriz.
function getBetween($content, $start, $end) {
$n = explode($start, $content);
$result = Array();
foreach ($n as $val) {
$pos = strpos($val, $end);
if ($pos !== false) {
$result[] = substr($val, 0, $pos);
}
}
return $result;
}
print_r(getBetween("The quick brown {{fox}} jumps over the lazy {{dog}}", "{{", "}}"));
Resultado:
Array
(
[0] => fox
[1] => dog
)
function getInbetweenStrings($start, $end, $str){
$matches = array();
$regex = "/$start([a-zA-Z0-9_]*)$end/";
preg_match_all($regex, $str, $matches);
return $matches[1];
}
$str = "C://@@ad_custom_attr1@@/@@upn@@/@@samaccountname@@";
$str_arr = getInbetweenStrings('@@', '@@', $str);
print_r($str_arr);
Esta é uma solução PHP que retorna as cordas encontrada entre as tags em um palheiro. Ele funciona, mas eu não testei para a eficiência. Eu precisava disso e foi inspirado pela resposta de Adam Wright nesta página.
Devolve uma matriz () contendo todas as cadeias de caracteres encontrado entre $ tag e $ end_symbold. $ Tag em $ feno, ou se não $ end_symbol. $ Marcação foi encontrada, por conseguinte, nenhum par de tags existe no $ feno.
function str_between_tags($haystack, $tag, $end_symbol){
$c_end_tags = substr_count($haystack, $end_symbol.$tag);
if(!$c_end_tags) return FALSE;
for($i=0; $i<$c_end_tags; $i++){
$p_s = strpos($haystack, $tag, (($p_e)?$p_e+strlen($end_symbol.$tag):NULL) ) + strlen($tag );
$p_e = strpos($haystack, $end_symbol.$tag, $p_s);
$result[] = substr($haystack, $p_s, $p_e - $p_s);
}
return $result;
}
Uma forma rápida de colocar tudo em uma string.
$newlines = array("\t","\n","\r","\x20\x20","\0","\x0B");
$one_string = str_replace($newlines, "", html_entity_decode($content));