
Eu tenho um wysiwyg em um site.O problema é que os usuários estão copiando e colando muitos dados nele, deixando muitas tags div não fechadas e formatadas incorretamente que estão quebrando o layout do site.

Existe uma maneira fácil de remover todas as ocorrências de <div> e </div>?

str_replace não funcionará porque alguns dos divs têm estilos e outras coisas neles, então seria necessário levar em conta <div style="some styling"> <div align="center"> etc.

Suponho que isso poderia ser feito com uma expressão regular, mas sou totalmente iniciante quando se trata disso.

Não.Você faz NÃO sempre analise/manipule HTML com expressões regulares.

Regexes não podem ser negociados.Eles não podem ser fundamentados.Eles não entendem html, não entendem xml.E eles vontade absoluta NÃO pare até que sua árvore DOM esteja morta.

Você usa purificador html e/ou DOM manipular a árvore.

Outras dicas

Melhor usar DOM para analisador HTML, mas se você não tiver escolha a não ser usar RegEx, poderá usá-lo assim:

$patterns = array();
$patterns[0] = '/<div[^>]*>/';
$patterns[1] = '/<\/div>/';
$replacements = array();
$replacements[2] = '';
$replacements[1] = '';
echo preg_replace($patterns, $replacements, $html);

Aqui está um exemplo simplificado de como você poderia fazer isso com PHP

     * Removes the divs because why not
    function strip_divs(&$text, $id = 'html') {
      $replacements = array();
      worker($text, $replacements, $id);

      foreach ($replacements as $key => $val) {
        $text = mb_str_replace($key, $val, $text);

      return $text;

    function worker(&$body, &$replacements, $id) {
      static $call_count;
      if (empty($call_count)) {
        $call_count = array();
      if (empty($call_count[$id])) {
        $call_count[$id] = 0;

      if (mb_strpos($body, '</div>')) {
        $body = mb_str_replace('</div>', '', $body);

      if (mb_strpos($body, '<di') !== FALSE) {
        $call_count[$id] ++;
        // Gets the important junk
        $rm               = '<di' . xml_get($body, '<di', '>') . '>';
        // Builds the replacements HTML
        $replacement_html = '';

        $next_id                       = count($replacements);
        $replacement_id                = "[[div-$next_id]]";
        $replacements[$replacement_id] = $replacement_html;

        $body = mb_str_replace($rm, $replacement_id, $body);

        if (mb_strpos($body, '<di') !== FALSE && $call_count[$id] < 200) {
          worker($body, $replacements, $id);

     * Returns text by specifying a start and end point
     * @param str $str
     *   The text to search
     * @param str $start
     *   The beginning identifier
     * @param str $end
     *   The ending identifier
    function xml_get($str, $start, $end) {
      $str = "|" . $str . "|";
      $len = mb_strlen($start);
      if (mb_strpos($str, $start) > 0) {
        $int_start = mb_strpos($str, $start) + $len;
        $temp      = right($str, (mb_strlen($str) - $int_start));
        $int_end   = mb_strpos($temp, $end);
        $return    = trim(left($temp, $int_end));
        return $return;
      else {
        return FALSE;

    function right($str, $count) {
      return mb_substr($str, ($count * -1));

    function left($str, $count) {
      return mb_substr($str, 0, $count);

     * Multibyte str replace
    if (!function_exists('mb_str_replace')) {

      function mb_str_replace($search, $replace, $subject, &$count = 0) {
        if (!is_array($subject)) {
          $searches     = is_array($search) ? array_values($search) : array($search);
          $replacements = is_array($replace) ? array_values($replace) : array($replace);
          $replacements = array_pad($replacements, count($searches), '');
          foreach ($searches as $key => $search) {
            $parts   = mb_split(preg_quote($search), $subject);
            $count += count($parts) - 1;
            $subject = implode($replacements[$key], $parts);
        else {
          foreach ($subject as $key => $value) {
            $subject[$key] = mb_str_replace($search, $replace, $value, $count);
        return $subject;


    echo strip_divs($html);
