Регулярное выражение для соответствия всем тегам HTML, кроме <p>и</p>

На мой взгляд, попытка разобрать divs HTML с помощью чего-либо, кроме regex синтаксического анализатора perl HTML, просто требует много regular-expressions боли. HTML — это действительно сложный regular-expression язык (что является одной div-layouts из основных причин создания html-tag XHTML, который намного проще, чем webpage HTML).

Например, это:

 /
    

— это perl-regex полный, на 100 % правильный webpage формат и на 100 % правильный perl5 HTML-документ. (Ну, здесь html5 отсутствует объявление DOCTYPE, но html кроме этого...)

Это семантически html эквивалентно


  
    
      >
    
  
  
    

>

Тем не менее, вам div придется иметь дело с действительным webpage HTML. Вы могли бы, конечно, разработать perl регулярное выражение для perl-regex его разбора, но, как уже divs предлагали другие, использовать regex-php настоящий парсер HTML намного perl-regex проще.

html

regex

perl

2022-10-18T11:33:55+00:00
Вопросы с похожей тематикой, как у вопроса:

Регулярное выражение для соответствия всем тегам HTML, кроме <p>и</p>