Выделение требуемых тегов

Используя регулярное выражение, полученное на предыдущем шаге, мы можем выделить из текста сразу несколько типов тегов, используя конструкцию «альтернативная последовательность при отсутствии совпадения слева». В описании используем термин «альтернативная последовательность».

Добавим выделение из текста всего содержимого абзацев и пунктов списка:

Найдём подстроку '<'

Начнём захватывать символы в последовательность

подстроку 'p'

Добавим альтернативную последовательность

подстроку 'li'

Завершим захватывать совпадения

Произведём проверку на удачное совпадение справа набора символов '\s>'

Захватим 0 или более символов, не совпадающих с набором символов '>'

Захватим подстроку '>'

Начнём захватывать символы в последовательность
1. Начнём захватывать символы в несохраняющую последовательность
  1. Начнём проверку на отсутствие удачного совпадения справа последовательности из
    1. '</'
    2. совпадение найденное на шагах 2-3 (ссылка на последовательность 1)
    3. '>'
    4. Завершим проверку
    5. Захватим любой символ
    6. Завершим захватывать совпадения
    7. Захватим последовательность 0 или более раз
    8. Завершим захватывать совпадения
    9. Захватим подстроку '</'
    10. Захватим совпадение найденное на шагах 2-3 (ссылка на последовательность 1)
    11. Захватим подстроку '>'
    12. <
    13. (
      1. p
      2. |
      3. li
      4. )
      5. (?=[\s>])
      6. [^>]*
      7. >
      8. (
        
        (?:
        
        (?!
        
        </
        
        \1
        
        >
        
        )
        
        .
        
        )
        
        *
        
        )
        
        </
        
        \1
        
        >
        
        Новое регулярное выражение:
        
        <(p|li)(?=[\s>])[^>\w]*>((?:(?!</\1>).)*))</\1>
        
        Теперь в тексте будут выделены только теги p и li и всё их содержимое.
        
        Содержание раздела