Параметры очистки HTML
/autoCorrectedTags=<tag>[;...]
Используйте эту опцию, чтобы определить автоматически закрывающиеся HTML-теги.
Например, XHTML использует следующий синтаксис:
<ul> <li>item1</li> <li>item2</li> </ul>
Таким образом, тег <li> должен иметь закрывающий тег </li>.
Чтобы разобрать HTML без закрывающего тега, необходимо добавить его в параметр autoCorrectedTags.
<ul> <li>item1 <li>item2 </ul>
Значение по умолчанию для этой опции содержит теги: li, p и a.
Вы можете изменить значение по умолчанию в файле конфигурации.
/cleanHtml
Используйте эту опцию для очистки загруженных HTML-файлов.
Вы можете также использовать отдельный режим clean-html для очистки локальных файлов и поиска правильных вариантов очистки.
Вы можете настроить правила очистки с помощью файла конфигурации и следующих опций вывода:
/autoCorrectedTags, /cutAttributes, /cutComments, /cutIDs, /cutTags
/cutAttributes=<attribute>[;...]
Используйте эту опцию для удаления указанных атрибутов HTML в режиме clean-html или с опцией /cleanHtml.
Например:
/cutAttributes=data-vars-event-action,data-vars-event-label
/cutComments
Используйте эту опцию для удаления комментариев HTML в режиме clean-html или с опцией /cleanHtml.
/cutIDs=<id>[;...]
Используйте эту опцию для удаления узлов HTML с указанными значениями идентификатора в режиме clean-html или с опцией /cleanHtml.
Например, вы можете использовать эту опцию, чтобы удалить элементы навигации и рекламы.
/cutScripts
Используйте эту опцию, чтобы удалить теги HTML script и noscript, а также атрибуты событий on* в режиме clean-html или с опцией /cleanHtml.
/cutStyles
Используйте эту опцию, чтобы удалить теги стиля HTML, а также атрибуты стиля и класса в режиме clean-html или с опцией /cleanHtml.
/cutTags=<tag>[;...]
Используйте эту опцию для удаления узлов HTML с указанными тегами в режиме clean-html или с опцией /cleanHtml.
Например:
/cutTags=amp-install-serviceworker,amp-state,amp-analytics,amp-user-notification