tokimikichika/htmlsanitizer
最新稳定版本:v0.2.0
Composer 安装命令:
composer require tokimikichika/htmlsanitizer
包简介
Simple HTML sanitizer library for cleaning HTML tags and extracting plain text
README 文档
README
Простая библиотека для очистки HTML от тегов и извлечения чистого текста.
Установка
composer require tokimikichika/htmlsanitizer
Использование
Простое использование
use Tokimikichika\HtmlSanitizer\HtmlSanitizer; use Tokimikichika\HtmlSanitizer\Service\HtmlCleanerService; use Tokimikichika\HtmlSanitizer\Service\TextNormalizerService; $sanitizer = new HtmlSanitizer( new HtmlCleanerService(), new TextNormalizerService() ); $cleanText = $sanitizer->sanitizeText('<p>Hello <strong>world</strong>!</p>'); // Результат: "Hello world!"
Расширенное использование с кастомными сервисами
use Tokimikichika\HtmlSanitizer\HtmlSanitizer; use Tokimikichika\HtmlSanitizer\Service\HtmlCleanerService; use Tokimikichika\HtmlSanitizer\Service\TextNormalizerService; $sanitizer = new HtmlSanitizer( new HtmlCleanerService(), new TextNormalizerService() ); $cleanText = $sanitizer->sanitizeText($html);
Использование отдельных сервисов
use Tokimikichika\HtmlSanitizer\Service\HtmlCleanerService; use Tokimikichika\HtmlSanitizer\Service\TextNormalizerService; $cleaner = new HtmlCleanerService(); $normalizer = new TextNormalizerService(); $html = $cleaner->removeScriptAndStyleTags($html); $html = $cleaner->removeComments($html); $html = $cleaner->decodeHtmlEntities($html); $text = $cleaner->stripHtmlTags($html); $text = $normalizer->normalizeWhitespace($text);
Архитектура
HtmlSanitizer— основной класс, координирует работу сервисовHtmlCleanerService— очистка HTML (удаление тегов, комментариев, декодирование entities)TextNormalizerService— нормализация текста (пробелы, переносы строк)
Возможности
- Удаляет все HTML теги
- Удаляет script и style теги с содержимым
- Удаляет HTML комментарии
- Декодирует HTML entities
- Нормализует пробелы и переносы строк
- Модульная архитектура для гибкой настройки
Тестирование
composer test
Лицензия
MIT
统计信息
- 总下载量: 37
- 月度下载量: 0
- 日度下载量: 0
- 收藏数: 0
- 点击次数: 0
- 依赖项目数: 1
- 推荐数: 0
其他信息
- 授权协议: MIT
- 更新时间: 2025-10-12