定制 tokimikichika/html-parser 二次开发

按需修改功能、优化性能、对接业务系统,提供一站式技术支持

邮箱:yvsm@zunyunkeji.com | QQ:316430983 | 微信:yvsm316

tokimikichika/html-parser

最新稳定版本:v0.1.0

Composer 安装命令:

composer require tokimikichika/html-parser

包简介

HTML page parser by URL

README 文档

README

Простая библиотека для получения HTML по URL и извлечения базовой информации.

Установка

Если используешь как отдельный пакет:

composer require tokimikichika/html-parser

Если используешь в монорепозитории как path-репозиторий, добавь в composer.json:

{
  "repositories": [
    { "type": "path", "url": "../../html-parser" }
  ],
  "require": {
    "tokimikichika/html-parser": "*"
  }
}

Затем:

composer update

Использование

Простое использование

use Tokimikichika\HtmlParser\HtmlParser;

$parser = new HtmlParser();
$html = $parser->fetch('https://example.com');
$title = $parser->getTitle($html);
$links = $parser->getLinks($html);

Обработка ошибок сети

use Tokimikichika\HtmlParser\HtmlParser;
use RuntimeException;

$parser = new HtmlParser();

try {
    $html = $parser->fetch('https://invalid-host');
} catch (RuntimeException $e) {
}

Архитектура

  • HtmlParser — основной класс:
    • fetch(string $url) — получает HTML по URL с таймаутом и валидацией
    • getTitle(string $html) — извлекает <title>
    • getLinks(string $html) — извлекает значения href из ссылок

Возможности

  • Получение HTML с кастомным User-Agent и таймаутом
  • Извлечение заголовка страницы
  • Извлечение ссылок (href) из документа
  • Минимальные зависимости

Тестирование

composer install
composer test

Лицензия

MIT

统计信息

  • 总下载量: 32
  • 月度下载量: 0
  • 日度下载量: 0
  • 收藏数: 0
  • 点击次数: 0
  • 依赖项目数: 0
  • 推荐数: 0

GitHub 信息

  • Stars: 0
  • Watchers: 0
  • Forks: 0
  • 开发语言: PHP

其他信息

  • 授权协议: MIT
  • 更新时间: 2025-10-17