ladamalina/lingua-stem-ru
Composer 安装命令:
composer require ladamalina/lingua-stem-ru
包简介
Стеммер Портера. Извлечение корня из русского слова, без словаря.
README 文档
README
Извлечение корня из русского слова, без словаря.
Стеммер Портера — алгоритм стемминга, опубликованный Мартином Портером в 1980 году. Оригинальная версия стеммера была предназначена для английского языка. Впоследствии Мартин создал проект «Snowball» и, используя основную идею алгоритма, написал стеммеры для распространённых индоевропейских языков, в том числе для русского.
Алгоритм не использует морфологический словарь, а только применяя последовательно ряд правил, отсекает окончания и суффиксы, основываясь на особенностях языка, в связи с чем работает быстро, но не всегда безошибочно.
Пример использования:
$stemmer = new LinguaStemRu(); echo $stemmer->stem_word('Автомобиль') . "<br/>"; echo $stemmer->stem_word('Автомобилем') . "<br/>"; echo $stemmer->stem_word('Автомобиля') . "<br/>";
В результате получим три раза слово автомобил.
$stemmer = new LinguaStemRu(); echo $stemmer->stem_text('Любовь к Родине – это очень сильное чувство.');
Получим:
любов к родин – это очен сильн чувство.
统计信息
- 总下载量: 7.57k
- 月度下载量: 0
- 日度下载量: 0
- 收藏数: 26
- 点击次数: 0
- 依赖项目数: 2
- 推荐数: 0
其他信息
- 授权协议: MIT
- 更新时间: 2014-05-04