sastrawi/sentence-detector 问题修复 & 功能扩展

解决BUG、新增功能、兼容多环境部署,快速响应你的开发需求

邮箱:yvsm@zunyunkeji.com | QQ:316430983 | 微信:yvsm316

sastrawi/sentence-detector

最新稳定版本:v1.1.0

Composer 安装命令:

composer require sastrawi/sentence-detector

包简介

PHP library that detects sentence in Bahasa Indonesia.

README 文档

README

Sastrawi Sentence Detector adalah library PHP untuk melakukan deteksi kalimat.

Development Master Releases Statistics
Build Status Code Coverage Scrutinizer Code Quality Build Status Latest Stable Version Total Downloads

Sentence Detector

Indonesia menempati posisi ke-4 negara berpenduduk terbanyak di dunia. Berdasarkan sumber, pada 2013 tercatat Lebih dari 64 juta pengguna facebook berasal dari Indonesia.

Dalam aktivitas sehari-hari, pengguna internet di Indonesia menggunakan Bahasa Indonesia sebagai bahasa utama. Oleh sebab itu, para developer mulai membutuhkan bantuan software untuk melakukan analisa text dalam Bahasa Indonesia. Salah satu tahap analisa tersebut adalah sentence detection atau sentence segmentation, yaitu memecah text menjadi kalimat-kalimat, contohnya:

Saya sedang belajar NLP Bahasa Indonesia. Saya sedang melakukan segmentasi kalimat.

Text di atas terdiri dari 2 kalimat, yaitu:

- Saya sedang belajar NLP Bahasa Indonesia.
- Saya sedang melakukan segmentasi kalimat.

Masih terlihat sederhana, sampai muncul kalimat-kalimat berikut:

Saya belajar NLP di Jl. Prof. Dr. Soepomo SH no. 11. Kapan saya harus ke sana?

Text di atas terdiri dari 2 kalimat, yaitu:

- Saya belajar NLP di Jl. Prof. Dr. Soepomo SH no. 11.
- Kapan saya harus ke sana?

Sastrawi Sentence Detector

  • Library PHP untuk melakukan sentence segmentation pada Bahasa Indonesia.
  • Mudah diintegrasikan dengan framework / package lainnya.
  • Mempunyai API yang sederhana dan mudah digunakan.
  • Terinspirasi oleh Apache OpenNLP.

Demo

http://sastrawi.github.io/sentence-detector.html

Cara Install

Sastrawi Sentence Detector dapat diinstall dengan Composer.

  1. Buka terminal (command line) dan arahkan ke directory project Anda.
  2. Download Composer sehingga file composer.phar berada di directory tersebut.
  3. Tambahkan Sastrawi Sentence Detector ke file composer.json Anda :
php composer.phar require sastrawi/sentence-detector:~1

Jika Anda masih belum memahami bagaimana cara menggunakan Composer, silahkan baca Getting Started with Composer.

Penggunaan

Copy kode berikut di directory project anda. Lalu jalankan file tersebut.

<?php

// demo.php

// include composer autoloader
require_once __DIR__ . '/vendor/autoload.php';

// create sentence detector
$sentenceDetectorFactory = new \Sastrawi\SentenceDetector\SentenceDetectorFactory();
$sentenceDetector = $sentenceDetectorFactory->createSentenceDetector();

// detect sentence
$text = 'Saya belajar NLP Bahasa Indonesia. Saya sedang belajar melakukan segmentasi kalimat.';
$sentences = $sentenceDetector->detect($text);

foreach ($sentences as $i => $sentence) {
    echo "$i : $sentence<br />\n";
}

Lisensi

Sastrawi Sentence Detector dirilis di bawah lisensi MIT License (MIT). Library ini memuat daftar singkatan Bahasa Indonesia dengan lisensi Creative Common BY SA yang bersumber dari http://id.wiktionary.org/wiki/Wiktionary:Daftar_singkatan_dan_akronim_bahasa_Indonesia.

Informasi Lebih Lanjut

统计信息

  • 总下载量: 487
  • 月度下载量: 0
  • 日度下载量: 0
  • 收藏数: 13
  • 点击次数: 3
  • 依赖项目数: 1
  • 推荐数: 1

GitHub 信息

  • Stars: 13
  • Watchers: 3
  • Forks: 2
  • 开发语言: PHP

其他信息

  • 授权协议: MIT
  • 更新时间: 2014-11-23