Class Tagger


  • public final class Tagger
    extends java.lang.Object
    形態素解析を行うクラス
    • Constructor Summary

      Constructors 
      Constructor Description
      Tagger​(java.lang.String dataDir)
      バイナリ辞書を読み込んで、形態素解析器のインスタンスを作成する
    • Method Summary

      All Methods Instance Methods Concrete Methods 
      Modifier and Type Method Description
      java.util.List<Morpheme> parse​(java.lang.CharSequence text)
      形態素解析を行う
      java.util.List<Morpheme> parse​(java.lang.CharSequence text, java.util.List<Morpheme> result)
      形態素解析を行う
      java.util.List<java.lang.String> wakati​(java.lang.CharSequence text)
      分かち書きを行う
      java.util.List<java.lang.String> wakati​(java.lang.CharSequence text, java.util.List<java.lang.String> result)
      分かち書きを行う
      • Methods inherited from class java.lang.Object

        clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
    • Constructor Detail

      • Tagger

        public Tagger​(java.lang.String dataDir)
               throws java.io.FileNotFoundException,
                      java.io.IOException
        バイナリ辞書を読み込んで、形態素解析器のインスタンスを作成する
        Parameters:
        dataDir - バイナリ辞書があるディレクトリ
        Throws:
        java.io.FileNotFoundException - 間違ったディレクトリが指定された場合に送出される
        java.io.IOException - その他の入出力エラーが発生した場合に送出される
    • Method Detail

      • parse

        public java.util.List<Morpheme> parse​(java.lang.CharSequence text)
        形態素解析を行う
        Parameters:
        text - 解析対象テキスト
        Returns:
        解析結果の形態素のリスト
      • parse

        public java.util.List<Morpheme> parse​(java.lang.CharSequence text,
                                              java.util.List<Morpheme> result)
        形態素解析を行う
        Parameters:
        text - 解析対象テキスト
        result - 解析結果の形態素が追加されるリスト
        Returns:
        解析結果の形態素リスト. parse(text,result)=result
      • wakati

        public java.util.List<java.lang.String> wakati​(java.lang.CharSequence text)
        分かち書きを行う
        Parameters:
        text - 分かち書きされるテキスト
        Returns:
        分かち書きされた文字列のリスト
      • wakati

        public java.util.List<java.lang.String> wakati​(java.lang.CharSequence text,
                                                       java.util.List<java.lang.String> result)
        分かち書きを行う
        Parameters:
        text - 分かち書きされるテキスト
        result - 分かち書き結果の文字列が追加されるリスト
        Returns:
        分かち書きされた文字列のリスト. wakati(text,result)=result