|
|||||||||
前のクラス 次のクラス | フレームあり フレームなし | ||||||||
概要: 入れ子 | フィールド | コンストラクタ | メソッド | 詳細: フィールド | コンストラクタ | メソッド |
public interface LangModel
ユニグラム言語モデルが最低限実装すべきメソッドを定義します。 ユニグラム言語モデルとは、文書中の語(単語)が前後の単語との依存性がないと仮定して、 単純に語の集合(bag of words)として表現する言語モデルのことです。
このインターフェース中では、語(term)という単語がよく用いられています。 この言語モデルでは、主に英語についての言語モデルを対象としているため、 多くの場合は単語と同じ意味で用いられます。しかし、実装によっては、語は意味を成さないアルファベット列や、 顔文字などの記号列である場合もあります。
インターフェースの中では定義されていませんが、LangModel
インターフェースを実装するクラスは、
それぞれのインスタンスを識別するために、ID を保持することを推奨します。
また、その ID によって自然順序付けを定義することを推奨します。
LangModel
インターフェースを容易に実装するために、AbstractLangModel
クラスが提供されています。
特に制約がない場合は、AbstractLangModel
クラスを拡張することも検討してみてください。
ModelBuilder
,
AbstractLangModel
,
LangModels
メソッドの概要 | |
---|---|
boolean |
containsTerm(java.lang.String term)
語 term が語彙に含まれるかどうかを返します。 |
boolean |
containsTerms(java.util.Collection<java.lang.String> c)
コレクション c に含まれる語が語彙に 1 つ以上含まれるかを返します。 |
java.util.Set<java.lang.String> |
getVocabulary()
この言語モデルの語彙を返します。 |
boolean |
isModifiable()
言語モデルに含まれる語を変更可能かどうかを返します。 |
int |
numOfTerms()
この言語モデルに含まれる語の総数を返します。 |
int |
numOfVocabulary()
この言語モデルに含まれる語の種類数(語彙数)を返します。 |
int |
termCount(java.lang.String term)
語 term の出現回数を返します。 |
float |
termFrequency(java.lang.String term)
語 term の相対頻度を返します。 |
メソッドの詳細 |
---|
int termCount(java.lang.String term)
語 term
の出現回数を返します。
出現回数は頻度とも呼ばれます。通常、このメソッドで返される値は 0 以上です。
term
- 語(通常は単語と同義)
term
の出現回数
java.lang.NullPointerException
- term
が null
である場合。(任意のオペレーション)float termFrequency(java.lang.String term)
term
の相対頻度を返します。
相対頻度とは、全体を 1 とした時の term
の頻度のことです。
通常、このメソッドで返される値は 0 以上です。
term
- 語(通常は単語と同義)
term
の相対頻度
java.lang.NullPointerException
- term
が null
である場合。(任意のオペレーション)int numOfTerms()
int numOfVocabulary()
getVocabulary()
java.util.Set<java.lang.String> getVocabulary()
Set
が返されます。
boolean containsTerm(java.lang.String term)
語 term
が語彙に含まれるかどうかを返します。
このメソッドでは、引数に null
が与えられても基本的には
NullPointerException
をスローすることはありません。
term
- 語
term
が含まれているなら true
getVocabulary()
boolean containsTerms(java.util.Collection<java.lang.String> c)
コレクション c
に含まれる語が語彙に 1 つ以上含まれるかを返します。
c
- 語を含むコレクション
true
java.lang.NullPointerException
- c
が null
である場合getVocabulary()
boolean isModifiable()
言語モデルに含まれる語を変更可能かどうかを返します。
変更可能とは、語の追加や削除の処理が含まれます。
変更可能でない場合は、LangModel
で定義されているメソッドは、
引数に応じて常に一定の値、またはインスタンスを返します。
true
、変更不可能であれば false
|
|||||||||
前のクラス 次のクラス | フレームあり フレームなし | ||||||||
概要: 入れ子 | フィールド | コンストラクタ | メソッド | 詳細: フィールド | コンストラクタ | メソッド |