言語評価

自然言語、人工言語の評価基準というか指標を考えてみるページ。
PDICとか辞書データを基に評価値を算出する。

語義定義

Wx
語彙数。
幻日辞典でいうとこの「見出し」数

Mx
訳語数。
幻日辞典でいうとこの「訳語」数。
表記ゆれもあるので(ざっぱなカウントで品詞ごと)1行単位。

Ex
例文数。
幻日辞典でいうとこの「用例」数。
1文1ポイント。

Cx
文化記事数。
幻日辞典でいうとこの「文化」数。
1文1ポイント。dolmiyuみたいにすんごい長くても1語に文化欄が付いていれば1ポイント。


ここから指標値の定義。

Rep 再解釈多重度
CountOf(Mx) / CountOf(Wx)
訳語数÷語彙数
全訳語数を全語彙数で割ることで一つの語に対して
どのくらいの意味を割り当てているのかの密度を得る。
1語1意で1.00。複数、たとえば名詞、動詞を兼ねているなら2.00。

Var 言語間再解釈多重度
Rep2÷Rep1
比較先の言語の再解釈多重度 ÷ 比較基準とする言語の再解釈多重度

Exv 用例充実度
CountOf(Ex) / CountOf(Wx)
例文数÷(例文で使用されているユニーク(重複なし)な語彙数)
一つの単語に対しての例文密度。高いほど用例が充実している。

Ref 合成可能性
CountOf(合成語) / CountOf(合成元語彙(ユニークな語彙数))
最終更新:2015年08月23日 19:02
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。