言語評価

「言語評価」の編集履歴(バックアップ)一覧はこちら

言語評価」(2015/08/23 (日) 19:02:55) の最新版変更点

追加された行は緑色になります。

削除された行は赤色になります。

自然言語、人工言語の評価基準というか指標を考えてみるページ。 PDICとか辞書データを基に評価値を算出する。 語義定義 Wx 語彙数。 幻日辞典でいうとこの「見出し」数 Mx 訳語数。 幻日辞典でいうとこの「訳語」数。 表記ゆれもあるので(ざっぱなカウントで品詞ごと)1行単位。 Ex 例文数。 幻日辞典でいうとこの「用例」数。 1文1ポイント。 Cx 文化記事数。 幻日辞典でいうとこの「文化」数。 1文1ポイント。dolmiyuみたいにすんごい長くても1語に文化欄が付いていれば1ポイント。 ここから指標値の定義。 Rep 再解釈多重度 CountOf(Mx) / CountOf(Wx) 訳語数÷語彙数 全訳語数を全語彙数で割ることで一つの語に対して どのくらいの意味を割り当てているのかの密度を得る。 1語1意で1.00。複数、たとえば名詞、動詞を兼ねているなら2.00。 Var 言語間再解釈多重度 Rep2÷Rep1 比較先の言語の再解釈多重度 ÷ 比較基準とする言語の再解釈多重度 Exv 用例充実度 CountOf(Ex) / CountOf(Wx) 例文数÷(例文で使用されているユニーク(重複なし)な語彙数) 一つの単語に対しての例文密度。高いほど用例が充実している。 Ref 合成可能性 CountOf(合成語) / CountOf(合成元語彙(ユニークな語彙数))

表示オプション

横に並べて表示:
変化行の前後のみ表示:
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。