開発メモ

単語クラスタリング 続き

色々考えていて、実につまらないことに悩んでいた、ということが分かりました。 というのも、前に載せた表の単語Wnは、文書Dmから抽出した単語だったんですね。あー、あほや。 クラスタリングの素性である文書とは無関係の単語を持ってこれば、問題ないんで…

単語クラスタリング

単語のクラスタリングをしています。 文書のクラスタリングが単語の出現(tf*idfとか)を素性にして行われているので、それを転置すりゃ単語のクラスタリングもできんじゃね、と思ってやってみましつた。で、結果がまあ出てはきたんですけど、ふと疑問に思い…