言語学A

2016年度4Q 担当: 山元啓史

テスト

レポートの提出とその手順

レポート

ポスターセッションの参加とコメント、改善

データのとり方

% tar xvfz kytea-xx.xx.xx.tar.gz
% cd kytea-xx-xx/
% auto-apt run ./configure
% make
% sudo checkinstall
% sudo ldconfig
% cat あなたのtext.txt | kytea | sed -e '{s/\s/\n/g }' | sort | uniq -c | sort -nr | lv
% sudo apt-get install unidic-mecab

でよいはず。

% cat あなたのtext.txt | mecab | grep -v 不要な行の表現 | perl -F'\t' -ane '{print "$F[3]\n"}' | sort | uniq -c | sort -nr > out.txt

これで単語の頻度がでる。LinuxやMacOSのターミナルを使いたくなかったら、形態素解析や単語を数えるサイトにおまかせする。