【R】ggwordcloud
2020年12月9日
1. はじめに
ggwordcloud
は、形態素解析の結果を可視化できるパッケージです。正確には、形態素解析に限りませんが。
wordcloudとwordcloud2.jsのハイブリッドなパッケージらしいです。
こちらで青空文庫からデータを取得しましたので、同じく新渡戸稲造の「我が教育の欠陥」のデータを使って、可視化してみます。
2. インストール
CRANよりインストールできます。
install.packages("ggwordcloud")
3. 使ってみる
library("tidyverse") library("RMeCab") library("ggwordcloud") dat_txt <- "NORUBY/50532_2.txt" %>% read.table(stringsAsFactors = FALSE, header = FALSE) mecab_results <- dat_txt %>% RMeCabDF() dat <- mecab_results %>% imap_dfr( ~ data.frame(term = ., class = names(.), sentences = .y, stringsAsFactors = F)) set.seed(42) ggplot( dat, aes(label = term, size = sentences*10)) + geom_text_wordcloud_area()
4. さいごに
たくさんの機能があるようですが、とりあえずここまで。しかし、形態素解析まで手を出すと時間がないな・・・。