【R】ggwordcloud
2020年12月9日
1. はじめに
ggwordcloudは、形態素解析の結果を可視化できるパッケージです。正確には、形態素解析に限りませんが。
wordcloudとwordcloud2.jsのハイブリッドなパッケージらしいです。
こちらで青空文庫からデータを取得しましたので、同じく新渡戸稲造の「我が教育の欠陥」のデータを使って、可視化してみます。
2. インストール
CRANよりインストールできます。
install.packages("ggwordcloud")
3. 使ってみる
library("tidyverse")
library("RMeCab")
library("ggwordcloud")
dat_txt <- "NORUBY/50532_2.txt" %>%
read.table(stringsAsFactors = FALSE,
header = FALSE)
mecab_results <- dat_txt %>%
RMeCabDF()
dat <- mecab_results %>%
imap_dfr( ~ data.frame(term = .,
class = names(.),
sentences = .y,
stringsAsFactors = F))
set.seed(42)
ggplot(
dat,
aes(label = term, size = sentences*10)) +
geom_text_wordcloud_area()

4. さいごに
たくさんの機能があるようですが、とりあえずここまで。しかし、形態素解析まで手を出すと時間がないな・・・。