【R】ggwordcloud

1. はじめに

ggwordcloudは、形態素解析の結果を可視化できるパッケージです。正確には、形態素解析に限りませんが。

wordcloudとwordcloud2.jsのハイブリッドなパッケージらしいです。

こちらで青空文庫からデータを取得しましたので、同じく新渡戸稲造の「我が教育の欠陥」のデータを使って、可視化してみます。

2. インストール

CRANよりインストールできます。

install.packages("ggwordcloud")

3. 使ってみる

library("tidyverse")
library("RMeCab")
library("ggwordcloud")

dat_txt <- "NORUBY/50532_2.txt" %>% 
  read.table(stringsAsFactors = FALSE,
             header = FALSE)

mecab_results <- dat_txt %>%
  RMeCabDF()

dat <- mecab_results %>% 
  imap_dfr( ~ data.frame(term = ., 
                         class = names(.), 
                         sentences = .y, 
                         stringsAsFactors = F)) 

set.seed(42)
ggplot(
  dat,
  aes(label = term, size = sentences*10)) +
  geom_text_wordcloud_area() 

4. さいごに

たくさんの機能があるようですが、とりあえずここまで。しかし、形態素解析まで手を出すと時間がないな・・・。

Add a Comment

メールアドレスが公開されることはありません。