【R】usdata
2021年6月22日
1. はじめに
usdata
は、US Census, the American Community Survey, the Bureau of Labor Statistics などで提供されたデータをまとめたパッケージです。
2. インストール
CRANからインストールできます。
install.packages("usdata")
3. つかってみる
詳しい使い方はこちら。
まず、略称から正式な州名を求めることができます。
library(usdata) abbr2state(c("IL", "AZ", "MN"))
> abbr2state(c("IL", "AZ", "MN"))
[1] "Illinois" "Arizona" "Minnesota"
逆に正式な州名から略称を求める。
state2abbr("Califolnia")
[1] "CA"
データセットいろいろ
data(county) county
# A tibble: 3,142 x 15
name state pop2000 pop2010 pop2017 pop_change poverty homeownership multi_unit unemployment_ra~ metro median_edu
<chr> <fct> <dbl> <dbl> <int> <dbl> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
1 Autauga ~ Alaba~ 43671 54571 55504 1.48 13.7 77.5 7.2 3.86 yes some_coll~
2 Baldwin ~ Alaba~ 140415 182265 212628 9.19 11.8 76.7 22.6 3.99 yes some_coll~
3 Barbour ~ Alaba~ 29038 27457 25270 -6.22 27.2 68 11.1 5.9 no hs_diploma
4 Bibb Cou~ Alaba~ 20826 22915 22668 0.73 15.2 82.9 6.6 4.39 yes hs_diploma
5 Blount C~ Alaba~ 51024 57322 58013 0.68 15.6 82 3.7 4.02 yes hs_diploma
6 Bullock ~ Alaba~ 11714 10914 10309 -2.28 28.5 76.9 9.9 4.93 no hs_diploma
7 Butler C~ Alaba~ 21399 20947 19825 -2.69 24.4 69 13.7 5.49 no hs_diploma
8 Calhoun ~ Alaba~ 112249 118572 114728 -1.51 18.6 70.7 14.3 4.93 yes some_coll~
9 Chambers~ Alaba~ 36583 34215 33713 -1.2 18.8 71.4 8.7 4.08 no hs_diploma
10 Cherokee~ Alaba~ 23988 25989 25857 -0.6 16.1 77.5 4.3 4.05 no hs_diploma
# ... with 3,132 more rows, and 3 more variables: per_capita_income <dbl>, median_hh_income <int>, smoking_ban <fct>
data(urban_rural_pop) urban_rural_pop
# A tibble: 51 x 5
state urban_in urban_out rural_farm rural_nonfarm
<fct> <int> <int> <int> <int>
1 Alabama 1839901 597814 59349 1543523
2 Alaska 221745 149118 1160 178020
3 Arizona 2656388 550687 6967 451186
4 Arkansas 591609 666589 63589 1028938
5 California 25465911 2105967 150535 2037608
6 Colorado 2377886 337863 45118 533527
7 Connecticut 2455622 145912 5250 680332
8 Delaware 459494 27844 6486 172344
9 District of Columbia 606900 0 0 0
10 Florida 10181184 789261 47436 1920045
# ... with 41 more rows
4. さいごに
アメリカのデータをサッと使いたいときには、重宝しますね。