こんにちは、ヤク学長です。
今回は、「Rでパッケージを理解しよう」を紹介します。
⇩前回の講座を受けていない方はこちらからどうぞ⇩
Rで「パッケージ」を理解しよう
Step1 : Rでパッケージ(インストールと呼び出し)の基礎を学ぼう
今回の目標は、「tidyverse」というパッケージをインストールしてみましょう。
なぜ「tidyverse」を使うのかというと、Rでのデータ分析に必要な機能を簡単にRに追加することができます。
それでは早速、ソース画面で下記を実行してみましょう。
install.packages(“tidyverse”)
※少し時間が掛かる場合があります。エラーメッセージが出ずに終了すれば成功
エラーメッセージが出て、うまくインストールができない場合はご相談ください。
インストールが完了している場合、EnvironmentペーンのGlobal Environmentやパッケージペーンに「tidyverse」が表れています。
それでは、呼び出します。
library(tidyverse)
PackagesペーンのTidyverseにチェックが入り、また、Environmentペーンの読み込まれているパッケージのリストも増えている状態です。
この状態で、パッケージに含まれる関数を呼び出すことができるようになりました。
これらのパッケージの使い方は、今後解説を行います。
Step2 : パッケージ(インストールと呼び出し)を実践してみよう
ここでは、「tidyverse」に含まれる関数群を利用して、イメージだけ掴んでもらいたいと思います。
良く分からなくなる場合は、飛ばしてもらって結構です。
まずは、変数に格納しデータフレームを作ります。
vec_id <- c(1:5)
vec_name <- c(“A”,”B”,”C”,”D”,”E”)
vec_by <- c(2000,2010, 2009, 1992, 1989)
vec_gender <- c(“男”,”女”,”男”,”女”,”男”)
vec_admission <- c(“2020-1-23”, “2020-2-34″,”2020-2-12″,”2020-2-22″,”2020-3-18”)
vec_discharge <- c(“2020-1-31”, “2020-2-12″,”2020-2-10″,”2020-3-14″,”2018-3-17”)
vec_is_dead <- c(0,0,1,0,0)
変数を作成しました。続いて以下のデータフレームを作成します。
menu <- data.frame(
id = vec_id,
name = vec_name,
kaikyuu = vec_by,
seibetu = vec_gender,
admission_date = vec_admission,
discharge_date= vec_discharge,
is_dead = vec_is_dead
)
ここで実際に箱ひげ図を作成してみましょう。
例題:病院の入院時年齢をで男女別にして表してみましょう。
library(tidyverse)
library(lubridate)
menu <- menu %>%
mutate(
age_admission =year(as.Date(admission_date)) -as.numeric(kaikyuu)
)
ggplot(
data = menu,
mapping = aes(x = seibetu,
y = age_admission)
) +
geom_boxplot()
上記を実行してみましょう。グラフが表示されましたね。
ここまで、すんなり理解できるようになっているのではないでしょうか。
以上です。お疲れさまでした。
続いて、関数の理解を更に深めましょう。
加えて、Rの使い方初級編が終了ですので分析編に進んでいきましょう。