こんにちは、ヤク学長です。
今回は、「Rでデータベースを理解しよう」を紹介します。
⇩前回の講座を受けていない方はこちらからどうぞ⇩
Rで「データベース」を理解しよう
Step1 : Rでデータベースの基礎を学ぼう
データフレームを作成していきましょう!
ただ、データフレームは「インポート」行う事で、データフレームが勝手に作成されます。
そのため、あくまで、基本を理解するために、1度だけ作成してみましょう。
データフレームを作成するためには、data.frame関数を利用します。
この関数の使い方は全く難しくないのでご安心ください。
例:data.frame(<列名>=<ベクトル>, <列名>=<ベクトル>, … )
と記述する事がベースになります。
numberという名称と、indexという名称に、c()でベクトルを作成して代入します。
data.frame(
number = c(1,2,3),
name = c(“あ”,”い”,”う”)
)
もちろん、変数を代入することも可能です。
vec_num <- c(1,2,3)
vec_name <- c(“あ”,”い”,”う”)
data.frame(number = vec_num, name = vec_name)
という様に、ベクトルを他の変数に代入することもできます。
※注意:表の要素数が異なる場合、エラーがでます。
data.frame(
number = c(1,2,3),
name = c(“あ”,”い”,”う”,”え”)
)
ベクトルの行数が異なると結果はでませんね。
ただし、以下の場合の最大の行数の整数倍になっている場合は、エラーは起こらず複製されます。
data.frame(
number = c(1,2),
name = c(“あ”,”い”,”う”,”え”)
)
以上、データフレームの作成の方法です。
Step2 : Rでデータベースを操作してみよう
今度は、表に名前をつけましょう。
menu <- data.frame(number = c(1,2),
name = c(“あ”,”い”,”う”,”え”))
これで、名前のついた表がRに読み込まれるはずです。
今回は主にView()と$の使い方を解説します。
View()
まず、View関数です。「V」が大文字な事に注意してください。
関数の形を思い出してください「文字列+()」でしたね。この中に、menuを入れて実行すると、
menu <- data.frame(number = c(1,2),
name = c(“あ”,”い”,”う”,”え”))
View(menu)
このように作成した表を表示できます。
続いて、「$」ドルサインは、ベクトルを取り出したい時に便利なものです。
menu <- data.frame(number = c(1,2,3),
name = c(“あ”,”い”,”う”,”え”)
で作った表で、nameをベクトルとして取り出したい場合は、
menu$name
でとりだせます。
menu$number
とりだせましたね。
また、$記号を利用すれば、新しい変数を作成することも可能です。
menu$new_number
存在していない列を取り出そうとすると、NULL(存在していない)ことを示す結果が返ってきます。
menu$new_number <- c(10,20,30,40)
取り出すのではなく、代入してあげると、
View(menu)
で代入した結果が表示されます。
このように$記号をデータフレームと合わせて使うと新しい変数を作成することができます。
また、すでに存在する列名を指定して代入することも可能です。
menu$number <- c(10,20,30,40)
menu$name <- “あいうえお”
menu
このように列にベクトルを代入することができます。
また、nameは、要素の長さ1のベクトルですが、代入されています。
ただし、
menu$name <- c(“x1”,”x2”)
はエラーは出ませんが、
menu$name <- c(“x1”,”x2”,”x3”)
は行数の整数倍でないため、エラーがでます。
以上です。
お疲れ様です。データフレームが理解できましたね。
データ分析では、複数のデータフレームをくっつけたり、
加工したり、抽出したりして、形を整えてから分析します。
次からは、「パッケージ」についての説明です。