Julia の aggregate 関数で 「群ごとの平均値を求める」 または、「ダブりのある測定値を平均値で代表させる」
Julia の aggregate 関数を使うと、「群ごとの平均値を求める」 または、「ダブりのある測定値を平均値で代表させる」 などが、簡単にできます。後者は、R でいう場合の 「 重複した 'row.names' は許されません 」 などというエラーへの対応として aggregate を使える可能性があるという意味でもあります。 おなじみの iris を例にとりましょう。iris の Species すなわち setosa, versicolor, virginica の3種について、それぞれの4測定値 Sepal.Length, Sepal.Width ,Petal.Length, Petal.Width の平均を求めます。 aggregate(iris, : Species, mean) であります。R の場合よりも書式が少しシンプルです。 SD は std で良いようです。 using RDatasets iris = dataset("datasets", "iris") aggregate(iris, :Species, [mean, std]) これで、下記のように結果が出ます。(ズレていたら、ごめんなさい) 3×9 DataFrames.DataFrame │ Row │ Species │ SepalLength_mean │ SepalLength_std │ SepalWidth_mean │ SepalWidth_std │ PetalLength_mean │ PetalLength_std │ PetalWidth_mean │ PetalWidth_std │ ├─────┼──────────────┼──────────────────┼─────────────────┼─────────────────┼────────────────┼──────────────────┼─────────────────┼─────────────────┼────────────────┤ │ 1 │ "setosa" │ 5.006 │ 0.35249 │ 3.428 ...