投稿

6月, 2020の投稿を表示しています

CSV.jl 0.7 から CSV ファイルの DataFrame への読み込み様式の変更

CSV.jl 0.7 から CSV ファイルの DataFrame への読み込み様式は、`CSV.read` から変更になりました。 データのある位置を、 julia> dataPath = "/Users/testUser/Google ドライブ/testFolder/test.csv" #ファイル例 とした時に julia> df = CSV.File(dataPath) |> DataFrame! または julia> df = DataFrame!( CSV.File(dataPath) ) と、DataFrame で読み込むことを明記する様式になりました。 注意は、`DataFrame!` と `!` を付ける方が良いようです。なお、CSV v0.7.1 では、`!` は無くても動きそうです。 CSV.jl の DataFrames.jl への依存を解消したかった様です。他の SQLite 形式等への読み込みへも均一的な扱いになったようにも感じます。

SudachiPy 0.4.6 って実は高速化していそう。

sudachiPy が、2020年6月11日に、v0.4.6 になりました。Release note を見てみると、 #123 Cython based optimization とあるんですね。もしかすると高速化したかもしれないと考えて、2020年3月の https://evrythingonmac.blogspot.com/2020/03/sudachipy-python-pycall-julia.html の源氏物語を同じ様に処理してみます。 julia> hoge = main(text1); 1049 milliseconds 2020年3月は、4668 milliseconds でしたから、なんと、4倍高速化しているかもしれません。