sudachiPy を、python から使うのと、PyCall 経由の julia で使うのはどちらが早いのか
sudachiPy を、python から使うのと、PyCall 経由の julia で使うのはどちらが早いのか比べてみます。 例文は、なぜか、あの古典で、その訳を青空文庫から落して来ます。青空文庫は shift_JIS のエンコードで、 CR/LF の改行記号です。ターミナルでダウンロードして、エンコードを UTF-8、改行記号を LF に nkf を使って変更します。なお、"さっきダウンロードしたフォルダー" というフォルダーの中にターミナルで `cd` 移動してから開始の前提です。 [ターミナル] % wget https://www.aozora.gr.jp/cards/000052/files/5016_ruby_9746.zip --2020-03-14 16:24:54-- https://www.aozora.gr.jp/cards/000052/files/5016_ruby_9746.zip www.aozora.gr.jp (www.aozora.gr.jp) をDNSに問いあわせています... 59.106.13.115 www.aozora.gr.jp (www.aozora.gr.jp)|59.106.13.115|:443 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 16790 (16K) [application/zip] `5016_ruby_9746.zip.1' に保存中 5016_ruby_9746.zip.1 100%[=============================================>] 16.40K --.-KB/s 時間 0s 2020-03-14 16:24:54 (71.5 MB/s) - `5016_ruby_9746.zip.1' へ保存完了 [16790/16790] [ターミナル] % unzip 5016_ruby_9746.zip Archive: 5016_ruby_9746.zip inflating: 01kiritsubo.txt [ターミナル] % nkf --guess 01k...