pandas は、Python においてデータ解析を支援する機能を提供するライブラリです。特に、数表および時系列データを操作するためのデータフレーム (DataFrame) オブジェクトを提供しています。pandas という名称は、計量経済学の用語 'Panel Data' に由来するそうです。
Wikipedia より引用・翻訳、編集
Python でのデータ解析には欠かせないライブラリ pandas ですが、read_csv メソッドで CSV ファイルを読み込むときに、ファイルが zip などで圧縮されていてもそのファイルをそのまま読み込める、ということを知らなかったので備忘録にしました。
読み込むファイル名の拡張子が ‘.gz’, ‘.bz2’, ‘.zip’, ‘.xz’, ‘.zst’ であれば、それぞれの圧縮形式を認識、展開して読み込みます。
詳細は、下記マニュアルを参照してください。
参考サイト
にほんブログ村
0 件のコメント:
コメントを投稿