◆当ページにはプロモーションが含まれています

お役立ち情報

Pandasの基本的な使い方を覚えよう! – よく使うコマンドたち

みなさん、こんにちは。どんぶラッコです。

みなさんはPandas、使ったことがありますか?

Pythonなどでデータを取り扱うときに多用されるライブラリですね。

ただ、データサイエンティストのように普段からPandasを使ってないときには「どのように使うんだっけ?」とついつい使い方を忘れてしまいがちですよね。

そこで、今回はよく使うPythonのコマンドまとめを作成してみました!

みなさんの学習にぜひお役立てください♪

Pandasの宣言・定義

Pandasをインポートする

import pandas as pd

CSVファイルを読み込む

Python, Jupyter Notebook で読み込む場合

df = pd.read_csv('test.csv')

Collaboratoryで読み込む場合

driveをマウントすることで、Google Driveの情報をインポートすることができます。

その場合、インポートする時には engine="python" を指定しましょう。C言語エンジンで動かす場合は日本語が読み込めずにエラーになってしまいます。

from google.colab import drive
drive.mount('/content/drive')
df = pd.read_csv('test.csv', engine = "python")

また、PandasにはSeriesとDataframeという考え方があります。

Series の集合体がDataframeです。

探索的データ解析

全体感の理解

# データの先頭を表示
df.head()
# データの末尾を表示
df.tail()

データの先頭(末尾)のデータを表示。引数を指定しなければ5行表示されます。

集計

df.shape
# (行, 列)

個数の把握(欠損の有無)

# データの個数
df.count()

# 欠損値のサマリ
df.isnull().sum()

基準の発見

df.describe()

基準となる値(平均値、中央値、最大値、最小値、分散、標準偏差、ユニークなど)を調べる


ここまでできたら次は可視化ですね!matplotlibなどを使っていきましょう。

その記事はまた後日公開します♪

エンジニアにおすすめ転職サイト

マイナビIT AGENT
迷ったらまずはココ。求人数が多いため希望や条件にマッチする求人が見つかる!

レバテックキャリア
担当者のレベルが高い。エンジニア特化で15年の実績がある実績で初回提案での内定率驚異の90%!

JOIN
副業やフリーランスとして高額報酬案件を見つけるならJOIN。未経験者でも案件獲得実績豊富が強み!

\面白いと思ったら/

記事のシェア & Twitter のフォロー をお願いします!

@proglearn
一緒によく読まれている記事

POSTED COMMENT

  1. […] 【文系向け】機械学習を始めてみよう! 学習ステップ&おすすめ情報 6選! 機械学習はハードルが高いと思っていませんか? みなさん、こんにちは。どんぶラッコです。 機械学習は興味ある。でもなかなか勉… Pandasの基本的な使い方を覚えよう! – よく使うコマンドたち みなさん、こ… […]

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です