開啟掘金成長之旅！這是我參與「掘金日新計劃 · 12 月更文挑戰」的第27天，點擊查看活動詳情

一、Pandas庫

import numpy as np import pandas as pd

二、Pandas庫數據結構——Series, DataFrame

a = pd.Series([1, 2, 3, 4, 5])

編輯

data = np.array([[95, 96, 97], [80, 85, 86], [56, 65, 70]]) frame = pd.DataFrame(data) frame

編輯

我們不難看出來Series, DataFrame的區別：DataFrame更加好看哈哈，接受矩陣數據

詳細見：

pandas中的兩種數據類型Series和DataFrame區別_jolingcome的博客-CSDN博客_series和dataframe區別

1.Series——索引 index，值 values

a = pd.Series([1, 2, 3, 4, 5], index = ['a', 'b', 'c', 'd', 'e']) a

編輯

2.DataFrame——索引index, columns，值 values

frame = pd.DataFrame(data, index=['xiaoming', 'xiaohong', 'xiaohei'], columns=['yuwen', 'yingyu', 'shuxue']) frame

編輯

指定或修改索引方法

創建時：

index, columns 指定索引，已經有索引可以按索引重新排序

創建後：

reindex方法，重新建立索引或指定索引排序

rename 修改索引

``` frame_.rename(index={"xiaohong":"damao","xiaoming":"ermao","xiaohei":"Nicolas Cage"}, columns={"yingyu":"English", "yuwen":"Literature", "shuxue":"Maths"})

Series.index = [] DataFrame.columns = [] ```

三、Series, DataFrame運算

1.基本運算

按照索引位置進行計算

data = {"English":[80,70,60], "Literature":[70,70,85], "Maths":[80,90,50], "Music":["A","B","C"]} df = pd.DataFrame(data,index = ["alpha", "beta","theta"]) df * 2

編輯

DataFrame、Series “相加”時，按照DF的columns(列)進行匹配

``` data1 = {"English":[80,70,60], "Literature":[70,70,85], "Maths":[80,90,50],} df1 = pd.DataFrame(data1,index = ["alpha", "beta","theta"]) add_ = {'Maths':10,'English':10,'Literature':20,'Gym':"A"} add_ = pd.Series(add_)

df1 + add_ ```

編輯

2.矩陣運算、通用函數

df.T

編輯

3.基本統計方法

查看數據的一些

df.describe()

編輯

四、Series, DataFrame 索引與切片

1.Series 索引與切片 Index索引/數字索引/布爾值索引

add_ = {'Maths':10,'English':10,'Literature':20,'Gym':"A"} add_ = pd.Series(add_) add_['Maths']

編輯

2.DataFrame 索引與切片

``` Index索引列：df['Maths'] 行：df.loc[‘alpha’]

數字索引 df.iloc[] 特別的行可以直接用數字切片索引

布爾值索引 ```

五、Series, DataFrame 刪除操作

1.Series刪除操作 pop/drop/del

① del方式：就地刪除

``` x = pd.Series([10,23,31,16],index=list("abcd")) display(x)

刪除了某個索引後，對應的值也就刪除了

del x["b"] display(x) ```

編輯

② drop方式：當指定了inplace=True後，才屬於就地刪除

``` x = pd.Series([10,23,31,16],index=list("abcd")) display(x)

y = x.drop("a") display(y) dispaly(x)

當指定了inplace=True後，屬於就地刪除

x.drop("a",inplace=True) display(x) ```

編輯

2.DataFrame刪除操作 pop/drop/del

和 Series刪除操作 pop/drop/del 類同的，聰明的你可以想想

六、Series, DataFrame 合併操作

一般我們用到什麼方法就去查看該方法的參數

1.Series合併操作

pd.concat() combine_first()

2.DataFrame合併操作

``` pd.concat() combine_first()

pd.merge() join() ```

七、Pandas庫其他常用函數或方法

``` head() info() describe()

sort_index() sort_values()

is_unique value_counts()

rank() ```

詳細可見pandas中Series，DataFrame的連接（拼接）_曉東邪的博客-CSDN博客_pandas series 拼接

機器學習——Pandas庫