如何使用pandas將excel資料匯入python指令碼

對於高階資料分析,Python優於Excel。下面介紹如何使用Pandas將Excel資料匯入Python指令碼!...

microsoftexcel是世界上使用最廣泛的電子表格軟件,這是有充分理由的:用戶友好的界面和強大的內置工具使處理數據變得簡單。

import-excel-data-python

但是,如果您想進行更高級的數據處理,就需要超越Excel的功能,開始使用類似Python的腳本/編程語言。這裡不是手動將數據複製到數據庫中,而是一個關於如何使用Pandas將Excel數據加載到Python中的快速教程。

注意:如果您以前從未使用過Python,那麼本教程可能有點困難。我們建議從這些學習Python的網站和這些基本的Python示例開始。

什麼是熊貓(pandas)?

Python數據分析庫(“Pandas”)是Python編程語言的開源庫,用於數據分析和數據操作。

Pandas將數據加載到稱為Dataframes的Python對象中,Dataframes以行和列的形式存儲數據,就像傳統的數據庫一樣。一旦創建了數據幀,就可以使用Python對其進行操作,從而打開了一個充滿可能性的世界。

安裝熊貓

注意:您必須擁有Python2.7或更高版本才能安裝Pandas。

要開始在您的機器上使用Pandas,您需要導入Pandas庫。如果你正在尋找一個重量級的解決方案,你可以下載anacondapython發行版,它內置了Pandas。如果你沒有使用水蟒,熊貓很容易安裝在你的終端。

Pandas是一個PyPI包,這意味著您可以通過命令行使用pipforpython進行安裝。現代的Mac系統帶有PIP。對於其他Windows、Linux和較舊的系統,很容易瞭解如何為Python安裝PIP。

打開終端後,可以使用以下命令安裝Pandas的最新版本:

>> pip install pandas

Pandas還需要NumPy庫,讓我們在命令行上安裝它:

>> pip install numpy

現在您已經安裝了熊貓,並準備創建您的第一個數據幀!

準備excel數據

在本例中,我們使用一個示例數據集:一個名為汽車.xlsx.

Excel Table For Python Pandas

此數據集顯示輸入到表中的汽車的品牌、型號、顏色和年份。表格顯示為Excel區域。熊貓足夠聰明,能夠正確地讀取數據。

此工作簿保存到桌面目錄,下面是使用的文件路徑:

/Users/grant/Desktop/Cars.xlsx

您需要知道工作簿的文件路徑才能使用。讓我們首先打開visualstudio代碼來編寫腳本。如果沒有文本編輯器,我們建議使用visualstudio代碼或Atom編輯器。

編寫python腳本

現在你有了你的文本編輯器的選擇,真正的樂趣開始了。我們將把Python和Cars工作簿結合起來創建一個Pandas數據框架。

導入python庫

打開文本編輯器並創建一個新的Python文件。我們就叫它吧腳本.py.

為了在腳本中使用Pandas,需要將其導入到代碼中。這是通過一行代碼完成的:

import pandas as pd

這裡我們加載Pandas庫並將其附加到一個變量“pd”。你可以用任何你想用的名字,我們用“pd”作為熊貓的縮寫。

要使用Pandas處理Excel,需要一個名為ExcelFile的附加對象。ExcelFile內置於熊貓生態系統中,因此您可以直接從熊貓導入:

from pandas import ExcelFile

使用文件路徑

為了讓Pandas能夠訪問工作簿,您需要將腳本指向文件的位置。最簡單的方法是為腳本提供工作簿的完整路徑。

回想一下本例中的路徑:/Users/grant/Desktop/汽車.xlsx

您需要在腳本中引用此文件路徑來提取數據。不要引用Read\u Excel函數中的路徑,而是通過將路徑存儲在變量中來保持代碼乾淨:

Cars_Path = '/Users/grant/Desktop/Cars.xlsx'

現在可以使用Pandas函數提取數據了!

使用提取excel數據熊貓.閱讀excel()

導入Pandas並設置路徑變量後,現在可以利用Pandas對象中的函數來完成任務。

您需要使用的函數恰當地命名為Read\u Excel。Read\u Excel函數獲取Excel工作簿的文件路徑,並返回包含工作簿內容的DataFrame對象。將此函數編碼為:

pandas.read_excel(path)

“路徑”的論點將是我們汽車.xlsx工作簿,並且我們已經將路徑字符串設置為變量Cars\u path。

您已經準備好創建DataFrame對象了!讓我們把它們放在一起,將DataFrame對象設置為一個名為“DF”的變量:

DF = pd.read_excel(Cars_Path)

最後,您想查看數據幀,所以讓我們打印結果。使用DataFrame變量作為參數,將print語句添加到腳本末尾:

print(DF)

該在終端上運行腳本了!

運行python腳本

打開終端或命令行,導航到包含腳本的目錄。在這種情況下,我有“腳本.py“位於桌面上。要執行腳本,請使用python命令,後跟腳本文件:

Python Script In Terminal

Python將從汽車.xlsx“輸入新的數據幀,並將數據幀打印到終端!

Python DataFrame In Terminal

更仔細地觀察dataframe對象

乍一看,DataFrame與常規的Excel表非常相似。因此,數據幀很容易解釋。

您的頭被標記在數據集的頂部,Python用從汽車.xlsx“工作簿。

注意最左邊的一列,一個從0開始並對列進行編號的索引。默認情況下,Pandas會將此索引應用於數據幀,這在某些情況下很有用。如果不希望生成此索引,可以在代碼中添加其他參數:

DF = pd.read_excel(Cars_Path, index=False)

將參數“index”設置為False將刪除index列,只留下Excel數據。

用python做更多事情

現在您已經能夠從Excel工作表中讀取數據了,您可以選擇任何方式應用Python編程。對於有經驗的Python程序員來說,使用Pandas是處理Excel工作簿中存儲的數據的簡單方法。

Python能夠輕鬆地用於分析和操作數據,這是Python成為未來編程語言的眾多原因之一。

圖片來源:Rawpixel/Depositphotos

  • 發表於 2021-03-19 06:40
  • 閱讀 ( 57 )
  • 分類:程式設計

你可能感興趣的文章

r(r)和python(python)的區別

...式語言和一個用於統計分析的軟體環境,用於表示圖形。使用R的主要優點是它可以用於實現統計概念,如線性和非線性建模、時間序列分析、聚類等。 R是一種解釋語言,因此每一行都由直譯器一行接一行地讀。它是一種高階程...

  • 發佈於 2020-10-20 09:33
  • 閲讀 ( 54 )

如何在excel中進行基礎資料分析

...你不會得到任何有意義的度量,但是你可以看到每個組是如何與其他組相關聯的。值為1表示絕對相關,表示兩個值完全相同。相關值越接近1,相關性越強。 ...

  • 發佈於 2021-03-12 01:13
  • 閲讀 ( 51 )

尋找最好的程式語言?從這裡開始!

...個很好的開始)。現在,瀏覽器端和伺服器端邏輯都可以使用JavaScript,使用Meteor或React這樣的框架很容易做到。 Python:Python用於伺服器端邏輯,這意味著您將需要HTML、CSS和JavaScript作為您建立的任何web應用的瀏覽器...

  • 發佈於 2021-03-12 12:24
  • 閲讀 ( 64 )

如何將一個巨大的csv excel電子表格分割成單獨的檔案

...會遇到它的一個缺點:電子表格的大小。繼續閱讀,瞭解如何縮小Excel電子表格或將大型CSV檔案拆分為多個檔案。 ...

  • 發佈於 2021-03-12 16:05
  • 閲讀 ( 59 )

如何將excel資料整合到word文件中

... 一旦您知道如何新增正確的引用,以及如何佈局後臺VBA程式碼的語法,那麼將microsoftexcel資料整合到microsoftword中就非常容易了。 ...

  • 發佈於 2021-03-13 07:56
  • 閲讀 ( 44 )

如何讓python和javascript使用json進行通訊

有沒有想過如何在兩種程式語言之間傳送資料?是否嘗試傳送一個物件或多個數據段? ...

  • 發佈於 2021-03-16 01:22
  • 閲讀 ( 71 )

如何用python讀寫google工作表

... 在本文中,我將向您展示如何使用Python讀寫googlesheets。如果您剛剛開始Python之旅,那麼以下5個學習Python的最佳網站是一個很好的起點。 ...

  • 發佈於 2021-03-16 13:43
  • 閲讀 ( 72 )

5門課程對資料科學的溫和介紹

... 探索:如何利用Excel的強大功能進行資料視覺化。 ...

  • 發佈於 2021-03-17 16:12
  • 閲讀 ( 61 )

製作一個樹莓皮gmail通知燈

在這個快速簡單的Raspberry Pi專案中,您將學習如何**Gmail電子郵件通知燈。如果您有任何未讀的電子郵件,Python指令碼會開啟指示燈。這個專案需要很少的部分,可以在一個小時內完成!當然,你可以把你的LED打扮成任何你喜歡...

  • 發佈於 2021-03-17 17:32
  • 閲讀 ( 53 )

開始使用tensorflow和raspberry pi進行影象識別

... 在本文中,您將學習如何在Raspberry Pi上安裝TensorFlow,並在預先訓練的神經網路上執行簡單的影象分類。 ...

  • 發佈於 2021-03-18 14:49
  • 閲讀 ( 54 )