如何在linux中使用命令列將pdf檔案轉換為可編輯文字

您可能希望將PDF檔案轉換為可編輯文字的原因有很多。也許你需要修改一箇舊文件,而你所擁有的只是它的PDF版本。在Windows中轉換PDF檔案很容易,但是如果使用Linux呢?...

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

您可能希望將PDF檔案轉換為可編輯文字的原因有很多。也許你需要修改一箇舊文件,而你所擁有的只是它的PDF版本。在Windows中轉換PDF檔案很容易,但是如果使用Linux呢?

別擔心。我們將向您展示如何使用名為pdftotext的命令列工具輕鬆地將PDF檔案轉換為可編輯文字,這是“poppler utils”包的一部分。此工具可能已安裝。要檢查系統上是否安裝了pdftotext,請按“Ctrl+Alt+T”開啟一個終端視窗。在提示符處鍵入以下命令並按“回車”。

dpkg –s poppler-utils

注意:當我們說要在本文中鍵入一些內容,並且文本週圍有引號時,不要鍵入引號,除非我們另有規定。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

如果未安裝pdftotext,請在提示符處鍵入以下命令,然後按“Enter”。

sudo apt-get install poppler-utils

在提示時鍵入密碼,然後按“回車”。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

poppler utils包中有幾種工具可用於將PDF轉換為不同的格式、操作PDF檔案以及從檔案中提取資訊。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

以下是將PDF檔案轉換為可編輯文字檔案的基本命令。按“Ctrl+Alt+T”開啟一個終端視窗,在提示下鍵入命令,然後按“Enter”。

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

更改每個檔案的路徑,使其與原始PDF檔案的位置和名稱以及要儲存生成的文字檔案的位置相對應。另外,更改檔名以與檔名相對應。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

文字檔案是建立的,可以像在Linux中開啟任何其他文字檔案一樣開啟。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

轉換後的文字可能在不需要的位置有換行符。換行符**在PDF檔案中的每一行文字之後。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

您可以使用“-layout”標誌從轉換文字檔案中的原始PDF檔案保留文件的佈局(頁首、頁尾、分頁等)。

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

如果只希望轉換PDF檔案中的一個頁面範圍,請使用“-f”和“-l”(小寫“l”)標誌指定要轉換的範圍中的第一個和最後一個頁面。

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

要轉換受所有者密碼保護和加密的PDF檔案,請使用“-opw”標誌(標誌中的第一個字元是小寫字母“O”,而不是零)。

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

將“密碼”更改為用於保護正在轉換的原始PDF檔案的密碼。確保“password”周圍有單引號,而不是雙引號。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

如果PDF檔案受保護並使用使用者密碼加密,請使用“-upw”標誌而不是“-opw”標誌。命令的其餘部分是相同的。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

還可以指定應用於轉換文字的行尾字元的型別。如果您計劃在不同的作業系統(如Windows或Mac)**問檔案,這一點尤其有用。為此,請使用“-eol”標誌(標誌中的中間字元是小寫字母“O”,而不是零),後跟空格和要使用的行尾字元型別(“unix”、“dos”或“mac”)。

如何在linux中使用命令列將pdf檔案轉換為可編輯文字

注意:如果沒有為文字檔案指定檔名,pdftotext將自動使用PDF檔名的基檔名並新增“.txt”副檔名。例如檔案.pdf“將轉換為”檔案.txt”. 如果文字檔案被指定為“-”,則轉換後的文字將傳送到stdout,這意味著文字將顯示在終端視窗中,而不會儲存到檔案中。

要關閉終端視窗,請單擊左上角的“X”按鈕。

有關pdftotext命令的詳細資訊,請在終端視窗的提示符處鍵入“man page pdftotext”。

  • 發表於 2021-04-10 06:23
  • 閱讀 ( 42 )
  • 分類:網際網路

你可能感興趣的文章

adobe acrobat reader dc(adobe acrobat reader dc)和Adobe Reader席(adobe reader xi)的區別

...文件雲。因此,它使您能夠在計算機上以及在移動裝置上使用pdf。 如前所述,adobeacrobatreader可以與adobedocumentcloud一起工作,這將pdf檢視器提升到了一個全新的水平。adobeacrobatreaderdc擁有一個支援觸控、直觀的介面,具有強大的新...

  • 發佈於 2020-10-20 17:51
  • 閲讀 ( 49 )

4種方式開源軟體不夠好

...obatprodc有效地建立和編輯pdf所需的一切知識。您還將學習如何對PDF進行數字簽名,如何比較不同的PDF文件,等等。 ...

  • 發佈於 2021-03-12 12:02
  • 閲讀 ( 55 )

3個最好的免費ocr工具,將您的檔案轉換回可編輯的檔案

...我正在作出行政決定,包括在我們的免費OCR工具清單無論如何這。 ...

  • 發佈於 2021-03-12 15:21
  • 閲讀 ( 52 )

免費與付費ocr軟體:比較microsoft onenote和nuance omnipage

... 如何使用ocr工具 ...

  • 發佈於 2021-03-14 02:31
  • 閲讀 ( 63 )

19個有用的pdf轉換器可在一個網站上訪問

...動式文件格式的最大優點是它可以在所有機器和智慧**上使用。 ...

  • 發佈於 2021-03-14 07:39
  • 閲讀 ( 47 )

如何使用googledrive填寫pdf表單

你在弄清楚如何填寫PDF表格時有困難嗎?你並不孤單。這不僅僅是一個普通的問題——這是每個計算機使用者都應該學習的一項重要的微操技能。 ...

  • 發佈於 2021-03-14 14:10
  • 閲讀 ( 50 )

在linux中如何方便地在文件格式之間轉換

...注意上面的參考檔案中配置的字型(標題1為Arial Black等)如何顯示在下面的轉換檔案中。您可以根據需要建立任意數量的這些引用檔案(例如,每個客戶機一個)。然後在編寫時完全忽略格式,並在轉換時一步應用樣式。 ...

  • 發佈於 2021-03-14 18:46
  • 閲讀 ( 80 )

什麼是人工智慧檔案?如何開啟它沒有adobe illustrator

... 如何在沒有illustrator的情況下開啟ai檔案 ...

  • 發佈於 2021-03-17 22:39
  • 閲讀 ( 55 )

如何使用ocr將手寫影象轉換為文字

您是否需要將手寫筆記數字化以編輯或索引它們?或者你想從手寫引文的圖片中複製文字?你需要的是一種光學字元識別(OCR)工具。 ...

  • 發佈於 2021-03-18 01:59
  • 閲讀 ( 47 )

如何用wget將多個網頁轉換成pdf

...藉助於一些指令碼或應用程式和此工具,我們將向您演示如何將多個網頁儲存到PDF檔案中。 ...

  • 發佈於 2021-03-19 11:02
  • 閲讀 ( 54 )