pdf檔案可以轉換成TXT嗎?小小猿愛嘻嘻2018-11-23 16:33:09

當然是可以的,這裡以python為例,不使用任何軟體,透過程式直接將pdf檔案轉化為txt檔案,主要用到pdfminer3k這個包,實驗環境win10+python3。6+pycharm5。0,主要內容如下:

這裡為了更好地說明問題,新建了一個test。pdf檔案,主要內容如下,一段文字,後面就是將這個pdf檔案轉換為txt檔案:

pdf檔案可以轉換成TXT嗎?

1。首先,下載安裝pdfminer3k庫,這裡直接在cmd視窗輸入命令“pip install pdfminer3k”就行,如下,稍微等待一下:

pdf檔案可以轉換成TXT嗎?

2。安裝完成後,我們就可以編寫程式碼瞭解析pdf檔案了,整個過程不難,就是建立一個pdf文件分析器,然後解析出text文字內容,最後寫入txt檔案,主要程式碼如下:

pdf檔案可以轉換成TXT嗎?

pdf檔案可以轉換成TXT嗎?

點選執行,成功轉化後會在當前目錄下生成一個pdftotxt。txt檔案,開啟這個檔案,就是pdf轉化後的內容,如下:

pdf檔案可以轉換成TXT嗎?

至此,我們就完成了利用python將pdf檔案轉換為txt檔案。總的來說,整個過程不難,程式碼量也不多,就是解析出text文字,然後追加到txt檔案中,只要你有一定python基礎,熟悉一下相關程式碼,很快就能掌握的,網上也有相關教程和示例,感興趣的可以搜一下,當然,你也可以利用軟體直接轉換,這裡我就是提供一種思路,感興趣的可以自己操作試一下,

希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言。