本文實(shí)例講述了Python輸出PowerPoint(ppt)文件中全部文字信息的方法。分享給大家供大家參考。具體分析如下:
下面的代碼依賴于windows com,所以必須在機(jī)器上安裝PowerPoint才能用,可以將PPT文件中的所有純文本信息進(jìn)行輸出到指定的文件,非常實(shí)用。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
import win32com from win32com.client import Dispatch, constants ppt = win32com.client.Dispatch( 'PowerPoint.Application' ) ppt.Visible = 1 pptSel = ppt.Presentations. Open ( "c:\\1.ppt" ) win32com.client.gencache.EnsureDispatch( 'PowerPoint.Application' ) f = file ( "c:\\1.txt" , "w" ) slide_count = pptSel.Slides.Count for i in range ( 1 ,slide_count + 1 ): shape_count = pptSel.Slides(i).Shapes.Count print shape_count for j in range ( 1 ,shape_count + 1 ): if pptSel.Slides(i).Shapes(j).HasTextFrame: s = pptSel.Slides(i).Shapes(j).TextFrame.TextRange.Text f.write(s.encode( 'utf-8' ) + "\n" ) f.close() ppt.Quit() |
希望本文所述對大家的Python程序設(shè)計有所幫助。