python 八行代码实现操作PDF文件

在实际工作中经常实现文件上传下载的人很多,因为业务的原因,很少有人去操作pdf,导致:
今天,就给大家展示用8行代码来操作pdf文件,其实核心代码就一行。
先上代码再解释:
python 八行代码操作pdf
阅读过前面文章的朋友已经知道怎么上传文件,因此这里不在说明。
实现思路:
操作pdf需要下载一个模块:pypdf。 安装方式: pip install pypdf即可,目前也有另外一个包pypdf2。安装哪个大家自己决定,“你高兴就好!”。
pypdf包可以实现一下功能:
pypdf包的功能
但整个pypdf包中,可以调用的类只有pdffilereader和pdffilewriter。
大家都知道操作文件第一步,是先要打开文件,采用with file(pdf_file,'rb') as pdffile: ,这个是通用方式
然后采用pdffilereader() 创建一个操作对象: pdf_input = pdffilereader(pdffile)
下面是创建对象后可以使用的属性:
pdffilereader()的属性
处理完数据后,可以采用pdffilewriter()类将数据写入新的页面中:p = pdffilewriter()
p.addpage(pageobj) #没有返回值,将处理完的对象添加到newpdf最后
本次采用管道流的方式将处理完的pdf数据返回给客户端,
创建管道的方式也非常简单:out= stringio() ,将数据写入管道:p=write(out)
从管道中读取数据返回: response.write(out.read()),注意这里要设置文本类型:
content_type='application/pdf;charset=utf-8' ,编码设置为utf-8,否则会出现乱码