POI之PPT转image,SmartArt解决方法

POI 之 PPT 转 image,SmartArt 解决方法

关于使用 POI 将 PPT 转为 图片,随便就能查到以下代码。

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;

import org.apache.poi.xslf.usermodel.XMLSlideShow;
import org.apache.poi.xslf.usermodel.XSLFSlide;

public class PpttoPNG {

   public static void main(String args[]) throws IOException {

      //creating an empty presentation
      File file = new File("addingimage.pptx");
      XMLSlideShow ppt = new XMLSlideShow(new FileInputStream(file));

      //getting the dimensions and size of the slide
      Dimension pgsize = ppt.getPageSize();
      XSLFSlide[] slide = ppt.getSlides();

      for (int i = 0; i < slide.length; i++) {
         BufferedImage img = new BufferedImage(
            pgsize.width, pgsize.height,BufferedImage.TYPE_INT_RGB);
         Graphics2D graphics = img.createGraphics();

         //clear the drawing area
         graphics.setPaint(Color.white);
         graphics.fill(new Rectangle2D.Float(0, 0, pgsize.width, pgsize.height));

         //render
         slide[i].draw(graphics);
      }

      //creating an image file as output
      FileOutputStream out = new FileOutputStream("ppt_image.png");
      javax.imageio.ImageIO.write(img, "png", out);
      ppt.write(out);

      System.out.println("Image successfully created");
      out.close();
   }
}

但是问题显然不会这么简单,经过实验发现。

通过 POI 导出的图片,出现以下几个问题:

  1. 无法读取 SmartArt
  2. 艺术字只能显示为普通文本
  3. 图形阴影无法显示
  4. 部分自定义几何图形显示异常

然后就出现了这种状况:
PPT文件的内容: PPT文件的内容
导出的内容(这是什么鬼): image.png

然后上网查解决方法:

stack overflow

无解又是什么鬼

解决方法

无解,所以我们抛弃了 POI,改用其他方式导出。

1.改用 java 调用 Python

如果你不会 python,可以将下面的 py 代码放到项目下,通过 jython 解释器来执行。

import comtypes.client as client
import os

def init_powerpoint():
    powerpoint = client.CreateObject("Powerpoint.Application")
    powerpoint.Visible = 1
    return powerpoint

def ppt_to_pdf(powerpoint, inputFileName, outputFileName, formatType=32):
    if outputFileName[-3:] != 'pdf':
        outputFileName = outputFileName[0:-4] + "pdf"
    deck = powerpoint.Presentations.Open(inputFileName)
    deck.SaveAs(outputFileName, formatType)  # formatType = 32 for ppt to pdf
    deck.SaveAs(inputFileName.rsplit('.')[0] + '.jpg', 17)
    deck.Close()

def convert_files_in_folder(powerpoint, folder):
    files = os.listdir(folder)
    pptfiles = [f for f in files if f.endswith((".ppt", ".pptx"))]
    for pptfile in pptfiles:
        fullpath = os.path.join(cwd, pptfile)
        ppt_to_pdf(powerpoint, fullpath, fullpath)

if __name__ == "__main__":
    powerpoint = init_powerpoint()
    cwd = os.getcwd()
    convert_files_in_folder(powerpoint, cwd)
    powerpoint.Quit()

这种方法应该是最适合的了,导出的图片接近完美。

2.使用第三方服务

阿里云提供了一个“智能媒体管理”的服务,其中包含了许多的文档转换的 API。省事

收费标准

转换服务

文章作者: koral
文章链接: http://luokaiii.github.io/2018/11/16/后端/POI/POI-PPT2IMG/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自