Apache Poi Word 简明教程
Apache POI Word - Overview
很多时候,软件应用程序需要生成 Microsoft Word 文件格式的参考文档。有时,甚至预期一个应用程序接收 Word 文件作为输入数据。
任何想要生成 MS-Office 文件作为输出的 Java 编程人员都必须使用一个预定义且只读的 API 来执行此操作。
What is Apache POI?
Apache POI 是一个流行的 API,它允许编程人员使用 Java 程序创建、修改和显示 MS-Office 文件。它是一个由 Apache 软件基金会开发和分发的开源库,用于使用 Java 程序设计或修改 MS-Office 文件。它包含将用户输入数据或文件解码为 MS-Office 文档的类和方法。
Components of Apache POI
Apache POI 包含用于操作 MS-Office 所有 OLE2 复合文档的类和方法。此 API 的组件列表如下 -
-
POIFS (Poor Obfuscation Implementation File System) − 此组件是所有其他 POI 元素的基本因素。它用于明确读取不同文件。
-
HSSF (Horrible SpreadSheet Format) − 用于读取和写入 MS-Excel 文件的 .xls 格式。
-
XSSF (XML SpreadSheet Format) − 用于 MS-Excel 的 .xlsx 文件格式。
-
HPSF (Horrible Property Set Format) − 它用于提取 MS-Office 文件的属性集。
-
HWPF (Horrible Word Processor Format) − 它用于读取和写入 MS-Word 的 .doc 扩展名文件。
-
XWPF (XML Word Processor Format) − 它用于读取和写入 MS-Word 的 .docx 扩展名文件。
-
HSLF (Horrible Slide Layout Format) − 用于读取、创建和编辑 PowerPoint 演示文稿。
-
HDGF (Horrible DiaGram Format) − 包含 MS-Visio 二进制文件所需类和方法。
-
HPBF (Horrible PuBlisher Format) − 用于读取和写入 MS-Publisher 文件。
本教程将指导您完成使用 Java 处理 MS-Word 文件的过程。因此,讨论仅限于 HWPF 和 XWPF 组件。
Note − POI 的较旧版本支持 DOC、XLS、PPT 等二进制文件格式。从版本 3.5 开始,POI 支持 DOCX、XLS、PPTX 等 MS-Office 的 OOXML 文件格式。