Java Word 文档操作:合并带书签内容

使用 Apache POI 库,您可以轻松地使用 Java 代码操作 Word 文档,包括合并、提取内容、添加书签等功能。

本示例演示了如何合并两个 Word 文档,并根据指定书签提取和复制内容到新的文档。

代码:

package word;

import org.apache.poi.xwpf.usermodel.IBodyElement;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFParagraph;
import org.apache.poi.xwpf.usermodel.XWPFTable;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTBookmark;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTMarkupRange;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.util.List;

public class Word {
    public static void main(String[] args) {
        try {
            // 打开输入文档1
            XWPFDocument inputDoc1 = new XWPFDocument(new FileInputStream('input01.docx'));

            // 打开输入文档2
            XWPFDocument inputDoc2 = new XWPFDocument(new FileInputStream('input02.docx'));

            // 创建输出文档
            XWPFDocument outputDoc = new XWPFDocument();

            // 复制输入文档1的内容到输出文档
            copyDocumentContent(inputDoc1, outputDoc);

            // 复制输入文档1中指定书签的内容到输出文档
            copyBookmarkContent('应变计', inputDoc1, outputDoc);

            // 复制输入文档2中指定书签的内容到输出文档
            copyBookmarkContent('位移计', inputDoc2, outputDoc);

            // 保存输出文档
            FileOutputStream out = new FileOutputStream('input04.docx');
            outputDoc.write(out);
            out.close();

            System.out.println('复制完成');
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 复制文档内容
    private static void copyDocumentContent(XWPFDocument sourceDoc, XWPFDocument targetDoc) {
        for (IBodyElement element : sourceDoc.getBodyElements()) {
            if (element instanceof XWPFParagraph paragraph) {
                targetDoc.createParagraph().createRun().setText(paragraph.getText());
            } else if (element instanceof XWPFTable table) {
                targetDoc.createTable().getCTTbl().setTblPr(table.getCTTbl().getTblPr());
            }
        }
    }

    // 复制书签内容
    private static void copyBookmarkContent(String bookmarkName, XWPFDocument sourceDoc, XWPFDocument targetDoc) {
        List<XWPFParagraph> paragraphs = sourceDoc.getParagraphs();
        for (int i = 0; i < paragraphs.size(); i++) {
            XWPFParagraph paragraph = paragraphs.get(i);
            List<CTBookmark> bookmarks = paragraph.getCTP().getBookmarkStartList();
            for (CTBookmark bookmark : bookmarks) {
                if (bookmark.getName().equals(bookmarkName)) {
                    int startIdx = i;
                    int endIdx = -1;
                    for (int j = i + 1; j < paragraphs.size(); j++) {
                        XWPFParagraph nextParagraph = paragraphs.get(j);
                        List<CTMarkupRange> nextBookmarks = nextParagraph.getCTP().getBookmarkEndList();
                        for (CTMarkupRange nextBookmark : nextBookmarks) {
                            CTBookmark parentBookmark = (CTBookmark) nextBookmark.getDomNode().getParentNode();
                            if (parentBookmark.getId().equals(bookmark.getId())) {
                                endIdx = j;
                                break;
                            }
                        }
                        if (endIdx != -1) {
                            break;
                        }
                    }
                    if (endIdx != -1) {
                        for (int k = startIdx; k <= endIdx; k++) {
                            XWPFParagraph targetParagraph = targetDoc.createParagraph();
                            targetParagraph.createRun().setText(paragraphs.get(k).getText());
                        }
                    }
                    break;
                }
            }
        }
    }
}

解释:

  1. 导入必要的库:

    • org.apache.poi.xwpf.usermodel 包含处理 Word 文档所需的所有类。
    • org.openxmlformats.schemas.wordprocessingml.x2006.main 包含用于访问 Word 文档结构的类。
  2. 创建 Word 文档对象:

    • 使用 XWPFDocument 类创建 Word 文档对象,并从输入文件加载内容。
  3. 复制文档内容:

    • 使用 copyDocumentContent 方法将第一个输入文档的内容复制到输出文档。
    • 此方法遍历源文档的所有 IBodyElement,并根据类型创建新的段落或表格。
  4. 复制书签内容:

    • 使用 copyBookmarkContent 方法复制指定书签的内容。
    • 此方法首先遍历所有段落,查找包含指定书签名的起始书签。
    • 然后,它查找与该起始书签匹配的结束书签,确定书签所包含的段落范围。
    • 最后,将这些段落复制到输出文档。

注意:

  • 代码中使用的 input01.docx, input02.docx, input04.docx 是示例文件名,您需要根据您的实际情况修改。
  • 确保您已添加 Apache POI 库到您的项目中。

解决常见错误:

  • java.lang.NoClassDefFoundError: org/apache/xmlbeans/impl/schema/DocumentFactory

    • 此错误表示缺少 Apache XMLBeans 库。您需要将 Apache XMLBeans 库添加到您的项目中以解决此问题。

    • 从 Apache XMLBeans 的官方网站下载最新版本的库:https://xmlbeans.apache.org/

    • 下载后,将 xmlbeans-x.x.x.jar 文件添加到您的项目的类路径中。具体步骤取决于您使用的集成开发环境(IDE)。

    • 在 Eclipse 中,您可以右键单击项目,选择 "Build Path" -> "Configure Build Path"。然后,在 "Libraries" 选项卡下,点击 "Add External JARs" 按钮,选择下载的 xmlbeans-x.x.x.jar 文件。

    • 在 IntelliJ IDEA 中,您可以右键单击项目,选择 "Open Module Settings"。然后,在 "Libraries" 选项卡下,点击 "+" 按钮,选择下载的 xmlbeans-x.x.x.jar 文件。

    • 完成后,重新编译和运行您的代码,应该不再出现该错误。

希望本示例能够帮助您使用 Java 代码操作 Word 文档,并实现您需要的功能。

Java Word 文档操作:合并带书签内容

原文地址: https://www.cveoy.top/t/topic/fK20 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录