POI 5.0.0 版本以上 Word 文档书签操作:获取和替换书签内容

本代码演示了如何在 POI 5.0.0 版本以上使用 Apache POI 库获取和替换 Word 文档中的书签内容。

在 POI 5.0.0 版本以上,getBookmarkStartList()getBookmarkStartArray() 方法已被弃用。替代方法是使用 getCTP() 方法获取段落的 CTP 对象,然后使用 CTP 对象的 getBookmarkStartList() 方法获取书签的列表。

代码示例:

package word;

import org.apache.poi.xwpf.usermodel.*;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.CTBookmark;

import java.io.FileInputStream;
import java.io.FileOutputStream;

public class Word {
    public static void main(String[] args) {
        try {
            // 打开输入文件input01.docx和input03.docx
            FileInputStream input01 = new FileInputStream('input01.docx');
            FileInputStream input03 = new FileInputStream('input03.docx');
            XWPFDocument doc01 = new XWPFDocument(input01);
            XWPFDocument doc03 = new XWPFDocument(input03);

            // 获取input01.docx中应变计书签的内容
            String bookmarkContent = getBookmarkContent(doc01, '应变计');

            // 替换input03.docx中应变计书签的内容
            replaceBookmarkContent(doc03, '应变计', bookmarkContent);

            // 保存新文件input04.docx
            FileOutputStream output = new FileOutputStream('input04.docx');
            doc03.write(output);
            output.close();

            // 关闭文档
            doc01.close();
            doc03.close();

            System.out.println('替换成功!');
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // 获取书签的内容
    public static String getBookmarkContent(XWPFDocument doc, String bookmarkName) {
        for (XWPFParagraph paragraph : doc.getParagraphs()) {
            CTP ctp = paragraph.getCTP();
            for (CTBookmark bookmark : ctp.getBookmarkStartList()) {
                if (bookmark.getName().equals(bookmarkName)) {
                    return paragraph.getText();
                }
            }
        }
        return null;
    }

    // 替换书签的内容
    public static void replaceBookmarkContent(XWPFDocument doc, String bookmarkName, String content) {
        for (XWPFParagraph paragraph : doc.getParagraphs()) {
            CTP ctp = paragraph.getCTP();
            for (CTBookmark bookmark : ctp.getBookmarkStartList()) {
                if (bookmark.getName().equals(bookmarkName)) {
                    for (XWPFRun run : paragraph.getRuns()) {
                        run.setText(content, 0);
                    }
                }
            }
        }
    }
}

注意:

  • 更新后的代码使用了 paragraph.getText() 方法来获取段落的文本内容。如果书签跨越多个段落,则需要根据实际情况进行调整。
  • 为了提高代码可读性,建议将代码中的双引号改为单引号。
  • 为了使代码更易于理解,建议使用清晰的变量名和注释。
  • 为了避免重复代码,建议将获取书签内容和替换书签内容的代码封装成单独的方法。
  • 为了提高代码效率,建议使用迭代器遍历段落和运行,而不是使用循环。
  • 为了确保代码的安全性,建议使用 try-catch 块处理异常。
  • 为了确保代码的正确性,建议使用单元测试对代码进行测试。

其他建议:

  • 在代码中添加必要的注释,解释代码的功能和逻辑。
  • 使用代码格式化工具格式化代码,提高代码的可读性。
  • 使用代码质量检查工具检查代码的质量,例如 SonarQube。

希望以上信息对您有所帮助。


原文地址: https://www.cveoy.top/t/topic/fL9X 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录