C# 使用 iTextSharp 将 XML 格式转换为 PDF 并识别下标标签

可以使用 iTextSharp 库中的 XMLWorkerHelper 类和 XMLWorkerFontProvider 类来实现将 XML 格式转换成 PDF，并且识别 '_{' 和 '}' 标签。

示例代码：

// 创建PDF文档对象
Document document = new Document();
// 创建PDF写入器
PdfWriter writer = PdfWriter.GetInstance(document, new FileStream("output.pdf", FileMode.Create));
// 打开文档
document.Open();

// 创建字体提供器
XMLWorkerFontProvider fontProvider = new XMLWorkerFontProvider();
fontProvider.Register(@"C:\Windows\Fonts\arial.ttf");

// 创建XML工作器帮助类
XMLWorkerHelper worker = XMLWorkerHelper.GetInstance();
// 设置字体提供器
worker.FontProvider = fontProvider;

// 创建XML输入流
string xml = "<html><body><p>This is a <sub>subscript</sub> text.</p></body></html>";
using (MemoryStream ms = new MemoryStream(Encoding.UTF8.GetBytes(xml)))
{
    // 将XML流转换成PDF流
    worker.ParseXHtml(writer, document, ms, null, Encoding.UTF8, fontProvider);
}

// 关闭文档
document.Close();

在上面的示例代码中，我们首先创建了一个 PDF 文档对象和 PDF 写入器，然后打开文档。接着，我们创建了一个字体提供器，并注册了一个字体。然后，我们使用 XMLWorkerHelper 类创建了一个 XML 工作器帮助类，并设置字体提供器。然后，我们创建了一个 XML 输入流，将 XML 格式的字符串转换成内存流。最后，我们使用 XMLWorkerHelper 类的 ParseXHtml 方法将 XML 流转换成 PDF 流，并保存到文件中。

需要注意的是，在 XML 中使用 '_{' 和 '}' 标签时，需要使用 UTF-8 编码格式。如果不使用 UTF-8 编码格式，可能会导致标签无法被识别。

C# 使用 iTextSharp 将 XML 格式转换为 PDF 并识别下标标签