Aspose.Words for .NET是高级Word文档处理API,用于执行各种文档管理和操作任务。该API支持生成,修改,转换,呈现和打印文档的能力,而无需在跨平台应用程序中直接利用Microsoft Word。
Aspose.Words可用于使用C#或执行将Word文档(DOC / DOCX)转换为HTML或MHTML格式的网页。Microsoft Word文档的转换是一种流行的用例,因此API支持不同的转换选项。让我们看一下本文中将讲解哪些功能:
使用C#以编程方式将Word DOC或DOCX转换为HTML网页使用C#中的往返信息将Word DOC或DOCX转换为HTML在C#中将Word DOC或DOCX转换为MHTML
点击下载最新版Aspose.Words for .NET/product/564/download
使用C#以编程方式将Word DOC或DOCX转换为HTML网页
使用C#或在.NET应用程序中以编程方式将Word文档(DOC / DOCX)有效地转换为HTML网页。您需要按照以下步骤进行转换:
加载输入的DOCX Word文档。初始化HtmlSaveOptions的实例。保存输出的HTML文件。
下面的代码段遵循这些步骤,并显示如何使用C#或将DOC / DOCX转换为HTML:
// Load the document from disk.Document doc = new Document(dataDir + "Test File.docx");// Set HtmlSaveOptionsHtmlSaveOptions options = new HtmlSaveOptions();options.SaveFormat = SaveFormat.Html;// Save the document into HTMLdoc.Save(dataDir + "Document.html", options);
使用C#中的往返信息将Word DOC或DOCX转换为HTML
将Word转换为HTML时会保存一些其他信息。它被称为往返信息,对于将转换后的HTML文件再次呈现为word文档的情况很有用。您可以按照以下步骤使用C#将DOC / DOCX转换为HTML:
加载输入的word文档。将ExportRoundtripInformation设置为true。保存输出的HTML文件。
下面的代码段说明了如何使用C#或将Word DOC / DOCX文件与往返信息转换为HTML:
// Load the document from disk.Document doc = new Document(dataDir + "Test File (doc).docx");HtmlSaveOptions options = new HtmlSaveOptions();// HtmlSaveOptions.ExportRoundtripInformation property specifies// Whether to write the roundtrip information when saving to HTML, MHTML or EPUB.// Default value is true for HTML and false for MHTML and EPUB.options.ExportRoundtripInformation = true;doc.Save(dataDir + "ExportRoundtripInformation_out.html", options);
在C#中将Word DOC或DOCX转换为MHTML
当需要带有嵌入式图像和字体的单个HTML文件时,MHTML文件格式值得一提。您可以按照以下步骤将Word文档(DOC / DOCX)转换为MHTML:
加载源DOC / DOCX文件。将SaveFormat设置为MHTML。
下面的代码段显示了如何使用C#或将Word文档(DOC / DOCX)转换为MHML:
// Load the document from disk.Document doc = new Document(dataDir + "Test File.docx");// Set HtmlSaveOptionsHtmlSaveOptions options = new HtmlSaveOptions();options.SaveFormat = SaveFormat.Mhtml;// Save the document into MHTMLdoc.Save(dataDir + "Document.mhtml", options);