Mammoth——从docx文档提取html
Mammoth.js 是一个 JavaScript 库,可以将 Microsoft Word 文件(.docx)转换为 HTML。以下是使用 Mammoth.js 从 docx 文档中提取 HTML 的示例代码:
const mammoth = require("mammoth");
mammoth.convertToHtml({path: "path/to/your/document.docx"})
.then(function(result){
const html = result.value; // The generated HTML
console.log(html);
// 你可以选择将 html 写入文件
// fs.writeFileSync('path/to/output.html', html);
})
.done();
确保你已经安装了 mammoth.js,如果没有,可以通过 npm 安装:
npm install mammoth
这段代码首先导入了 mammoth 模块,然后使用 convertToHtml
方法转换指定路径的 docx 文件为 HTML。转换结果是一个 Promise,在转换完成后,通过 then 方法处理并打印生成的 HTML。如果需要,你可以将生成的 HTML 写入到文件中。
评论已关闭