要将HTML文件转换为Markdown文件,可以使用Python语言和html2text
库。以下是一个简单的Python脚本,用于实现这一转换:
首先,安装html2text
库(如果尚未安装):
pip install html2text
然后,使用以下Python脚本进行转换:
import html2text
import sys
# 确保传入了HTML文件名和Markdown文件名
if len(sys.argv) < 3:
print("Usage: python html_to_markdown.py input.html output.md")
sys.exit(1)
html_file = sys.argv[1]
md_file = sys.argv[2]
# 读取HTML文件内容
with open(html_file, 'r', encoding='utf-8') as file:
html_content = file.read()
# 使用html2text转换HTML到Markdown
h = html2text.HTML2Text()
h.ignore_links = True
markdown_content = h.handle(html_content)
# 将Markdown内容写入文件
with open(md_file, 'w', encoding='utf-8') as file:
file.write(markdown_content)
print(f"Converted {html_file} to {md_file}")
使用方法:
python html_to_markdown.py input.html output.md
这个脚本会读取名为input.html
的文件,将其转换为Markdown,并将转换后的内容保存到output.md
文件中。