Python 实现Word和TXT文本相互转换

Word 文档(.doc 或.docx)和纯文本文件(.txt)是两种常用的文件格式。Word 文档通常用于复杂的文档处理和排版,而纯文本文件则用于存储和传输纯文本信息。了解如何在这两种格式之间进行转换能提高工作效率,并便于文件管理。本文将详细介绍如何使用 Python 实现 Word 和 TXT 文件格式之间的相互转换

  • Python 将 Word 文档(Doc/Docx)转换为 TXT 文本格式
  • Python 将 TXT 文本转换为 Word 文档(Doc/Docx)

 

所需 Python 库:Spire.Doc for Python。这是一款国产的独立控件,支持多种 Word 文档操作、转换功能,能兼容大部分国产操作系统。可以直接通过 pip 安装:

pip install Spire.Doc

 

Python 将 Word 文档(Doc/Docx)转换为 TXT 文本格式

步骤:

  1. 导入所需模块;
  2. 创建Document类的对象;
  3. 使用LoadFromFile()方法加载一个.doc 或.docx 文档;
  4. 使用SaveToFile(fileName, FileFormat.Txt)方法将 Word 文档另存为 txt 格式;
  5. 关闭文档。


Python 代码:

from spire.doc import *
from spire.doc.common import *

# 加载.doc 或.docx 文档
document = Document()
document.LoadFromFile(
"溯源码.docx")

# 将文档另存为 txt 格式
document.SaveToFile("Word 转 Txt.txt", FileFormat.Txt)
document.Close()

 

Python 将 TXT 文本转换为 Word 文档(Doc/Docx)

步骤:

  1. 导入所需模块;
  2. 创建Document类的对象;
  3. 使用LoadFromFile()方法加载一个 txt 文档;
  4. 使用SaveToFile()方法将 txt 文档另存为 Word Doc 或 Docx 格式;
  5. 关闭文档。


Python 代码:

from spire.doc import *
from spire.doc.common import *

# 加载一个 txt 文档
document = Document()
document.LoadFromFile(
"Word 转 Txt.txt")

# 将文档另存为 Doc 或 Docx 格式
document.SaveToFile("Txt 转 Doc.doc", FileFormat.Doc)
document.SaveToFile(
"Txt 转 Docx.docx", FileFormat.Docx2016)
document.Close()

 

 

总结: 借助 Spire.Doc for Python 库,我们可以通过简单代码轻松实现 Word 转 TXT,或 TXT 转 Word。如需转换 Word 到其他格式,可以参考示例:
https://www.e-iceblue.cn/docforpython/spire-doc-for-python-program-guide-content.html