Python读取Word文档中的Excel嵌入文件的方法详解
作者:小小明-代码实体 发布时间:2022-12-21 14:11:23
标签:Python,读取,Word,Excel
今天群友提出一个问题:
给出Word示例如下:
对于这种嵌入文件在Word中都属于ole文件。
下面我们假设需要读取每个嵌入的Excel文件中的python工作表中的A1单元格。
python调用宏实现
首先我们看看如何调用com接口的宏代码实现这个效果,最终完整代码如下:
from win32com import client as win32
import os
word = win32.Dispatch("Word.Application")
word.Visible = True
wdDoc = word.Documents.Open(os.path.abspath("test.docx"))
try:
for shape in wdDoc.InlineShapes:
if shape.Type != 1 or not shape.OLEFormat.ProgID.startswith("Excel.Sheet"):
# 要求形状类型为wdInlineShapeEmbeddedOLEObject,是Excel类型的OLE对象
continue
shape.OLEFormat.Open()
xlApp = win32.GetActiveObject('Excel.Application')
book = xlApp.Workbooks(1)
print([sht.Name for sht in book.Sheets])
print(book.Sheets("python").Range("A1").Value)
book.Close()
finally:
wdDoc.Close()
xlApp.Quit()
word.Quit()
执行结果:
['java', 'forever', 'python']
python
['java', 'forever', 'python']
python hello world
['java', 'forever', 'python']
python
注意:此方法仅支持在已安装办公软件(office或WPS)的windows环境下使用。
python解析ole文件实现
我通过压缩软件看到三个Excel文件其实是以ole的bin文件形式存储:
我们也只需要理解并解析这些文件就可以得到对应的Excel文件,然后直接使用openpyxl或pandas解析。
HY.Li大佬提供了对应的代码:
思路与我的想法不谋而合,不过我不知道用olefile这个现成的库可以解析这些文件,原本还打算自己实现一下。
参考上面的代码,最终我的实现如下:
import olefile
from zipfile import ZipFile
from openpyxl import load_workbook
filename = "test.docx"
with ZipFile(filename, "r") as zip_file:
for name in zip_file.namelist():
if not name.startswith("word/embeddings/"):
continue
with zip_file.open(name) as f:
if not olefile.isOleFile(f):
continue
ole = olefile.OleFileIO(f)
try:
book = load_workbook(ole.openstream("package"))
print(book.sheetnames)
print(book["python"]["A1"].value)
except Exception as e:
print(name, "当前ole对象不是Excel文件:", e)
结果:
['java', 'forever', 'python']
python
['java', 'forever', 'python']
python hello world
['java', 'forever', 'python']
python
相对来说,此方法跨平台,速度快。
来源:https://blog.csdn.net/as604049322/article/details/128308639
0
投稿
猜你喜欢
- 阅读上一篇:FrontPage XP设计教程2——网页的编辑 制作一个漂亮的网页,离不开网页整体布局的设计,网页布局设计的合理与否,直接影响
- 很多时候我们的redis的IP地址一般都是默认的127.0.0.1代表只能接受本机的访问,因此我们其他机器上想要访问这个redis的时候,就
- python 中提供一种用于对函数固定属性的函数(与数学上的偏函数不一样)# 通常会返回10进制int('12345') &
- Data Points Archive 有时, 为了让应用程序运行得更快,所做的全部工作就是在这里或那里做一些很小调整。啊,但关键在于确定如
- 方法一:利用Cookies对象 因为Cookies对象把变量的值保存在浏览器客户端,所以可以根据Cookies保存的IsVoted的值来判断
- 本文实例讲述了php实现的简单检验登陆类。分享给大家供大家参考。具体如下:<?phpclass checklogin{ v
- 一、json_encode()该函数主要用来将数组和对象,转换为json格式。先看一个数组转换的例子:$arr = array ('
- 一、理解装饰器所有东西都是对象(函数可以当做对象传递)由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。de
- 写在前面贪吃蛇,吃豆人,迷宫,井字游戏......这些小游戏我相信大家小的时候肯定玩过,或许在某个时段还沉迷过.随着年龄的增长,这些小游戏离
- 本文要实现的功能是:根据下拉列表的选项将数据库中对应的内容显示在页面,选定要排除的选项后,提交剩余的选项到数据库。为了方便前后台交互,利用了
- 备注: 关于label和tag,在中文中都翻译成标签,而下文中出现的标签,都是对label的翻译,比如”用户名”+输入框, 这里的”用户名”
- 介绍两个关键的CSS <style media="print">  
- 本文实例讲述了Python实现手写一个类似django的web框架。分享给大家供大家参考,具体如下:用与django相似结构写一个web框架
- 最近决定把MT的后台数据从Berkeley的文件DB转到MySQL。原因之一是使用关系数据库可以获得更多的灵活性,比如运行一条sql来变更
- 方法一:在php中,抓取https的网站,提示如下的错误内容:Warning: file_get_contents() [function.
- 将json多行数据传入到mysql中使用python实现表需要提前创建,字符集utf8 如果不行换成utf8mb4import jsonim
- 意思就是画四条直线,四条直线都不能相交即可。#!/usr/bin/python#coding: UTF-8import turtleimpo
- 这个弹出层的登录界面挺好看,很清爽所以转了过来给大家分享,要实现这个功能很简单:首先设计一个登录界面,使用css中的display=&quo
- 1. 导入包我们这次的任务是随机生成一些离散的点,然后用直线(y = w *x + b )去拟合首先看一下我们需要导入的包有torch 包为
- 请问如何实现复合查询?我们用下面的代码来实现动态生成查询条件,动态显示结果的复合查询。set database to databasenam