代码操作Word时,目录自动更新的两种方法

时间:2024-02-17 14:08:30

  最近的项目中有一个功能点为:根据分析数据库并生成报告。不过不是大数据、数据挖掘之类,报告的内容、组织方式都是事先固定下来的。实现的方式为,在普通word文档中插入书签制成模板,然后程序使用OpenXML解析文档,找到书签,并根据书签的意义进行相应的计算,最后用计算结果替换书签,替换的内容涉及到文本、图表、表格等。

  这一套已经可以稳定工作,但美中不足的是关于目录的问题,太长的文档开始有必要存在目录,但在模板中签入真实数据后,最后文档的篇幅每次都是不一样的,这就需要目录能都自动更新,但不知道OpenXML怎么实现(大侠遇到过的话恳请告知),最后找到了其它办法。

  第一种是使用宏。在模板中设置好标题并插入目录,然后在VBA编辑器中,双击This Document,添加如下代码:

Sub AutoOpen()
  Dim aStory As Range
  Dim aField As Field
     For Each aStory In ActiveDocument.StoryRanges
        For Each aField In aStory.Fields
           aField.Update
        Next aField
     Next aStory
End Sub

 

  目录属于域的一种,上面的代码大致意思是要求word在每次打开该文档时都遍历并更新每一个域,这样就把目录自动更新了。但这个方法在word禁用了宏时便会失效。

 

  第二种是手工修改word背后的XML文件,这个方法是看老外的一个视频学的,链接:http://ericwhite.com/blog/screen-cast-exploring-tables-of-contents-in-open-xml-wordprocessingml-documents/。不得不佩服,查找别的帖子的时候看到过视频作者的发言,这个Eric White之前也受困于这个问题,得到启示后把问题顺利解决,此外还做了这份非常细致的视频。

   要编辑所谓的“word背后的XML文件”,我的方法是把word后缀从"docx"改为“zip”,然后解压,记事本打开。Eric White的方法应该是用了OpenXML相关的插件,用vs可以直接打开word对应的xml文件并编辑,这个非常方便,可是我不会用唉。

  可以打开xml文件后,先修改settings.xml,在末尾加上一句  <w:updateFields w:val="true"/>,注意xml文件的层次。

  还要修改document.xml文件,找到目录所在的部分,不好找可以搜索w:fldChar,fldChar就是跟域相关的标签,模板中的每条目录都被包围在w:hyperlink标签之中,找到这些并删除,最终目录部分只留下这样的:

留意红框中的内容,最终相当于去掉了具体的目录信息,只保留了目录的框架。xml必须有闭标签,删除的时候留意别删错了,比如我当时的情况就是不小心把这个p标签删了。

  改好后,保存,重新压缩,将后缀改回“docx”便OK了。

  第一次打开会有询问是否更新域,选是。

 

以上便是这两种方法。各有优劣,对比一下

  方法一(宏) 方法二(修改XML)
失效 word禁用宏便会失效 不会失效
更新 每次打开自动更新 只在第一次更新
样式 可以设置目录的字体字号 不能修改目录样式

 

可以看到两种方法都不完美,应该还有更好的办法吧,请多指教。