对Office中Word内容的格式检测——问题发现(仅支持docx文件)

时间:2024-04-03 09:23:28

一、序章

本人的毕业设计系统是有关于word文字的格式检测,主要是根据设置的模板,对毕业论文的格式进行检测。在完成该系统的过程中,发现了许多问题,也解决了许多的问题,以及踩了很多坑。特地写下这篇博客,对完成该系统的整个过程进行总结,希望此文能够帮助到你。

二、系统需求

该系统的主要需求是对毕业论文的格式进行检测,并生成检测报告供用户下载。(从以上需求可以看出这个系统多么高大上,但是其中的坑只有自己清楚。)首先就需要清楚毕业论文的结构,其结构分为封面、摘要、目录、正文、结论、文献、致谢、附录。本系统是对正文部分的内容进行格式检测,但其它部分的内容也可以遵循该方法实现格式的检测。当确定了对正文部分进行格式检测后,就需要确定该部分有哪些格式的要求。以下图片便是一个论文中对正文部分的要求:
对Office中Word内容的格式检测——问题发现(仅支持docx文件)
除了图片中的要求,还有对公式的格式要求。

三、问题发现

当了解该系统的需求之后,便要设计数据库、搭建框架一步一步码代码实现该系统的功能。但是在coding的过程中,会发现其中的一些问题。以下是我所发现的问题:

  • 使用什么工具能够实现对读取word内容
  • 如何定位论文中的正文部分(因为该系统是对论文中正文部分进行格式检测)
  • 如何定位正文部分中各级标题(例如第一章,1.1和1.1.4等)
  • word中读取的内容如何根据正确的格式进行检测
  • 生成的检测报告中,每一条信息的生成规则(如果规则合理,可以让用户更快、更方便的定位到错误的地方以及改正)
  • 如何优化系统,让用户体验度更好(该条可以忽略,如果连功能都实现不了,还怎么去优化)

对Office中Word内容的格式检测之问题解决篇章请点击 https://blog.csdn.net/qq_39357812/article/details/93310854.