首页编程日记正文内容

html图片转换word工具,GitHub

编程日记

更新时间：2024-12-22 22:00:15 14

admin 管理员组

文章数量: 887018

html图片转换word工具,GitHub

DailyTools

日常工具类，提供如下功能：

##将内容导出html

这一部分没有难点，主要讲利用导出的html转成word内容，这里需要注意的是在导出到html的时候，一要注意中文编码问题，

另外注意对字体字号等进行声明：

WORD中对字体的大小同时采用了两种不同的度量单位，其一是我们中国人所熟悉的“字号”，另外一种则是以“磅”为度量单位。

这两种度量字大小的单位之间是什么样的关系呢？下面就是二者的对应关系：

磅字号

42 初号

36 小初

26 一号

24 小一号

22 二号

18 小二号

16 三号

15 小三号

14 四号

12 小四号

10.5 五号

9 小五号

7.5 六号

6.5 小六号

5.5 七号

5 八号

在html中pt 代表磅的单位。

另外一点需要注意，如果我的html中包含有图片，这个图片地址如果是网站外链，不需要做处理；如果是带有防盗链的图片地址

，还需要将图片的防盗链有效化，也就是要将图片中防盗链信息更换成有效的，比如我的防盗链中包含了sessionid ,

由于有效期只是在会话期间，所以这里需要需要把sessionid换成当前用户的有效sessionid .

##利用POI框架将html转成word

poi提供了将内容转成word的语法：

POIFSFileSystem poifs = new POIFSFileSystem();

DirectoryEntry directory = poifs.getRoot();

directory.createDocument(

"WordDocument", is);

fos = new FileOutputStream(this.outputPath);

poifs.writeFilesystem(fos);

那么这里内容既然直接就可以转成html，为什么还要先转成html呢？

这里是避免转成word的时候失真，而且在控制字体大小颜色，表格样式，图片大小和位置，直接通过POI进行更改格式比较麻烦。

这里就是先把内容，布局，样式等做好，转成html，然后利用POI将html转成word的时候是转成web大纲样式的，所以失真较少。

##分词功能

这里提供了分词的三种方法

一种是利用IKAnalyzer2012FF_u1.jar包，这个包是针对于Lucene4.0以上的，如果低版本请使用IKAnalyzer2012.jar；

两者在包的方法上都有差别。

这种分词的效果需要借助分词库才能精确分词，所以这里的工作量就转换成要建立一套合理的词库。

否则的话，这种方法对于专有名词分词效果很差，最差的情况下分成的全是单字，比如我搜索人名“王文路” ，

如果不加任何分词库的话，分出来的结果是： “王” 、 “文” 、“路” ，这显示不是我想要的结果，

如果我分词以后是拿着分词结果做全局检索的话，我只想搜索出包含“王文路”的数据，结果将包含“王”、“文”、“路”的内容

全部都搜索出来了，这显然比我理想中的结果集要大很多，这里的难点就是和进行实时的补充词库、本体等；

另外一种是调用百度的APIStore 的API接口，百度实现的分词效果不错，就算连人名也会精确搜索出，

并且给出每一个分词结果的相关度

百度还提供了其他很多种API，可以通过一样的方法进行访问。

另外一种方法也是利用IKAnalyzer进行分词的，不同的是添加了配置文件，配置ext_dict 和 ext_stopwords , 需要添加配置文件和词典文件，这里需要注意的是IKAnalyzer.cfg.xml配置文件只能放在src根目录下，而词典也就是dic文件可以放在任何位置，需要在IKAnalyzer.cfg.xml配置文件中声明路径。

对于以上路径问题，如果是maven项目，并且词典文件也是放在src下，编译的时候并不会把src文件编译到target下，所以需要在pom.xml

中使src进入build目录

src/main/resources

**/*.dic

true

本文标签： html图片转换word工具 GitHub

版权声明：本文标题：html图片转换word工具,GitHub 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/free/1700310235h390941.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

html图片转换word工具,GitHub

html图片转换word工具,GitHub

更多相关文章

又拍云 php sdk,GitHub

php 必应每日壁纸,GitHub

android+ota+apk,GitHub

html5写一个在线考试系统,GitHub

github html5视频直播,GitHub

als电影推荐 java api,GitHub

微信小游戏登录 第三方服务器,GitHub

ios编译产物和android编译产物,GitHub

git 重装系统后的恢复（同时配置gitee和github）

windows7环境下使用github教程（1）

关于访问及使用github相关问题整理记录

⭐️GitHub国内的镜像网站加速网址下载

全球最大的社交编程及代码托管网站Github介绍

Tool-微软Edge浏览器打开github慢的问题解决

windows下GitHub中.sh文件下载的问题解决方案

GitHub下载加速-浏览器插件篇（一）

解决GitHub访问慢的问题：DevSidercar的下载与配置（Windows）

java跳跳球代码,GitHub

Github+Hexo+matery博客搭建

hexo部署成功但是没效果_使用 Hexo+GitHub 搭建个人免费博客教程（小白向）

发表评论

推荐文章

微信小程序分析与学习(城市切换Switchcity)

逻辑回归模型：信用卡欺诈分析

利用jsch远程连接win10

java题 急

codevs2855 游乐园的迷宫 bfs

热门文章

『杭电1736』美观化文字

HDU 1736 美观化文字

计算机网络应用实训室锐捷,网络管理实训室

动态生产物流环境下物料搬运任务分配与路径规划的强化学习模型

【奇技淫巧】新的图片加载库，安卓移动开发背景换色

猿人学第十五：wasm问题

风靡全球的ChatGPT是什么？深度解读ChatGPT的方方面面！

Windows系统下载并安装ADB驱动

Windows 7 SP1不能更新的问题

ChatGPT 中文版：国内镜像网站推荐【12月持续更新】

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

苹果电脑windows系统换苹果系统

Win11系统崩溃错误修复指南：三种实用方法详解

如何封装一个自己的win7系统并安装到电脑做成双系统

微信小游戏登录第三方服务器,GitHub

java题急