我希望创建一个Facebook应用程序,除了CHM格式外,我想要使用的数据不可用。
是否可以将CHM文件转换为CSV或SQL?我们有现成的工具吗?
感谢您一如既往的帮助。
答案 0 :(得分:3)
顺便说一句,您应该指定您希望构建此数据集的语言(英语,阿拉伯语......),因为这会影响图书来源的选择和转换实用程序。
识别数据内容来源:
有趣的是,对于所有[交互式]在线Hadeeth搜索工具,例如上一个
CRCC's Compendium of Muslim Texts网站(来自MSA West的原始版本,但不知道在MSA网站上不再可用/工作),似乎没有任何可下载的版本的基础数据库!
书本本身有几个在线版本,特别是你提到的流行版本,但是你需要正确解析和索引它们以保留参考文献等。另外,回到书本,你将不得不自己联系。
关于转换CHM文件 ...
没有我知道的开源或免费软件程序,但共享软件ABC Amber CHM converter(约25.00美元)似乎是为此目的的黄金标准。
几年前我才对这个软件进行了过多的曝光,一次性转换工作类似于你正在考虑的那个。 Amber转换器“做到了”;幸运的是,帮助页面的底层结构暴露了很多规律性,这使得可以相对直接地制表成CSV /数据库字段
ABC Amber转换器支持多种语言,包括阿拉伯语(但我只将其用于英语)。
答案 1 :(得分:1)
有一个众所周知的开源* nix lib,名为libchm,大多数* nix chm查看器都是基于它的。它附带了一个工具,可以将.chm解压缩到它的.html原件(然后你必须将html表转换为.csv)
Lazarus / Free Pascal也有libs,甚至可以写,但afaik没有随便做“chm编译器”工具。