将PHP HTML文件解析为数据库

时间:2012-12-05 19:52:14

标签: python beautifulsoup

我的应用程序需要包含可搜索的PHP手册。看看Chmlib和我手边的时间,看起来我无法通过制作CHM查看器来实现。所以我虽然我会发现如果我能获得manul的XML版本......都不存在。作为最后的手段,我已经决定使用Python和beautifulsoup将文件解析到数据库中,但后来我遇到了PHP手册中记录其功能的格式问题,以及我认为整个想法是否实用

您认为这甚至可能吗?任何帮助我的任务的指针?有没有其他方法可以将PHP文档打包到数据库中(如SQLite3)

1 个答案:

答案 0 :(得分:0)

我使用了来自SVN的PHP XML,如Paladin所建议的那样,从那些DocBook XML我使用docs目录中的PHP Manual builder脚本配置然后构建我需要的格式

检查PhD page

中的说明