我正在尝试为我大学的告示板制作手机应用程序。
这是notice board。并且每个通知都是HTML page。通知的URL结构很简单,“docid”给出了每个通知的ID。据我猜测,它是一个自动递增键。
到目前为止,我的策略是通过递增docid值来获取带有get请求的HTML文件。解析html以获得所需的值,例如标题,发布者,注意,日期和正文。
最初要将现有通知存储到数据存储区,然后cron作业可以检查新通知。
这些值集将作为JSON提供给手机应用程序。
通知的正文部分使用HTML标记进行格式化。我想保留格式。我只是将主体存储为包含所有html标签的字符串。这可能是一个问题吗?有没有更好的方法来保留格式?
我必须这样做,因为我无法预先了解什么类型 格式化已完成