我希望将客户网站转换为HTML。我比较新,因为我的技能更多地指向网站(设计)的前端,所以我很丢失。该网站为allegianceglobalinvestigations.com,如果您滚动浏览,则每个网页都有相同的网址。如何从中创建HTML文件/模板?我假设因为有4页,我最终会得到4个文件?我是否需要在文本中使用OCR?
答案 0 :(得分:1)
如果您查看来源,它会显示其他帧的网址。如果您只查看该网址,则可以获得该框架的来源。如果您尝试“取消关注”网站,则可以将所有来源与所有更改一起使用。我认为这就是你所要求的。
那里的文字非常少,所以如果你想在网站上使用真实的文字,你需要的唯一的OCR是你的眼睛和键盘。
是的,你最终会得到4个不同的文件。每页一个。
祝你的项目好运,最好的学习方法就是直接潜入!
答案 1 :(得分:0)
这是一个基于框架的网站,其中一个框架中的顶部菜单在另一个框架中的四个页面之间进行选择。每个子页面的内容在表格中编码为JPEG图像。
每个子页面都有文件: content.htm
,sis.html
,services.htm
和contact.htm
。使用这么少量的文本,您也可以只将图像中当前的文本键入这些文件的正文而不是使用OCR。使用文字替换<body>
和</body>
之间的所有内容,然后使用HTML标记您喜欢的内容。
要删除框架,请将menu.htm
文件中的body元素的内容粘贴到四个子页面的body元素的开头。