我想知道哪种方法更好地将网页内容保存到数据库以进行缓存?
更新
更深入地我有很多表(URL,Caches,ParsedContents,Words,Hits等),对于URL表中的每个url,我发送请求并将响应保存到缓存表中。这是我的引擎的Downloader(Google的URLResolver)部分。然后索引器部分的行为是执行解析和与此相关的任务。和压缩/解压缩仅在新内容进行缓存或解析时执行
答案 0 :(得分:1)
更好的方法是使用ASP.NET中的内置缓存功能。 Searching StackOverflow for [asp.net] [caching]是一个良好的开端,之后(或之前),www.asp.net和Google上的类似搜索会让您走得更远。
在回复您的评论时,我可能会将数据保存为扁平字符串。在存储方面,它可能不是性能方面的最佳选择,但如果您要对文本内容执行搜索,则不希望每次都必须压缩/解压缩或转换为二进制文件,因为在SQL Server中可能没有(简单)方法可以做到这一点。只需确保您拥有正确设置的所有intexes和全文功能。