我正在尝试使用Scalpel库抓取一个网站,并返回了一个我无法过滤的字节字符串列表。
我有一个Lazy Byte Strings列表,例如:
["<a href=\"?ep=17&fmt=0\">Jerk</a>", "<a href=\"?fmt=0&yr=1997\" onmouseover=\"img_hov('t1997')\" onmouseout=\"img_norm('t1997')\"><img src=\"image/1997.gif\" alt=\"1997\" width=\"84\" height=\"43\" name=\"t1997\" border=\"0\"></a>"]
我希望过滤此列表以仅查找包含&#39; ep =&#39;的延迟字节字符串。
我还需要&amp;字符串中的符号不是&amp; amp
答案 0 :(得分:1)
通常的filter
非常适合过滤列表。用它!不幸的是,bytestring
包没有提供很好的工具来查找惰性ByteString
的任意子串,尽管它确实提供了严格的子串。作者可能已经决定在懒惰的情况下使这些函数有效地工作太难了。将每个惰性ByteString
转换为严格ByteString
或String
可能最简单,然后使用Data.ByteString
或Data.List
中的工具执行搜索。很难理解你对&
的看法,所以你必须澄清一下。