我正在尝试从httpclient响应中提取页面名称。 我想使用正则表达式来提取/ bts格式的所有链接。 (这部分工作正常,我没有得到任何不受欢迎的链接) 例如:当模式是“bts / pagename.htm”>链接名称“我想要提取该页面名称。 我有它正在努力提取上面的完整示例,但我似乎无法提取页面没有其余的模式。模式匹配是bts / to但我不想把它们保存在我的输出中。我想我真的想要以bts /开头的页面名并以.htm结尾 也许它不可能我不确定
答案 0 :(得分:0)
是否要提取文件名的字符序列?
我不太擅长正则表达。但也许你可以试试这个
(?<=/)\w+(?=.)