我下载了html表单,用htmlCleaner清理它。 最初它看起来像这样(现在它已经很好了,但我不知道如何展示它的简单方法,我希望,这已经足够了):
...
<form action="complete" method="POST" enctype="multipart/form-data">
Please fill in your username:
<input type="text" name="employee" />
</BR>
Reason:
<BR/>
<textarea cols="50" rows="5" name="reason"></textarea>
</BR>
<input type="submit" value="Complete">
</form>....
是否有XPath表达式提取“请填写您的用户名”和“原因”,但是在两个单独的字符串中? 另外,htmlCleaner不支持所有表达式,这里是 - &gt; list&lt; - 可能的表达方式。
由于
答案 0 :(得分:0)
你需要的只是:
//input[@name="employee"]/@value
//input[@name="reason"]/@value
或(如果您需要<form>
元素中的文字):
//form/text()[1]
//form/text()[2]
答案 1 :(得分:0)
你不能,因为你想要提取的两段文字都是,而且只有FORM的孩子如果他们每人被包裹一个SPAN或DIV,你可以单独找到它们。
您可以使用'child'和位置
单独获取它们