首先,这是一个合法的要求。我需要在我们的Intranet上获取网站的功能ID。我需要查找大约3000个人,而不是手动点击每个站点并查看id,复制并粘贴到我的excel工作表中,我以为我只是循环遍历列表(我已经拥有)和屏幕刮擦owenr id。我以为我会构建一个cf页面来获取页面并将生成的内容存储到数据库中。我想做的是删除返回页面中的所有其他内容并仅保留所有者ID值。在下面的代码中,我正在寻找的值是tb1245。这是返回的结果内容:
<table>
<tr>
<td>Site/Folder Name:</td>
<td>AppliedScien<td>
</tr>
<tr>
<td>Vanity URL:</td>
<td>N/A</td>
</tr>
<tr>
<td>Owner ID:</td>
<td>tb1245
</tr>
<tr>
<td>Owner Name:</td>
<td>
<a style="font-family: ariel">Tom W BEST (tb1245) </a>
<a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="mailto:tb1245@us.domain.com">*</a>
<a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="javascript:webPhone('tb1245')">(</a>
</td>
</tr>
<tr>
<td>Web/Server Admin:</td>
<td>
<a style="font-family: ariel">Ohtro J Pepper (tc6139) </a>
<a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="mailto:ot9533@swmail.domain.com">*</a>
<a style="font-family: 'Wingdings'; font-size: 12pt; color: blue;" href="javascript:phonebook('ot9533')">(</a>
</td>
</tr>
有人可以帮我吗?我应该在星期五之前把它完成,但男人就是这种思想工作,所以我宁愿通过冷敷来打动我的老板。 :d
TIA
答案 0 :(得分:1)
假设您已经获得了循环的3000个网址列表。对于每一个:
使用CFHTTP获取内容。它在cfhttp.fileContent中返回。
然后,您需要使用正则表达式解析此提取该ID。这对我的内容很有用:
<cfoutput>
ID: #reReplaceNoCase(cfhttp.fileContent, ".*<tr>\s*<td>Owner ID:</td>\s*<td>([a-z0-9]+)\s*</tr>.*", "\1")#
</cfoutput>