需要在<h3>,<li>和<strong>之间使用applescript </strong> </li> </h3>进行提取

时间:2014-06-12 20:10:59

标签: applescript

我是Applescript的新手,我认为这是你能想象到的最简单的脚本,但我还是无法让它发挥作用。

我想做的是:

  1. 从页面获取HTML代码
  2. 从标记之间获取名称
  3. <strong>代码
  4. 之间获取列名称
  5. <*li><strong>any value<*/strong></li>
  6. 之间获取列的值
  7. 使用第1列创建excel文件&#34;名称&#34; +来自2的值,以及标题为3的多列,以及来自4的值。
  8. 代码:

    <pre>
        <div>
            <div>
                <h3>NAME</h3>  
            </div>
    
            <div>
                <ul class="circle">
                    <li><strong>Admin: </strong>Name</li>
                    <li><strong>Phone </strong>+XX XX XXX XXX</li>
                    <li><strong>Email: </strong><a href="mailto:email@email.com">email@email.com</a></li>
                </ul>
            </div>
    
            <div>
                <ul>
                    <li><strong></strong></li>
                    <li><strong>Title: </strong>value</li>
                    <li><strong>Title: </strong>value</li>
                    <li><strong>Title: </strong>value</li>
                    <li><strong>Title: </strong>value</li>
                </ul>
            </div>
        </div>
    </pre>
    

1 个答案:

答案 0 :(得分:0)

您可以在AppleScript中搜索子字符串:

set AppleScript's text item delimiters to "<strong>"

然后,您可以使用text item #(其中#是数字)引用每个分隔项(每个分隔符之间的内容),或者使用every text item获取分隔项的完整列表。

通过执行此操作,您可以对文本进行切片,获取文本项,再次设置分隔符以优化所需内容,从中获取所需的下一个文本项等,直到您拥有所需的子字符串。您可以通过将其放入子例程(函数)来提高效率。

当设置AppleScript的文本项分隔符时,当您通过as string将字符串列表转换为字符串时,它们也将插入列表元素之间。这也允许您通过获取文本项列表,更改分隔符,然后使用as string重新加入它们,轻松地进行批量查找/替换操作。

当你完成其他事情时,总是set AppleScript's text item delimiters to ""是一个好习惯。 (有些人认为更好的做法是先将它们保存在变量中,然后再更改它们,例如set oldDelims to applescript's text item delimiters,然后再将它们更改回来,但这不是我的个人风格。)