URL GOTO=https://chinesepod.com/tools/glossary/entry/ugly
TAG POS=1 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=1 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
TAG POS=2 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=2 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
TAG POS=3 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=3 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
SAVEAS TYPE=EXTRACT FOLDER=E:\ FILE=pinyin.csv
我使用此代码提取文本和网址,但它总是提取错误的网址。 我在这里解释了更多细节:
因此文本与URL不匹配。怎么解决?
答案 0 :(得分:1)
@Shugar是对的,您只需要在文件中修改一个位置编号。
以下示例:
URL GOTO=https://chinesepod.com/tools/glossary/entry/ugly
' Extract "It's really ugly"
TAG POS=1 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=2 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
' Extract "This cat is really ugly"
TAG POS=2 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=3 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
' Extract "Thanks. You're really ugly!"
TAG POS=3 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=4 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
或者,您可以使用相对定位来查找句子的mp3网址,因为它是句子后的第一个下载链接,使用POS = R#(其中#是整数,也可能是负面的,如POS = R-3)。
URL GOTO=https://chinesepod.com/tools/glossary/entry/ugly
' Extract "It's really ugly"
TAG POS=1 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=R1 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
' Extract "This cat is really ugly"
TAG POS=2 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=R1 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF
' Extract "Thanks. You're really ugly!"
TAG POS=3 TYPE=TD ATTR=TXT:* EXTRACT=TXT
TAG POS=R1 TYPE=A ATTR=TXT:Download&&HREF:* EXTRACT=HREF