用于将数据从表格写入电子表格的正则表达式脚本

时间:2012-04-02 21:57:09

标签: javascript html regex html-table export-to-csv

我正在尝试编写一个脚本,该脚本将把一系列基本html表格描述为一个工作电子表格,以便在数据库中使用,这些表格描述了不同国家/地区中某些单词的特定变体。每个表格适用于跨国家/地区的单个单词的翻译。在html中,它采用以下格式:

<h5><a name="akas"> equivalent names in different countries </a> </h5>
<table border="0" cellpadding="2">

<tr>
<td>character string </td>

<td> country name / country name / country name</td>

</tr>

<tr>
<td>character string </td>

<td>country name</td>

</tr>

..................此格式一直持续到表结束

</table>

国家/地区名称在表格之间重复,应该表示电子表格中的列标题,等效字词的行位于其中。我对regex(我发现真的很困惑)和Javascript中的初学者都是新手。我再次寻求有关如何将此类数据重新排列到工作电子表格中以便在更大的数据库中使用的帮助。如果有人能帮助我,我将非常感激。

2 个答案:

答案 0 :(得分:1)

您应该查看DOM解析和XPath。 XPath允许您查询html文件以获取您需要的任何节点的内容。

答案 1 :(得分:0)

您可以将HTML表格粘贴到电子表格中。