如何在swift中将html表数据解析为字符串数组?

时间:2017-11-25 14:25:50

标签: web-scraping html-parsing swift4 swiftsoup

我正在开发一个iOS应用程序,我需要从swiftsoup库的链接中解析HTML。我已经做了。但它将所有表数据显示为字符串。我需要获得应该存储在单独数组中的单独数据。

这是表格:

        <table width="880" border="1" cellspacing="0" cellpadding="0">
      <tr>
        <td width="81"><strong>Trip Name </strong></td>
        <td width="159"><div align="center"><strong>Starting Time from Campus </strong></div></td>
        <td width="186"><div align="center"><strong>Starting Spot &amp; Time </strong></div></td>
        <td width="444"><strong>Remarks</strong></td>
      </tr>
      <tr>
        <td><div align="center">Normal-1</div></td>
        <td><div align="center">6:30 AM </div></td>
        <td>Rupsha, 7:20 AM </td>
        <td>Will back via Royalmore &amp; Ferighat  </td>
      </tr>
      <tr>
        <td><div align="center">Normal-1</div></td>
        <td><div align="center">6:45 AM </div></td>
        <td>Moylapota, 7:25 AM </td>
        <td>Will back via Shibbari - Sonadangha </td>
      </tr>


    </table>

我已经完成了解析字符串的问题 旅行名称从校园开始时间开始时间和时间时间备注正常1

我使用的代码:

let doc: Document = try! SwiftSoup.parse(html)

for element: Element in try! doc.select("table[width=880]")
{
    let linkText : String = try! element.text();
    print(linkText)
}

The Normal-1,6:30 AM,7:20 AM,将通过Royalmore&amp; Ferighat将存储4个独立的阵列。

1 个答案:

答案 0 :(得分:1)

我不确定您是要将其存储为每行一个数组还是每列一个数组。以下是如何以每行一个数组的形式存储它。使用map或其他数组转换将其转换为您想要的样式:

var tableContent = [[String]]()
let document = try! SwiftSoup.parse(html)
for row in try! document.select("table[width=\"880\"] tr") {
    var rowContent = [String]()

    for col in try! row.select("td") {
        let colContent = try! col.text()
        rowContent.append(colContent)
    }
    tableContent.append(rowContent)
}

print(tableContent)

(如果您在制作中执行此操作,请正确处理错误而不是所有try!