提取脚本标签内的数据

时间:2019-01-14 16:46:37

标签: elixir html-parsing

我对Elixir编程不熟悉,我编写了一个脚本来使用httpoison从URL提取电影列表,这会产生原始的html

对于解析,我使用的是floki,所以电影列表位于JavaScript tag内,这很难解析。

我想如果可以创建/加载完整的DOM树然后对其进行解析,会更容易。

有什么方法可以使事情变得更容易?

1 个答案:

答案 0 :(得分:0)

IMDbReactInitialState.push({"user":{"id":"... push的参数对我来说就像JSON。

因此,如果您具有script标记的内容,请将其剥离IMDbReact...,则可以使用https://hex.pm/packages/jason之类的包将其转换为Elixir数据结构