Question

我正在使用网站代理从当地海洋学院获取数据。 Feed可在此处获取：http://www.geomar.de/service/wetter/feed/

Feed内部是一个标记，用于保存带有html标记的天气传感器内容：例如Lufttemperatur =空气温度 Wassertemperature =水温等

我正在尝试获取每个工作站的值（例如，用于工作站Institut的Lufttemperatur，用于工作站研究所的Wassertemperatur等）我在rubular.com上获得了正则表达式的帮助：http://rubular.com/r/INYCQF5Y6H

在rubular上我得到了一个有效的回复但是在我的红宝石中我得到一个空的[]

我很高兴能得到任何帮助感谢

Answer 1

我当时建议您使用nokogiri这是一个优秀的xml解析器，但在查看xml代码之后，我意识到您正在寻找的数据根本没有结构化的xml标记。这就是为什么对于这个特定的页面，基础文本研究更合适的原因：

您可以使用此模式获取所有键/值：

([^:\s<>][^:><]+): ([^<]+)

显然，你需要在{。\ n}之后处理像°这样的html实体。