无法使用vb.net从网页源获取非英文字符

时间:2018-08-01 17:56:59

标签: .net vb.net .net-4.5

我多次使用下面提供的代码块来获取在我的情况下始终有效的网页源。

ServicePointManager.SecurityProtocol = SecurityProtocolType.Tls12
Dim wc As New WebClient
wc.Encoding = Encoding.UTF8
Dim Source As String = wc.DownloadString("https://www.rp.pl/")

此代码未获得使用过的Encoding的波兰语字符。我也没有运气尝试过其他可用的Encoding。像在页面中一样,标题为“RafałTrzaskowski kontra TVP。Chce sprostowania”,但是在通过上述代码段获取源代码之后,它显示的是“RafałTrzaskowski kontra TVP。Chce sprostowania”。

任何人都可以帮助我更正我的代码,以便我准确地获取页面源代码吗?

2 个答案:

答案 0 :(得分:1)

只需查看网页使用哪种编码并与之匹配即可。

SwingUtilities.invokeLater

它将起作用。

答案 1 :(得分:0)

您是否尝试输出波兰语字符以确保问题不在于控制台的限制?或者,将“ Source”变量保存在txt文件中,以在记事本中查看。该字符串可能包含正确的值,但无法显示。至少这是我过去遇到的一个问题