我有一个中文内容需要解析的文件。每个帖子在字段之间都有一些奇怪的分隔符,我试图隔离字段但无法识别分隔符。
Dim stringSplitter() as string = {" "}
Try
sampleResults = entry.Split(stringSplitter,StringSplitOptions.RemoveEmptyEntries)
.....
帖子内容的样本;
108087006686338t.qq.com/GAOCHUANG8899homeGAOCHUANG8899homehttp://t.qq.com/p/t/1080870066863382012-03-22 04:49:46
分隔符在第一组数字108087006686338 DELIMITTER t.qq.com/GAOCHUANG8899home后开始。我最初认为我可以使用json将其拆分,但这绝对不是json格式。
很抱歉,当我发布原文时,分隔符在发布此帖子时消失了。分隔符看起来像一个矩形块
编辑:
使用十六进制编辑器确定我将字符十六进制值标识为01,它看起来像一个句点,但句点的值为2E。这对任何人都意味着什么吗?
编辑:
重现问题:我可以根据十六进制值拆分字符串。如果值为“01”,那么我将如何根据该值拆分字符串。
编辑:
最终答案:`
Dim hvalue as Char = Char(1)
Dim stringSplitter() as string = {hvalue}
答案 0 :(得分:1)
假设您使用ascii代码$input
输入了01
和分隔符。
<强>的Perl:强>
my $input = ...
my @output = split(chr(01), $input);
print "$_\t" for @output; # print all items
上面的代码会将您的$input
拆分为@output
数组,因此您可以通过
$output[0] # first item
$output[1] # second item
...
$#output + 1 # number of items
<强>视觉工作室-2010 强>:
Dim hvalue as Char = Char(1)
Dim stringSplitter() as string = {hvalue}