在VS 2010中,我有一个很大的字符串列表,列表中的每个项目也包含字符串列表(它不再进一步)。好消息是只会增加。什么都不会从列表中删除。
我不想使用数据库。由于列表可能会变得非常大,因此XML对我来说似乎很慢。我找不到任何针对我案例的常见解决方案。有什么想法吗?
编辑:好的,我的一些代码会让我觉得更清晰。
Class Word
Public theWord As String
Public SubWords As New List(Of SubWord)
Public Count As Integer = 1
Sub New(ByRef Word As String)
theWord = Word
End Sub
Public Sub AddSubWord(ByRef Word As String)
Dim SubWordCount As Integer = SubWords.Count - 1
Dim Found As Boolean
For i = 0 To SubWordCount
If SubWords(i).theWord = Word Then
SubWords(i).Count += 1
Found = True
Exit For
End If
Next
If Found = False Then
SubWords.Add(New SubWord(Word))
End If
End Sub
Public Overrides Function ToString() As String
Return theWord
End Function
End Class
Class SubWord
Public theWord As String
Public Count As Integer = 1
Sub New(ByRef Word As String)
theWord = Word
End Sub
Public Overrides Function ToString() As String
Return theWord
End Function
End Class
我的名单也是:
Dim Words As New List(Of Word)
目的是如果单词不在列表中,则添加一个单词列表,如果不增加它的计数。子词相同。之后,所有列表将根据其计数进行排序。将会有很多单词,并且每个单词都有一个巨大的子词列表。
答案 0 :(得分:1)
XML似乎是最好的选择,但是如果您真的关心效率,并且您确定数据结构将来不会改变,您可以简单地将数据存储在分隔的文本文件中。例如:
Private Sub SaveList(filePath As String, list As List(Of List(Of String)))
Const fieldDelimiter As String = ","
Const recordDelimiter As String = Environment.NewLine
Dim temp As New List(Of String)()
For each i as List(Of String) in list)
temp.Add(String.Join(fieldDelimiter, i.ToArray()))
Next
Dim contents As String = String.Join(recordDelimiter, temp.ToArray())
File.WriteAllText(filePath, contents)
End Sub
或者,更有效率:
Private Sub SaveList(filePath As String, list As List(Of List(Of String)))
Const fieldDelimiter As String = ","
Const recordDelimiter As String = Environment.NewLine
Using writer As New StreamWriter(filePath)
Dim firstRecord As Boolean = True
For Each record as List(Of String) In list)
If firstRecord Then
firstRecord = False
Else
writer.Write(recordDelimiter)
End If
Dim firstField As Boolean = True
For Each field As String In record
If firstField Then
firstField = False
Else
writer.Write(fieldDelimiter)
End If
writer.Write(field)
Next
Next
End Using
End Sub
这种方法的缺点是您需要确保您使用的分隔符永远不会出现在任何记录的任何字段中。如果您确定字符串永远不会包含某些不寻常的字符,那么您可以使用它。否则,替代方案是逃避任何事件。例如,如果您使用逗号作为分隔符,则需要将,
的所有出现替换为\,
,然后将\
的所有出现替换为{{1} }}。当然,这不仅会使您的保存逻辑变得复杂,也会使您的加载逻辑变得复杂。
<强>更新强>
如果速度是您的主要考虑因素,并且您可以保证单词和子词都少于100个字符,那么读取和写入数据的最快方法是将每个单词写在文本文件的新行上,后面是使用固定宽度字段的每个Subword。例如,如果最大长度为5,则文件可能如下所示:
\\
正如您在该示例中所看到的,有四个单词(“单词”,“W2”,“W3”和“W4”),它们各自具有不同数量的子词。 “Word”的子词是“Sub1”和“Sub2”。 “W3”没有子字,W4有2个(“SubWd”和“Sub2。”)。
因此,要写出该文件,您可以这样做:
Word Sub1 Sub2
W2 SW1 SW2 SW3
W3
W4 SubWdSub2.