将列表列表保存到文件的最有效方法是什么?

时间:2012-11-17 18:04:23

标签: database vb.net visual-studio file-io

在VS 2010中,我有一个很大的字符串列表,列表中的每个项目也包含字符串列表(它不再进一步)。好消息是只会增加。什么都不会从列表中删除。

我不想使用数据库。由于列表可能会变得非常大,因此XML对我来说似乎很慢。我找不到任何针对我案例的常见解决方案。有什么想法吗?

编辑:好的,我的一些代码会让我觉得更清晰。

Class Word
    Public theWord As String
    Public SubWords As New List(Of SubWord)
    Public Count As Integer = 1
    Sub New(ByRef Word As String)
        theWord = Word
    End Sub
    Public Sub AddSubWord(ByRef Word As String)
        Dim SubWordCount As Integer = SubWords.Count - 1
        Dim Found As Boolean
        For i = 0 To SubWordCount
            If SubWords(i).theWord = Word Then
                SubWords(i).Count += 1
                Found = True
                Exit For
            End If
        Next
        If Found = False Then
            SubWords.Add(New SubWord(Word))
        End If
    End Sub
    Public Overrides Function ToString() As String
        Return theWord
    End Function
End Class

Class SubWord
    Public theWord As String
    Public Count As Integer = 1
    Sub New(ByRef Word As String)
        theWord = Word
    End Sub
    Public Overrides Function ToString() As String
        Return theWord
    End Function
End Class

我的名单也是:

Dim Words As New List(Of Word)

目的是如果单词不在列表中,则添加一个单词列表,如果不增加它的计数。子词相同。之后,所有列表将根据其计数进行排序。将会有很多单词,并且每个单词都有一个巨大的子词列表。

1 个答案:

答案 0 :(得分:1)

XML似乎是最好的选择,但是如果您真的关心效率,并且您确定数据结构将来不会改变,您可以简单地将数据存储在分隔的文本文件中。例如:

Private Sub SaveList(filePath As String, list As List(Of List(Of String)))
    Const fieldDelimiter As String = ","
    Const recordDelimiter As String = Environment.NewLine
    Dim temp As New List(Of String)()
    For each i as List(Of String) in list)
        temp.Add(String.Join(fieldDelimiter, i.ToArray()))
    Next
    Dim contents As String = String.Join(recordDelimiter, temp.ToArray())
    File.WriteAllText(filePath, contents)
End Sub

或者,更有效率:

Private Sub SaveList(filePath As String, list As List(Of List(Of String)))
    Const fieldDelimiter As String = ","
    Const recordDelimiter As String = Environment.NewLine
    Using writer As New StreamWriter(filePath)
        Dim firstRecord As Boolean = True
        For Each record as List(Of String) In list)
            If firstRecord Then
                firstRecord = False
            Else
                writer.Write(recordDelimiter)
            End If
            Dim firstField As Boolean = True
            For Each field As String In record
                If firstField Then
                    firstField = False
                Else
                    writer.Write(fieldDelimiter)
                End If
                writer.Write(field)
            Next
        Next
    End Using
End Sub    

这种方法的缺点是您需要确保您使用的分隔符永远不会出现在任何记录的任何字段中。如果您确定字符串永远不会包含某些不寻常的字符,那么您可以使用它。否则,替代方案是逃避任何事件。例如,如果您使用逗号作为分隔符,则需要将,的所有出现替换为\,,然后将\的所有出现替换为{{1} }}。当然,这不仅会使您的保存逻辑变得复杂,也会使您的加载逻辑变得复杂。

<强>更新

如果速度是您的主要考虑因素,并且您可以保证单词和子词都少于100个字符,那么读取和写入数据的最快方法是将每个单词写在文本文件的新行上,后面是使用固定宽度字段的每个Subword。例如,如果最大长度为5,则文件可能如下所示:

\\

正如您在该示例中所看到的,有四个单词(“单词”,“W2”,“W3”和“W4”),它们各自具有不同数量的子词。 “Word”的子词是“Sub1”和“Sub2”。 “W3”没有子字,W4有2个(“SubWd”和“Sub2。”)。

因此,要写出该文件,您可以这样做:

Word Sub1 Sub2
W2   SW1  SW2  SW3
W3
W4   SubWdSub2.