我在数组中创建一个数组。 (文章中的段落)。然后我把它压成一个数组。我们称之为ARRAY_COMPARISON_REFERENCE
接下来,我正在创建一个数组,为每个下一段提供一个数字。第一篇文章的第一段是第一段,第二段是第二段,第二篇第一段是第三段,依此类推。我们称之为ARRAY_INFORMATION_REFERENCE
每当我发现两段之间有50%的单词匹配时,我想将段落文本保存到文件中。我使用.flatten遍历所有文章,并在索引号中引用。但是,这些与ARRAY_INFORMATION_REFERENCE的索引号不对应。
如何将(两级).flatten转换为常规(每个新段落+ = 1)引用?
paragraphnumber = Array.new
paragraphs = []
Dir.glob("*.txt").each do |textfile|
#first level: textfiles
paragraphtext = []
File.foreach(textfile, "\.\r") do |paragraph|
#second level: paragraphs within the textfiles
#here I fill the array, effectively starting the index and adding 1 to the index at every iteration through the loop.
# THIS IS THE ARRAY_INFORMATION_REFERENCE
paragraphtext << paragraph
end
paragraphs << paragraphtext
end
#here i make the second index:
paragraphs.flatten.each_with_index do |x, indexx|
paragraphs.flatten.each_with_index do |y, indexy|
count = x.count { |k,v| y.include?(k) }
if count > 20
#these are the reference numbers
index_paragraph1 = "#{indexx}"
index_paragraph2 = "#{indexy}"
#And here i try to use the reference of the second Array, to find the information out the first Array, which is not working
#THIS IS THE ARRAY_COMPARISON_INDEX
information_paragraph1 = paragraphtext.at(indexx)
information_paragraph2 = paragraphtext.at(indexy)
end
end
end
问题是:ARRAY_COMPARISON_REFERENCE中段落的引用号与ARRAY_INFORMATION REFERENCE的段号的引用号不对应。使用.flatten索引显然是以不同的方式制作的。如何在两个索引之间进行转换?
答案 0 :(得分:1)
由于您未提供所有相关代码,而我们无法查看paragraphs
中的内容,因此我们无法知道flatten
的效果。
但是,我们可以说,如果flatten没有效果(即如果paragraphs
内没有数组),则展平的索引将仅匹配未展平的索引。)