我是一名研究人员,尝试以更快的方式提取用户留下的评论,然后分别复制所有内容。 我该如何从每个类中提取内容到cvs文档中的单独列中?
这是我必须用来从中提取日期的代码。每个评论看起来都是这样,只是在彼此之间反复出现。我不确定最后2个/ div是干什么的。
'C:\cygwin64\home\<username>\.inputrc
我想最后得到一个Excel工作表,其中每个注释都带有一行,并为用户名,初始日期,初始注释,第二个日期,第二个注释提供一列。
我试图将代码重新排列到表中,以获得更简洁的概述:
<div class="rate-list-item">
<div class="rate-list-title">
<div class="rate-list-avatar"><img alt="Image" src="image source" class=""></div><span class="rate-list-title- username">Username</span></div>
<div class="rate-list-box">
<div class="rate-list-box-top"><span class="rate-list-title-date">Initial Date</span
<div class="rate-list-sku"></div>
</div>
<div class="rate-list-content">Initial Comment</div>
<div class="rate-list-append">
<div class="rate-list-append-date">Second Date</div>
<div class="rate-list-append-content">Second Comment</div>
</div>
</div>
</div>
<div class="table">
<div class="rate-list-item">
<span class="rate-list-title-username">Username</span>
<div class="rate-list-box-top"><span class="rate-list-title-date">1st Date</span></div>
<div class="rate-list-content">1st Comment</div>
<div class="rate-list-append-date">2nd Date</div>
<div class="rate-list-append-content">2nd Comment</div>
</div>
</div>
.table{display:table; width:100%}
.rate-list-item{display:table-row;color:white}
.rate-list-username{display:table-cell;}
.rate-list-box-top{display:table-cell;}
.rate-list-date{display:table-cell;}
.rate-list-content{display:table-cell;}
.rate-list-append-date{display:table-cell;}
.rate-list-append-content{display:table-cell;}
.rate-list-box{display:table-cell;}
.rate-list-title-date{display:table-cell;}
这使它看起来更好,但是我不得不对初始代码进行大量编辑。通过使用var body=document.body,
parent=body.querySelector(".table"),
rows=parent.querySelectorAll(".rate-list-item"),
table=document.createElement("table"),
tbody=document.createElement("tbody"),
row=document.createElement("tr"),
cell=document.createElement("td"),
x=rows.length,
cells=rows[0].querySelectorAll(".column"),
y=cells.length,
i,j;
table.appendChild(tbody)
for(i=0;i<x;i++){
row=row.cloneNode(0);
cells=rows[i].querySelectorAll(".column");
y=cells.length;
for(j=0;j<y;j++){
cell=cell.cloneNode(0);
cell.innerHTML=cells[j].innerHTML;
row.appendChild(cell);
}
tbody.appendChild(row);
}
body.appendChild(table);
,我能够删除一些不需要的类,并通过“查找并替换”功能设法快速编辑了更多部分,但它并不能解决所有问题,并且要遍历数千条注释,因此每个部分都不是真的一个选项。
而且我仍然无法将其提取到excel文件中(可能可以从此处执行此操作,但由于所有编辑,我认为这不是最好的方法。)
我不是一名程序员,所以可以提供任何帮助/见解!