如何将每个已删除的项目组织到csv行中?

时间:2009-12-03 18:28:42

标签: python django csv

将抓取的数据整理到csv的最佳方法是什么?更具体地说,每个项目都是这种形式

url
"firstName middleInitial, lastName - level - word1 word2 word3, & wordN practice officeCity."
JD, schoolName, date

示例:

http://www.examplefirm.com/jang
"Joe E. Ang - partner - privatization mergers, media & technology practice New York."
JD, University of Chicago Law School, 1985

我想把这个项目放在这个表格中:

(http://www.examplefirm.com/jang, Joe, E., Ang, partner, privatization mergers, media & technology, New York, University of Chicago Law School, 1985)

这样我就可以将它写入csv文件以导入到django db。

这样做的最佳方式是什么?

谢谢。

1 个答案:

答案 0 :(得分:2)

这真的没有捷径。第1行很容易。只需将其分配给url即可。第3行可能会在,上拆分而不会产生任何不良影响,但第2行必须手动解析。你对word1-wordN了解多少?你确定“练习”永远不会是一个“单词”。你确定单词只有一个字吗?他们可以被引用吗?它们可以包含破折号吗?

然后我会解析开始和结束位,所以你留下了一个单词列表,用逗号分隔它们和/或& amp; amp; (在& amp;之前是否有一致的逗号;?你的格式说是,但你的例子说不。)如果有不同数量的单词,你不想在你的元组中内嵌它们,因为你不要我不知道怎么把它们拿出来。从你的单词创建一个列表,并将其添加为元组的一个元素。

>>> tup = (url, first, middle, last, rank, words, city, school, year)
>>> tup
('http://www.examplefirm.com/jang', 'Joe', 'E.', 'Ang', 'partner', 
['privatization mergers', 'media & technology'], 'New York', 
'University of Chicago Law School', '1985')

更具体地说?你自己在那里。