当我使用read.table获取数据时,有一件奇怪的事情。
data=read.table('/home/tiger/nasdaqlisted.txt',head=T,sep='|')
dim(data)
[1] 750 6
实际上,文件中有2454行,这有什么不对? http://freeuploadfiles.com/bb3cwypih2d2
答案 0 :(得分:3)
我认为问题来自于某些名称包含引号字符'
(在Angie's List, Inc.
等名称中)。
read.table
quote
为"\"'"
的默认参数为read.table("path/to/file", header=TRUE, sep="|", quote="")
,需要更改才能正确读取数据。
read.delim
根据@mrdwab建议,将"\""
作为默认quote
参数的read.delim("path/to/file", header=TRUE, sep="|")
无需任何更改即可运行:
{{1}}