在Weka或RapidMinder中导入Web访问登录数据的过程

时间:2015-04-07 15:46:30

标签: weka rapidminer

请原谅我的无知。我是Weka和RapidMiner的初学者,用于学术目的。

文件格式是简单的.txt格式。我有某个网站的网络访问登录,它有以下字段和其他信息:

#Software: Microsoft Internet Information Services 7.5
#Version: 1.0
#Date: 2015-02-23 00:03:19

#Fields: date time s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs-version cs(User-Agent) cs(Cookie) cs(Referer) cs-host sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken

(每个空间新字段开始后)

因此,我的问题是,如果有办法导入具有这些特定字段(以空格分隔)的数据?此外,某些属性可能有" - ",是否会以某种方式照顾?

1 个答案:

答案 0 :(得分:0)

如果保证属性名称中没有空格,并且单个数据值本身不包含空格,则可以使用RapidMiner Read CSV运算符。运行导入配置向导并选择空格作为列分隔方法。