第10行32-33中ipc_version的数据无效

时间:2018-03-16 20:42:38

标签: csv sas

按照以下代码将CSV文件导入SAS时

data SASDATA.IPClassification ;
infile 'R:/Li/PATSTAT/IPClassification.csv' DLM = ',' DSD missover lrecl = 32767 firstobs = 2 ;
input appln_id :29. ipc_class_symbol &:$29. ipc_class_level :$29. ipc_version :MMDDYY10. ipc_value :$29. ipc_position :$29. ipc_gener_auth :$29. ;
run ;

输出数据显示除了appln_id之外的所有变量都以ipc_class_symbol的体积记录​​。日志中的记录显示如下,

NOTE: The infile 'R:/Li/PATSTAT/IPClassification.csv' is:
   Filename=R:\Li\PATSTAT\IPClassification.csv,
   RECFM=V,LRECL=32767,
   File Size (bytes)=9144764490,
   Last Modified=22Sep2017:21:09:41,
   Create Time=15Mar2018:14:50:17

 NOTE: Invalid data for ipc_version in line 10 32-33.
 RULE:     ----+----1----+----2----+----3----+----4----+----5----+----6----+----7----+----8----+----9
 10        2,C07K  14/00,A,2006-01-01,I, ,EP 33
 appln_id=2 ipc_class_symbol=C07K  14/00,A,2006-01-01,I ipc_class_level=  ipc_version=. ipc_value= 
 ipc_position=  ipc_gener_auth=  _ERROR_=1 _N_=9
 NOTE: Invalid data for ipc_version in line 14 32-33.
 14        2,C07K  16/26,A,2006-01-01,I, ,EP 33
 appln_id=2 ipc_class_symbol=C07K  16/26,A,2006-01-01,I ipc_class_level=  ipc_version=. ipc_value= 
 ipc_position=  ipc_gener_auth=  _ERROR_=1 _N_=13

我认为其中一个问题是ipc_class_symbol。 它是IPC分类符号(IPC第8版)'。 域:IPC允许的最多15个字符(A-Z,0-9,/,空格);

示例:

A61K

H04Q 7/32

C07K 14/00

C07D 405/06

H01M2220 / 20

请注意,位置5-7可能需要空格,因为斜杠" /"总是排在第9位。

其他变量的特征是 IPC_CLASS_LEVEL 域:1个字符:A =完整IPC中的分类,例如' H04Q 7/32' C =仅主要组中的分类,例如' H04H 1/00' S =仅在子类中的分类e。 G。 ' H04H'

ipc_version 域名:2006年1月1日至2006年3月30日之间的日期和当前日期

ipc_value 域:1个字符:I =发明,N =附加(非发明)

ipc_position 域:1个字符:F =第一个,L =以后。 space = unidentified

ipc_gener_auth 域名:2个ASCII字符(A-Z),根据WIPO ST.3

我该怎么做?

2 个答案:

答案 0 :(得分:0)

&:$29可能是你的问题。 &告诉SAS等待两个连续的分隔符(这是处理嵌入在数据中的分隔符的一种方法,尽管它不是常见的分隔符)。就我所知,这对你的数据来说并不(显然)是正确的。

删除&,看看它是否正确导入。

答案 1 :(得分:0)

注意:第10行32-33中ipc_version的数据无效。  规则:---- + ---- 1 ---- + ---- 2 ---- + ---- 3 ---- + ---- 4 ---- + --- -5 ---- ---- + ---- 6 + ---- ---- 7 ---- + 8 ---- ---- + 9  10 2,C07K 14/00,A, 2006-01-01 ,I ,, EP 33

ipc_version: MMDDYY10。

您的数据没有您尝试阅读的格式。您已经指定了mmddyy,但它明显是yymmdd或者其他类似的东西。