选择R对象的一部分,它在引号之间

时间:2018-01-05 09:41:41

标签: r regex

我有一个从图片数据库派生的奇数字符R对象。我需要选择第一个元素(在本例中为53244000)。这必须对数百个文件进行,因此我需要一些通用的说法“获取引号"之间的第一个信息。

任何提示?

" 53244000\", \"tr 3450000\\034\\002\\031\", \"more keywords\", \"\", \"\\001\\023\\001\\031\\001\\037\\001%\\001+\\0012\\0018\\001>\\001E\\001L\\001R\\001Y\\001`\\001g\\001n\\001u\\001|\\001\\x83\\001\\x8b\\001\\x92\\001\\x9a\\001\\xa1\\001\\xa9\\001\\xb1\\001\\xb9\\001\\xc1\\001\\xc9\\001\\xd1\\001\\xd9\\001\\xe1\\001\\xe9\\001\\xf2\\001\\xfa\\002\\003\\002\\f\\002\\024\\002\\035\\002&\\002/\\0028\\002A\\002K\\002T\\002]\\002g\\002q\\002z\\002\\x84\\002\\x8e\\002\\x98\\002\\xa2\\002\\xac\\002\\xb6\\002\\xc1\\002\\xcb\\002\\xd5\\002\\xe0\\002\\xeb\\00

1 个答案:

答案 0 :(得分:3)

您可以尝试捕获sub的第一个引号之间的内容:

sub('[^"]*\"([^"]+)\".+', "\\1", your_string)

说明:

  • [^"]*:除了引用0或更多时间之外的任何内容
  • \":引用
  • (([^"]+):除了引号之外的任何内容,在括号之间,因为这是您要捕获的内容(使用\\1
  • \":引用
  • .+:任何一次或多次