Ruby:替换从MS Word粘贴的项目符号

时间:2009-06-02 20:40:09

标签: ascii special-characters

我需要从MS Word粘贴的文本中删除子弹符号,但我无法弄清楚要匹配的内容。

当打印到STDOUT时,符号显示为¢ 这些字符的ascii代码是194和162。 •符号的ascii代码为149

有关如何使用JavaScript或Ruby代码进行任何建议吗?

2 个答案:

答案 0 :(得分:1)

在ruby中,你应该可以使用类似的东西:

mystring.gsub(/[\xxx]/,'whatever')

其中xxx是您要查找的字符代码。您只需在irb中执行puts mystring即可看到该代码是什么,它应该显示

答案 1 :(得分:0)

我遇到了类似的问题,包括获取您描述的符号。我尝试了各种regEx过滤器,无论是在项目符号点还是由此产生的字符上都无法正常工作。

但是,我确实找到了一种使用自定义方法过滤项目符号(或任何类似字符)的方法。它不漂亮或不理想,但它有效:

/[[:alpha:]]/

这也将删除所有前面的空格和其他非字母字符,因为它们也会为=〜检查返回nil。

不要将/[A-Za-z]/用于表达式匹配,因为这会将字符视为字母。请注意LobbySchema = new SimpleSchema({ game: { type: String, label: "Game" }, console: { type: String, label: "Console" }, players: { type: Number, label: "Players" }, mic: { type: Boolean, label: "Mic" }, note: { type: String, label: "Note" }, gamertag: { type: String, label: "Gamertag" }, createdAt: { type: Date, label: "Created At", autoValue: function(){ return new Date() }, autoform: { type: "hidden" } } }); 会对非英文字符给出误报,例如'ñ'。