NodeJS,basE91,&小端

时间:2012-07-03 03:47:53

标签: node.js endianness base91

如何使用NodeJS将下面的字符串从basE91解码为可读文本?

8D7Hh-9D*.n-!DZrG-#DE-$DD-%DC-sl-tl-BEp2m-CE^Ul-DE}CH-EEE-FED-GEC-<l-=l-hE(.K-iEvqS-jEB-kEB-lEB-mEB-Rm-Sm-%E!{Q-&EDgN-(EG:K-)EE-*EE-+EB-xm-ym-GF{}U-HF()Q-IFt%D-JFE-KFB-LFD-[m-]m-mF;JG-nF7]Q-oF2-pFB-qFC-rFB-Wn-Xn-+FD-,FE-.FB- FE-:FD-;FC-2n-3n-

*编辑*

使用basE91表我设法将上面的字符串转换为十六进制字符串

十六进制字符串

5668557210457684246110336890114713568693668683768671151081161086669112501096769948510868691567726969697069687169676010861108104694046751056911811383106696610769661086966109696682109810937693312381386968103784069715875416969426969436966120109121109717012312585727040418173701637687470697570667670689110993109109705974711107055938111170501127066113706711470668711088104370684470694670664770695870685970675011051110

然后我把它喂入缓冲区

var buf = new Buffer(hex, 'hex');
console.log(buf.toString('utf8'));

这给了我:

VhUr►Ev?$a►3h?◄G‼V??f??v?q§►?▬►?f?↕P►?v?Hhi↕Vw&???♠??▬?va►?♦i@Fu►V?↑◄81♠if►v?if►??h!    ?►??1#?8ih►7?♠?§?T▬??&??6?a ►?!►?↨☺#↕XW'♦♦↑↨7☺▬7htpiupfvph?►?1 ►?♣?G◄►p    U??◄↨♣☺↕pf◄7♠q¶pf??►CphDpiFpfGpiXphYpgP◄♣◄►

如何将其融入我可以使用的内容中?我怀疑它是一个JSON对象......

4 个答案:

答案 0 :(得分:4)

在本次讨论中,你有两个非常独立的问题。

如何使用Javascript / NodeJS / CommnJS解码basE91?

这就是您的问题一目了然,而且gotten various responses就是这样。答案似乎是:没有现有的解决方案,但是basE91很小而且很简单,你应该能够毫不费力地将它移植到JS。

您的第二个不太明确的问题似乎是:

如何对Ultima的游戏服务器通信协议进行逆向工程?

你提到你的“basE91 LE”字符串来自一个MMO游戏服务器,this forum posting about Lord of Ultima几乎是“basE91 little endian”的唯一其他命中。 (另外它看起来像你posted there a few days ago。)作为variously noted,你发布的数据是不是普通香草basE91。 BasE91有一组明确定义的字符,“-”和“”(空格)不在其中,但都出现在您的数据中。您在评论中提到您认为“-”被用作分隔符,如果前面提供了更多类似的信息,那么回答第二个问题会更容易。

关于这个问题的一些注释:

  • BasE91使用标准编码表。如果你正在制作一个在线游戏,并希望稍微混淆你的流量,那么使用不同的或加扰的表是微不足道的。这将解释您的数据中出现的非合法basE91字符。此外,来自该论坛的this post具有以下内容:不同的de /编码表。您是否尝试过使用该表手动解码部分数据并查看它是否有意义?

  • 您请求转换为“可读文本”,但basE91用于传输二进制数据,因此不清楚为什么会将其用于纯文本。即使假设它是编码文本,也有各种常见的方法来编码纯文本and the decoded data doesn't appear to be doing so。更可能的是,数据是实际的二进制数据,并且在非常真实的意义上,basE91 文本表示。如果没有关于您期望的输出的更多信息,很难知道您希望如何将其翻译成文本。这是1像素透明gif的basE91编码:

    JaQGWo*HBtAARDBtB"B"B"S|QtAAAA$M)Bc4v(#AsAAABtAACABtlBLHBtd
    

    可以将其转换为可读文本吗?你提到你认为它是JSON,你能给我们一些关于你为什么这么想的提示吗? (再次,为什么使用二进制编码器作为纯文本?)

  • 在同一个论坛帖子中工作,听起来你正在使用一系列5位坐标,所以这些数字可能正是你想要的吗?然而,还有更多的难题,因为那些basE91组编码不同的大小数字。即(不可思议的文字警告墙):

    echo '8D7Hh-9D*.n-!DZrG-#DE-$DD-%DC-sl-tl-BEp2m-CE^Ul-DE}CH-EEE-FED-GEC-<l-=l-hE(.K-iEvqS-jEB-kEB-lEB-mEB-Rm-Sm-%E!{Q-&EDgN-(EG:K-)EE-*EE-+EB-xm-ym-GF{}U-HF()Q-IFt%D-JFE-KFB-LFD-[m-]m-mF;JG-nF7]Q-oF2-pFB-qFC-rFB-Wn-Xn-+FD-,FE-.FB- FE-:FD-;FC-2n-3n-' \
    | while IFS='' read -d - a; do echo -n "'$a' => "; echo -n "$a" \
    | ./base91 -d | hexdump | head -1 | cut -d ' ' -f 2-; done
    # head and cut are easier that understanding hexdump's formatting system
    '8D7Hh' => 4d 01 57 84                                    
    '9D*.n' => 4e a1 3b 9f                                    
    '!DZrG' => 4f 41 ec 19                                    
    '#DE' => 50 81                                          
    '$DD' => 51 61                                          
    '%DC' => 52 41                                          
    'sl' => 53                                             
    'tl' => 54                                             
    'BEp2m' => 6d 61 6b 9a                                    
    'CE^Ul' => 6e e1 ed 94                                    
    'DE}CH' => 6f c1 21 1c                                    
    'EEE' => 70 81                                          
    'FED' => 71 61                                          
    'GEC' => 72 41                                          
    '<l' => 73                                             
    '=l' => 74                                             
    'hE(.K' => 8d 61 3b 2b                                    
    'iEvqS' => 8e a1 e3 49                                    
    'jEB' => 8f 21                                          
    'kEB' => 90 21                                          
    'lEB' => 91 21                                          
    'mEB' => 92 21                                          
    'Rm' => 93                                             
    'Sm' => 94                                             
    '%E!{Q' => ad 01 da 43                                    
    '&EDgN' => ae 61 6c 35                                    
    '(EG:K' => af 81 4a 2b                                    
    ')EE' => b0 81                                          
    '*EE' => b1 81                                          
    '+EB' => b2 21                                          
    'xm' => b3                                             
    'ym' => b4                                             
    'GF{}U' => cd c1 f3 53                                    
    'HF()Q' => ce e1 0d 43                                    
    'IFt%D' => cf 01 e9 0e                                    
    'JFE' => d0 81                                          
    'KFB' => d1 21                                          
    'LFD' => d2 61                                          
    '[m' => d3                                             
    ']m' => d4                                             
    'mF;JG' => ed c1 6f 18                                    
    'nF7]Q' => ee 21 ac 43                                    
    'oF2' => ef c1                                          
    'pFB' => f0 21                                          
    'qFC' => f1 41                                          
    'rFB' => f2 21                                          
    'Wn' => f3                                             
    'Xn' => f4                                             
    '+FD' => 0d 62                                          
    ',FE' => 0e 82                                          
    '.FB' => 0f 22                                          
    ' FE' => 71                                             
    ':FD' => 11 62                                          
    ';FC' => 12 42                                          
    '2n' => 13                                             
    '3n' => 14           
    

    那里肯定有一种模式,如果你眯着眼睛,甚至会看小端。但它们对我来说没有任何意义,它们对你来说是否合情合理?

答案 1 :(得分:2)

非常紧凑Java implementation of basE91 encoder/decoder on github。我认为这应该很容易转换为JS。

Direct link to source file

答案 2 :(得分:0)

简短的回答是在node.js中没有简单/快捷的方法(显然当前也没有模块。)

添加到@bryanmac的注释,使用base91作为起点(主源文件只有160行,包括版权!),你可以将数据存储在node.js缓冲区中,一旦从base91转换为字节,使用内置的node.js方法转换为字符串。

答案 3 :(得分:-1)

For&#34;如何使用Javascript / NodeJS / CommnJS解码basE91?&#34;

我已将the original basE91迁移到JavaScript中,目前支持StringBufferStream。你可以尝试一下:  Equim-chan/base91

首先我们需要一张桌子:

const table = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789!#$%&()*+,./:;<=>?@[]^_`{|}~"';

encode的核心部分:

// `raw` is the input, asserted as `Buffer`
const len = raw.length;
let ret = '';
let n = 0;
let b = 0;

for (let i = 0; i < len; i++) {
  b |= raw[i] << n;
  n += 8;

  if (n > 13) {
    let v = b & 8191;
    if (v > 88) {
      b >>= 13;
      n -= 13;
    } else {
      v = b & 16383;
      b >>= 14;
      n -= 14;
    }
    ret += table[v % 91] + table[v / 91 | 0];
  }
}

if (n) {
  ret += table[b % 91];
  if (n > 7 || b > 90) ret += table[b / 91 | 0];
}

return ret;  // basE91 encoded string

decode的核心部分:

// `raw` is the input, asserted as `String`
const len = raw.length;
const ret = [];
let b = 0;
let n = 0;
let v = -1;

for (let i = 0; i < len; i++) {
  const p = table.indexOf(raw[i]);
  if (p === -1) continue;
  if (v < 0) {
    v = p;
  } else {
    v += p * 91;
    b |= v << n;
    n += (v & 8191) > 88 ? 13 : 14;
    do {
      ret.push(b & 0xff);
      b >>= 8;
      n -= 8;
    } while (n > 7);
    v = -1;
  }
}

if (v > -1) {
  ret.push((b | v << n) & 0xff);
}

return Buffer.from(ret);  // basE91 decoded Buffer

上面是标准的basE91编码/解码,但正如@blahdiblah所提到的,显然你从服务器收到了一个非标准的basE91编码字符串(标准表中没有*也没有 )。