如何将数组缓冲区转换为字符串

how to convert arraybuffer to string

本文关键字:转换 字符串 缓冲区 数组      更新时间:2023-09-26

我在node.js上编写了一个简单的TCP服务器,用于向Chrome应用程序发送一些数据。在chrome应用程序中,当我获得数据时,我使用下面的函数将其转换为字符串,我得到一个异常"Uint16Array的字节长度应该是2的倍数"

String.fromCharCode.apply(null, new Uint16Array(buffer))

我找不到任何关于是什么原因导致的以及如何解决的信息。如有任何意见,我们将不胜感激。

以下是node.js服务器中用于向客户端发送数据的代码:

socket.on('data', function(data) {
    console.log('DATA ' + socket.remoteAddress + ': ' + data);
    // Write the data back to the socket, 
    //   the client will receive it as data from the server
    var r= socket.write('from server'r'n');
});

以下是chrome应用程序的代码:

  chrome.sockets.tcp.onReceive.addListener(function (info) {
            console.log('onListener registered');
            if (info.socketId != socketid)
                return;
            else {
                try {
                   data = ab2str(info.data);
                    console.log(data);
                }
                catch (e) {
                    console.log(e);
                }
            }
            // info.data is an arrayBuffer.
        });
 function ab2str(buf) {
    return String.fromCharCode.apply(null, new Uint16Array(buf));
}

实现这一点的现代(Chrome 38+)方法是,假设编码为UTF-8:

var decoder = new TextDecoder("utf-8");
function arrayBufferToString(buffer) {
    return decoder.decode(new Uint8Array(buffer));
}

这使用TextDecoder API;有关更多选项,例如不同的编码,请参阅文档。

另请参阅:Easier ArrayBuffer&lt->使用编码API进行字符串转换@谷歌开发者

您可能会看到这个问题,因为您的应用程序在套接字上接收到奇数个字节,但您正试图从中创建一个2字节宽的项目数组(因为这适合Uint16Array

如果你的应用程序通过网络接收到字符串"Hello"(5字节),那么你可以将其转换为Uint8Array,它看起来像这样:

Item:        0   1   2   3   4
Char:        H   e   l   l   o
Uint8 Value: 72  101 108 108 111

将其投射到Uint16Array,不过会尝试这样做:

Item   0     1     2
Chars  He    ll    o?
IntVal 25928 27756 ?????

如果没有第6个字节,它就无法构造数组,因此会出现异常。

只有当您期望套接字上有UCS-2字符串数据时,对数据使用Uint16Array才有意义。如果您接收的是纯ASCII数据,那么您希望将其转换为Uint8Array,并在其上映射String.fromCharCode。如果是其他内容,比如UTF-8,那么您将不得不进行其他转换。

不管怎样,套接字层总是可以自由地向您发送任何长度的数据块。你的应用程序必须处理奇数大小的数据,并保存你无法立即处理的剩余数据,这样你就可以在收到下一块数据时使用它。

有点过时了,但使用这个函数(原始源)可能效果更好(它对我来说可以将arraybuffer解码为字符串,而不会留下一些特殊字符作为总垃圾):

function decodeUtf8(arrayBuffer) {
  var result = "";
  var i = 0;
  var c = 0;
  var c1 = 0;
  var c2 = 0;
  var data = new Uint8Array(arrayBuffer);
  // If we have a BOM skip it
  if (data.length >= 3 && data[0] === 0xef && data[1] === 0xbb && data[2] === 0xbf) {
    i = 3;
  }
  while (i < data.length) {
    c = data[i];
    if (c < 128) {
      result += String.fromCharCode(c);
      i++;
    } else if (c > 191 && c < 224) {
      if( i+1 >= data.length ) {
        throw "UTF-8 Decode failed. Two byte character was truncated.";
      }
      c2 = data[i+1];
      result += String.fromCharCode( ((c&31)<<6) | (c2&63) );
      i += 2;
    } else {
      if (i+2 >= data.length) {
        throw "UTF-8 Decode failed. Multi byte character was truncated.";
      }
      c2 = data[i+1];
      c3 = data[i+2];
      result += String.fromCharCode( ((c&15)<<12) | ((c2&63)<<6) | (c3&63) );
      i += 3;
    }
  }
  return result;
}

使用BlobFileReader有一种异步方式。

您可以指定任何有效的编码。

function arrayBufferToString( buffer, encoding, callback ) {
    var blob = new Blob([buffer],{type:'text/plain'});
    var reader = new FileReader();
    reader.onload = function(evt){callback(evt.target.result);};
    reader.readAsText(blob, encoding);
}
//example:
var buf = new Uint8Array([65,66,67]);
arrayBufferToString(buf, 'UTF-8', console.log.bind(console)); //"ABC"