解析json字符串中所有可能的UTF-8值

Parsing all possible UTF-8 values in a json string

本文关键字:UTF-8 有可能 json 字符串 解析      更新时间:2023-09-26

如何运行下面的代码而不会出现意外的令牌错误?

我想在JSON字符串中解析任何可能的utf-8。因为像'u0000 (null)这样的字符是有效的UTF-8,我应该能够在json字符串中解析它们,对吧?

s='{"body": "'u0000"}'
JSON.parse(s)

SyntaxError: JSON中位置10的意外token

我使用JSON.parse(unescape(encodeURIComponent(s)))得到相同的错误。

这是数据集中的一个更大的样本:

'u0000'u0001'u0002'u0003'u0004'u0005'u0006'a'b't'n
!'"#$%&'()*+,-./0123456789:;<=>?
ΣΤΥΦΧΨΩΪΫάέήίΰαβγδεζηθικλμνξοπρςστυφχψωϊϋόύ

使用双反向固形体,就可以了。如:

s=`{"body": "''u0000"}`
JSON.parse(s)

s=`{"body": "''t"}`
JSON.parse(s)