如何解码以下代码(例如u00e8、u00e9)并将其以字符串格式输出到Python中的符号
How to decode and output the following code (ex. u00e8, u00e9) in the format of a string to their symbols in Python
我目前正在做一个Python Web Scraping项目。我正在抓取的东西将é
、à
等符号和其他符号(例如西里尔字母)保存为'u00e8
、'u00e9
等代码。我使用BeautifulSoup来格式化我从网上得到的任何东西,并将其保存为字符串。然而,我想将符号输出到一个文件中,不是以编码的格式,而是作为它们的实际符号(例如é
)。如何解码字符串,以便我可以将符号输出到文件中?
您可以解码这样的字符串:
>> s = ''u00e8'
>> x = s.decode('unicode_escape')
>> print x
è
>> type(x)
unicode
您可以使用str()内置函数将字符转换为字符串,该函数将字符作为参数
相关文章:
- Datetime格式为Friendly Time.Moment JS输出错误
- 有没有一种方法可以从两个标签之间提取文本,并以我选择的格式输出
- 输出文本不't以正确格式显示
- 没有获得 json .save 的输出,格式为 pars.html
- 如果 CreateJS 库支持 Texture Packer 的 JSON 输出格式
- 获取表格格式的 Javascript 输出
- 如何使用 JQuQuery 解析 JSON 对象并在 HTML 页面中以表格格式打印输出
- 如何以绘图表格式输出PHP结果
- 查看不同输出格式时的内容协商
- HTML表单Mailto输出格式
- Nashorn探查器输出格式
- 将REST JSON输出格式化为另一种格式
- 如何更改serializeObject输出格式?
- moment(). toobject()输出格式
- POST表单到新选项卡.输出格式为PDF
- ASP.jQuery UI自动完成的输出格式(显示值标签键对)
- Angular-ui: Date -不同的输出格式
- 输出格式不正确
- 对输出格式使用相同的解析格式
- 节点.js大数字的输出格式