如何解码以下代码(例如u00e8、u00e9)并将其以字符串格式输出到Python中的符号

How to decode and output the following code (ex. u00e8, u00e9) in the format of a string to their symbols in Python

本文关键字:输出 格式 字符串 Python 符号 解码 何解码 代码 例如 u00e9 u00e8      更新时间:2023-09-26

我目前正在做一个Python Web Scraping项目。我正在抓取的东西将éà等符号和其他符号(例如西里尔字母)保存为'u00e8'u00e9等代码。我使用BeautifulSoup来格式化我从网上得到的任何东西,并将其保存为字符串。然而,我想将符号输出到一个文件中,不是以编码的格式,而是作为它们的实际符号(例如é)。如何解码字符串,以便我可以将符号输出到文件中?

您可以解码这样的字符串:

 >> s = ''u00e8'
 >> x = s.decode('unicode_escape')
 >> print x
   è
 >> type(x)
   unicode

您可以使用str()内置函数将字符转换为字符串,该函数将字符作为参数