1、找到报错的原因

一般是有些字符或者编码无法识别,这时候需要保存成txt文件进行查找分析,具体在哪个位置。找到相关字符进行分析。

2、使用正则替换掉不需要的字符

比如我的是借助python的正则表达式,匹配的字符串中,我只要含有中文,英文、数字、还有:"'<>\/-,{} 这些字符需要,其他的我都认为是json报错的字符,替换为空。然后在正则里面[]前面加个^使得匹配除这些之外的字符,都匹配成功。这样保证我的json.loads(text),不会报错了。

正则不太懂的可以参考菜鸟教程,里面有些知识点写个还是比较细的:
https://www.runoob.com/python/python-reg-expressions.html

text_last2 = re.sub(r"[^\w\s[\u4e00-\u9fa5]:\"\'<>\\/-,{}']+",'',text)