使用 innerHTML 读取 UTF8 字符会返回所有字符的0xfffd-解网

问：

我正在阅读一个包含 UTF-8 字符的 HTML 文档，但是当我访问文档的 innerHTML 时，所有“坏”字符都显示为 .我已经在所有主要浏览器中尝试过它，它的行为方式相同。当我将这些字符显示为“带有？标记”。0xfffdalert()innerHTML

令人惊讶的是，以下内容工作得很好，在警报框中正确显示 UTF-8 字符，因此它没有出现故障。alert()

alert("Doppelg\u00e4nger!");

为什么我不能使用 innerHTML 访问 UTF-8 字符？或者有没有另一种方法可以在 JavaScript 中访问它们。

JavaScript HTML UTF-8

function encodeHTML(str){
 var aStr = str.split(''),
     i = aStr.length,
     aRet = [];

   while (--i) {
    var iC = aStr[i].charCodeAt();
    if (iC < 65 || iC > 127 || (iC>90 && iC<97)) {
      aRet.push('&#'+iC+';');
    } else {
      aRet.push(aStr[i]);
    }
  }
 return aRet.reverse().join('');
}

请注意，此函数将对所有非 [a-zA-Z] 的内容进行编码。此函数将编码 Doppelgänger 中的 Doppelgängerä例如，NGER。

使用 innerHTML 读取 UTF8 字符会返回所有字符的0xfffd

Reading UTF8 chars using innerHTML returns 0xfffd for all chars

评论

评论

评论