在 d3.js 中转换数据类型,而无需事先了解属性名称(检测字符串是否仅包含数字)

Convert data types in d3.js without prior knowledge of property names (detect if a string contains only digits)

提问人:Hack-R 提问时间:4/5/2017 最后编辑:Gerardo FurtadoHack-R 更新时间:7/15/2019 访问量:1247

问:

在 d3.js 中。我可以在我的 Web 应用程序中读取用户上传的 CSV 文件,如下所示:

d3.csv("upload.csv", function(data) {
  console.log(data[0]);
});

这导致所有内容都以字符串形式读入。但是,我需要能够将数值数据类型视为数字。

如果我提前知道属性名称,我可以做这样的事情:

d3.csv("upload.csv", function(data) {
  data.forEach(function(d) {
    d.population = +d.population;
    d["land area"] = +d["land area"];
  });
  console.log(data[0]);
});

但是,由于这是用户提供的数据,因此无法提前知道属性名称。有没有办法检测字段是否仅包含数字,然后相应地更改数据类型?也许是某种带有正则表达式测试的条件语句或其他东西?

这些示例改编自教程。

JavaScript d3.js

评论

0赞 Gerardo Furtado 4/5/2017
如您所知,将对象值作为字符串返回。话虽如此,如果所有值都是字符串,怎么可能“检测到字段仅包含数字”d3.csv
0赞 Hack-R 4/5/2017
@GerardoFurtado 我对 d3 不是很熟悉,但我认为可能有一个 if / else 语句使用某种正则表达式来测试字符串中是否只有数字。我主要是一名 R 程序员。如果有帮助,我想我可以展示我将如何在 R 中做到这一点。
0赞 Gerardo Furtado 4/5/2017
是的,这是可能的。所以,它可以改写为“检测字符串是否只包含数字”,你不同意吗?
0赞 Hack-R 4/5/2017
@GerardoFurtado 是的,好主意
0赞 Gerardo Furtado 4/6/2017
我编辑了我的答案,以处理负数、科学记数法和浮点数。

答:

5赞 Gerardo Furtado 4/5/2017 #1

新答案

D3 v5.8 引入了非常方便的方法 d3.autotype,这使得这项任务变得非常容易:

var data = d3.csvParse(d3.select("#csv").text(), d3.autoType);

console.log(data);
pre {
  display: none;
}
<script src="https://d3js.org/d3.v5.min.js"></script>
<pre id="csv">header1,header2,header3
foo,foo2,1212
bar,bar2,2345
baz,baz2,7623</pre>


(原始答案)

注释中所述,您可以使用正则表达式来检查字符串是否仅包含数字。然后,如果是这样,你就把它强制到一个数字上。

在下面的演示中,我使用 a 来存储数据,因为我无法在 Stack 代码段中使用实际函数。<pre>d3.csv

在模拟的 CSV 中,有三列。其中之一,有数字。我们知道这一点,但代码却不知道:它只是使用正则表达式检查所有值,并将仅包含数字的字符串强制转换为数字。header3

var data = d3.csvParse(d3.select("#csv").text());

data.forEach(function(d) {
  for (var key in d) {
    if (/^\d+$/.test(d[key])) {
      d[key] = +d[key]
    }
  }
});

console.log(data);
pre {
  display: none;
  }
<script src="https://d3js.org/d3.v4.min.js"></script>
<pre id="csv">header1,header2,header3
foo,foo2,1212
bar,bar2,2345
baz,baz2,7623</pre>

这解决了您的问题,即“检测字符串是否仅包含数字”。但是,如果您还想处理负数、科学记数法和浮点数,您可以删除正则表达式并使用更优雅的方式:

在 JavaScript 中,不等于任何东西,甚至不等于它自己。由于将一元运算符与不是数字返回的东西一起使用,因此您可以简单地执行以下操作:NaNNaN

if (+d[key]===+d[key]) {
  d[key] = +d[key]
}

这是另一个演示,带有否定数、浮点数和科学记数法:

var data = d3.csvParse(d3.select("#csv").text());

data.forEach(function(d) {
  for (var key in d) {
    if (+d[key]===+d[key]) {
      d[key] = +d[key]
    }
  }
});

console.log(data);
pre {
  display: none;
  }
<script src="https://d3js.org/d3.v4.min.js"></script>
<pre id="csv">header1,header2,header3
foo,foo2,12.12
bar,bar2,-2345
baz,baz2,2.4e6</pre>

-2赞 dtanders 4/5/2017 #2

我会使用(或者如果你知道你不必关心浮子)parseFloatparseInt

function maybeNumber(someString) {
    var result = parseFloat(someString, 10);
    if (isNaN(result)) {
        return someString;
    }
    return result;
}

data = data.map(maybeNumber);

这比让类型强制对数据松散更安全。

评论

1赞 Gerardo Furtado 4/5/2017
@Hack-R 此解决方案不起作用。如果您尝试“543rrdrd”,它只会删除字母并返回“543”。
0赞 dtanders 4/6/2017
@Hack-R,并且不捕获负数、科学记数法或浮点数。你已经猜到了,但我认为尝试通过真正的解析器运行它是更正确的猜测方式。此外,强制会将有效的美国邮政编码转换为八进制。/^\d+$/
0赞 Hack-R 4/6/2017
@dtanders我明天必须再谈这个问题。我想我总是可以增加正则表达式,但如果有一种方法可以让它与解析函数一起工作,那就太好了。我明天会对此进行更多测试。