提问人:Hack-R 提问时间:4/5/2017 最后编辑:Gerardo FurtadoHack-R 更新时间:7/15/2019 访问量:1247
在 d3.js 中转换数据类型,而无需事先了解属性名称(检测字符串是否仅包含数字)
Convert data types in d3.js without prior knowledge of property names (detect if a string contains only digits)
问:
在 d3.js 中。我可以在我的 Web 应用程序中读取用户上传的 CSV 文件,如下所示:
d3.csv("upload.csv", function(data) {
console.log(data[0]);
});
这导致所有内容都以字符串形式读入。但是,我需要能够将数值数据类型视为数字。
如果我提前知道属性名称,我可以做这样的事情:
d3.csv("upload.csv", function(data) {
data.forEach(function(d) {
d.population = +d.population;
d["land area"] = +d["land area"];
});
console.log(data[0]);
});
但是,由于这是用户提供的数据,因此无法提前知道属性名称。有没有办法检测字段是否仅包含数字,然后相应地更改数据类型?也许是某种带有正则表达式测试的条件语句或其他东西?
这些示例改编自本教程。
答:
5赞
Gerardo Furtado
4/5/2017
#1
新答案:
D3 v5.8 引入了非常方便的方法 d3.autotype
,这使得这项任务变得非常容易:
var data = d3.csvParse(d3.select("#csv").text(), d3.autoType);
console.log(data);
pre {
display: none;
}
<script src="https://d3js.org/d3.v5.min.js"></script>
<pre id="csv">header1,header2,header3
foo,foo2,1212
bar,bar2,2345
baz,baz2,7623</pre>
(原始答案)
如注释中所述,您可以使用正则表达式来检查字符串是否仅包含数字。然后,如果是这样,你就把它强制到一个数字上。
在下面的演示中,我使用 a 来存储数据,因为我无法在 Stack 代码段中使用实际函数。<pre>
d3.csv
在模拟的 CSV 中,有三列。其中之一,有数字。我们知道这一点,但代码却不知道:它只是使用正则表达式检查所有值,并将仅包含数字的字符串强制转换为数字。header3
var data = d3.csvParse(d3.select("#csv").text());
data.forEach(function(d) {
for (var key in d) {
if (/^\d+$/.test(d[key])) {
d[key] = +d[key]
}
}
});
console.log(data);
pre {
display: none;
}
<script src="https://d3js.org/d3.v4.min.js"></script>
<pre id="csv">header1,header2,header3
foo,foo2,1212
bar,bar2,2345
baz,baz2,7623</pre>
这解决了您的问题,即“检测字符串是否仅包含数字”。但是,如果您还想处理负数、科学记数法和浮点数,您可以删除正则表达式并使用更优雅的方式:
在 JavaScript 中,不等于任何东西,甚至不等于它自己。由于将一元运算符与不是数字返回的东西一起使用,因此您可以简单地执行以下操作:NaN
NaN
if (+d[key]===+d[key]) {
d[key] = +d[key]
}
这是另一个演示,带有否定数、浮点数和科学记数法:
var data = d3.csvParse(d3.select("#csv").text());
data.forEach(function(d) {
for (var key in d) {
if (+d[key]===+d[key]) {
d[key] = +d[key]
}
}
});
console.log(data);
pre {
display: none;
}
<script src="https://d3js.org/d3.v4.min.js"></script>
<pre id="csv">header1,header2,header3
foo,foo2,12.12
bar,bar2,-2345
baz,baz2,2.4e6</pre>
-2赞
dtanders
4/5/2017
#2
我会使用(或者如果你知道你不必关心浮子)parseFloat
parseInt
function maybeNumber(someString) {
var result = parseFloat(someString, 10);
if (isNaN(result)) {
return someString;
}
return result;
}
data = data.map(maybeNumber);
这比让类型强制对数据松散更安全。
评论
1赞
Gerardo Furtado
4/5/2017
@Hack-R 此解决方案不起作用。如果您尝试“543rrdrd”,它只会删除字母并返回“543”。
0赞
dtanders
4/6/2017
@Hack-R,并且不捕获负数、科学记数法或浮点数。你已经猜到了,但我认为尝试通过真正的解析器运行它是更正确的猜测方式。此外,强制会将有效的美国邮政编码转换为八进制。/^\d+$/
0赞
Hack-R
4/6/2017
@dtanders我明天必须再谈这个问题。我想我总是可以增加正则表达式,但如果有一种方法可以让它与解析函数一起工作,那就太好了。我明天会对此进行更多测试。
评论
d3.csv