从 2D 数组 python 中删除引号

Removing quotes from 2D array python

提问人:Matej Novosad 提问时间:7/19/2018 最后编辑:Matej Novosad 更新时间:7/19/2018 访问量:1206

问:

我目前正在尝试执行代码,在不计算它们的情况下用大指数来估值幂,而是计算它们的日志。我有一个包含 1000 行的文件。每行包含两个迭代器,用逗号分隔。我卡在了试图从数组中删除引号的地方。我尝试了很多方法,但没有一个奏效。这是我的代码:

myLib 中名为 split() 的函数需要两个参数,其中一个是列表,第二个是拆分原始列表的 elemt。然后这样做并将较小的列表附加到新列表。

import math
import myLib

i = 0
record = 0
cmpr = 0
with open("base_exp.txt", "r") as f:
    fArr  = f.readlines()
    fArr  = myLib.split(fArr, 1)
    #place get rid of quotes
    print(fArr)
    while i < len(fArr):
        cmpr = int(fArr[i][1]) * math.log(int(fArr[i][0]))
        if cmpr  > record:
            record = cmpr
            print(record)
        i = i + 1

这是我的数组的样子:

[['519432,525806\n'], ['632382,518061\n'], ... ['172115,573985\n'], ['13846,725685\n']]

我试图找到一种绕过 2d 数组的方法并尝试:

i = 0
record = 0
cmpr = 0
with open("base_exp.txt", "r") as f:
    fArr  = f.readlines()
    #fArr  = myLib.split(fArr, 1)
    fArr = [x.replace("'", '') for x in fArr]
    print(fArr)
    while i < len(fArr):
        cmpr = int(fArr[i][1]) * math.log(int(fArr[i][0]))
        if cmpr  > record:
            record = cmpr
            print(i)
        i = i + 1

但输出如下所示:

['519432,525806\n', '632382,518061\n', '78864,613712\n', ...

而且当前状态下的数字不能被视为整数或浮点数,所以这也不起作用......

[int(i) for i in lst]

数组本身的预期输出如下所示,因此我可以选择其中一个数字并使用它:

[[519432,525806], [632382,518061], [78864,613712]...

我非常感谢您的帮助,因为我对 python 和一般编程仍然很陌生。

感谢您抽出宝贵时间接受采访。

Python 组多 维数组 行情

评论

0赞 user3483203 7/19/2018
逗号代表小数还是只分隔千位等。
0赞 Matej Novosad 7/19/2018
原始文件中的逗号分隔了两个整数。好点子。我要编辑我的问题。
0赞 mad_ 7/19/2018
那么预期的输出是什么。包含数字的单一列表?
0赞 Eskapp 7/19/2018
要从数组中删除引号,请考虑[list(line.split(' ')) for line in StringIO(fArr)]
0赞 user3483203 7/19/2018
您想要的输出是 2d 数组吗?

答:

1赞 Andrej Kesely 7/19/2018 #1

此代码片段会将您的数组转换为整数的 1D 数组:

from itertools import chain

arr = [['519432,525806\n'], ['632382,518061\n']]

new_arr = [int(i.strip()) for i in chain.from_iterable(i[0].split(',') for i in arr)]
print(new_arr)

指纹:

[519432, 525806, 632382, 518061]

对于 2D 输出,您可以使用以下命令:

arr = [['519432,525806\n'], ['632382,518061\n']]

new_arr = [[int(i) for i in v] for v in (i[0].split(',') for i in arr)]
print(new_arr)

这打印:

[[519432, 525806], [632382, 518061]]
0赞 mad_ 7/19/2018 #2
new_list=[]
a=['519432,525806\n', '632382,518061\n', '78864,613712\n',]
for i in a:
    new_list.append(list(map(int,i.split(","))))

print(new_list)

输出:

[[519432, 525806], [632382, 518061], [78864, 613712]]

为了压平new_list

from functools  import reduce
reduce(lambda x,y: x+y,new_list)
print(new_list)

输出:

[519432, 525806, 632382, 518061, 78864, 613712]
2赞 user3483203 7/19/2018 #3

您可以通过简单地使用 numpy 方便的 loadtxt 函数来避免所有问题:

import numpy as np
arr = np.loadtxt('p099_base_exp.txt', delimiter=',')
arr

array([[519432., 525806.],
       [632382., 518061.],
       [ 78864., 613712.],
       ...,
       [325361., 545187.],
       [172115., 573985.],
       [ 13846., 725685.]])

如果需要一维数组:

arr.flatten()
# array([519432., 525806., 632382., ..., 573985.,  13846., 725685.])

评论

0赞 Matej Novosad 7/19/2018
我的天啊。甚至不知道它的存在。这是什么黑魔法。它说没有名为numpy的模块。你介意与我分享来源吗?
0赞 user3483203 7/19/2018
你将不得不运行,它不是内置的pip install numpy
1赞 Kumar 7/19/2018 #4

这是你缺失的部分:

fArr = [[int(num) for num in line.rstrip("\n").split(",")] for line in fArr] 

在这里,将从行中删除尾随字符,然后将字符串拆分,以便每个字符串都将成为列表,并且该行中的所有整数都将成为该列表的元素,但作为字符串。然后,我们可以对每个列表元素调用函数以将它们转换为数据类型。rstrip("\n")\n,int()int

如果您不想导入其他库,下面的代码应该可以完成这项工作。

i = 0
record = 0
cmpr = 0
with open("base_exp.txt", "r") as f:
    fArr = f.readlines()
    fArr = [[int(num) for num in line.rstrip("\n").split(",")] for line in fArr] 
    print(fArr)
    while i < len(fArr): 
        cmpr = fArr[i][1] * math.log(fArr[i][0])
        if cmpr > record:
            record = cmpr
            print(i) 
        i = i + 1