为什么我的排序函数返回的值多于输入 [duplicate]

Why is my sorting function returning more values than input [duplicate]

提问人:Harry Whitnear 提问时间:11/16/2022 最后编辑:iczaHarry Whitnear 更新时间:11/17/2022 访问量:49

问:

我在下面发布的代码是最低可重现版本,因为我一直在尝试隔离问题。我来自 Python,出于性能原因需要在 Go 中重写此脚本,特别是使用我从示例中删除的并行化。

问题是我将 N 个值传递给排序函数并得到 >N 个返回值。它为第一个外部循环中的每次迭代创建一个新切片,并且似乎忽略了条件。我对 Go 没有太多经验,并且使用 Python。我假设这与设置因任何原因不被外循环看到有关。 最终,我试图忽略已经在循环中较早分组的“消息”。if !message1.Grouped message2.Grouped = true

旁注:我知道这个脚本中的随机数不起作用,因为我没有设置新的种子,但这超出了重点,不是我实际脚本的一部分

package main
import (
    "fmt"
    "math/rand"
)

type (
    BoolInt struct {
        Val int
        Grouped bool
    }
)


func sort_chunk_no_p(chunk []BoolInt) [][]BoolInt {
    COSINE_THRESHOLD := 0.90
    allGroups := [][]BoolInt{}
    for i, message1 := range chunk {
        if !message1.Grouped {
            message1.Grouped = true
            tempGroup := []BoolInt{message1}
            for _, message2 := range chunk[i+1:] {
                if !message2.Grouped {
                    if rand.Float64() >= COSINE_THRESHOLD {
                        message2.Grouped = true
                        tempGroup = append(tempGroup, message2)
                    }   
                }

            }
            allGroups = append(allGroups, tempGroup)
        }
    }
    return allGroups
}

func main() {
    lo, hi := 1, 100
    allMessages := make([]BoolInt, hi-lo+1)
    for i := range allMessages {
        allMessages[i].Val = i + lo
        allMessages[i].Grouped = false
    }

    sorted_chunk := sort_chunk_no_p(allMessages)


    fmt.Println(sorted_chunk)
    sum := 0
    for _, res := range sorted_chunk {
        sum += len(res)
    }
    fmt.Println(sum)
}

循环 切片

评论

0赞 icza 11/16/2022
你能澄清一下问题是什么吗? 使用具有 100 个元素的切片调用,并返回另一个同样具有 100 个元素的切片。sort_chunk_no_p()
0赞 Harry Whitnear 11/16/2022
它被赋予 100 个元素,并在切片中返回 100 多个元素。它正在创建 100 个切片,但我试图跳过之前已经分组的元素,这就是我尝试使用布尔值的目的。这条线似乎无关紧要。我试着在主帖子正文中更好地澄清if !message1.Grouped

答:

2赞 icza 11/17/2022 #1

循环访问切片时,所有元素都将复制到单个重用的循环变量中。这意味着,如果修改此副本的字段,切片中的元素将不受影响。

要么将指针存储在切片中(元素仍将被复制,但元素现在将是指向同一结构值的指针),要么通过索引表达式(如 )修改元素。chunk[i].Grouped = true

使用指针,它看起来像这样:

func sort_chunk_no_p(chunk []*BoolInt) [][]*BoolInt {
    COSINE_THRESHOLD := 0.90
    allGroups := [][]*BoolInt{}
    for i, message1 := range chunk {
        if !message1.Grouped {
            message1.Grouped = true
            tempGroup := []*BoolInt{message1}
            for _, message2 := range chunk[i+1:] {
                if !message2.Grouped {
                    if rand.Float64() >= COSINE_THRESHOLD {
                        message2.Grouped = true
                        tempGroup = append(tempGroup, message2)
                    }
                }

            }
            allGroups = append(allGroups, tempGroup)
        }
    }
    return allGroups
}

并称其为:

allMessages := make([]*BoolInt, hi-lo+1)
for i := range allMessages {
    allMessages[i] = &BoolInt{Val: i + lo}
}

sorted_chunk := sort_chunk_no_p(allMessages)

Go Playground 上尝试一下。

请参阅相关内容:

在 for 循环中使用指针

使用循环切片/映射的范围注册多个路径

为什么这两个 for 循环变体会给我不同的行为?

评论

0赞 Harry Whitnear 11/17/2022
谢谢。我只是尝试使用 C 样式进行循环并索引到,它按预期工作。作为主要的 Python 开发人员,我犹豫是否使用指针方法,我害怕指针,但指针会减少内存使用量吗?您提到切片是在 for 循环中复制的,在传递给我的函数时也被复制?chunkchunk
0赞 icza 11/17/2022
请参阅切片是否按值传递?