为什么新的贡献者在所有事情上都受到限制?[已结束]

Why is a new contributor limited in all the things? [closed]

提问人:Cam Hoang 提问时间:11/17/2023 最后编辑:Peter MortensenCam Hoang 更新时间:11/21/2023 访问量:250

问:


想改进这个问题吗?通过编辑这篇文章添加详细信息并澄清问题。

6天前关闭。

这个问题是从 Stack Overflow 迁移过来的,因为它可以在 Meta Stack Overflow 上回答。迁移 7 天前

我看到了这个 https://stackoverflow.com/help/answering-limit#:~:text=We%20slow%20down%20new%20user,to%20craft%20a%20good%20answer。 但这没有任何意义,因为有些人正在使用 ChatGPT,然后所有新贡献者都必须等待各种速率限制:无法发表评论、无法投票、等待 30 分钟才能回答,......?

作为一名开发人员,我希望 Stack Overflow 能够开发新功能来检测 ChatGPT 答案并阻止它,或者从收到反对票的答案中扣除声誉。请不要因为人工智能而减慢人类的速度!!

讨论

评论

20赞 E_net4 11/17/2023
在LLM大规模发布之前,问答发布速率限制就已经存在。
2赞 Thom A 11/17/2023
然而,在 LLM 之前,限制短于 30 分钟,@E_net4 .
19赞 David 11/17/2023
“作为一名开发人员,我希望 StackOverflow 能够开发新功能来检测 ChatGPT 答案并防止它”——强烈建议您为这种不平凡的努力做出贡献。提出解决方案比要求解决方案更有成效和有效。
2赞 Kevin B 11/17/2023
我倾向于同意这一点,特别是这个速率限制以及无法发表评论/投票肯定会使作为新用户做出贡献变得更加困难。我认为每 1 分钟 30 次油门是解决问题的懒惰解决方案。
16赞 Thom A 11/17/2023
“作为一名开发人员,我希望 StackOverflow 开发新功能来检测 ChatGPT 答案”是什么让你认为他们不是?无论如何,去年的这个时候,Stack Overflow 和社区中的其他网站都充斥着来自 CrapGPT 等工具的内容,因此必须做点什么。如果你真的热衷于经常做出贡献,那么你用不了那么长时间就能获得 125 的声望。
0赞 Martin Brown 11/17/2023
我认为这是阻止垃圾邮件发送者滥用系统的措施。Althgugh 作为一个新人,我也发现能够提出和回答问题,但在我获得 50 分之前不能对其他任何事情发表评论,这有点令人沮丧?点。比如说 5 条评论和说明的起始奖励,以小心如何使用它们可能会有所帮助。OTOH 我感觉不到目前的发布规则阻止了多少糟粕。
2赞 Kevin B 11/18/2023
特别是这个限制,每 30 分钟 1 次,旨在作为一种临时解决方案,以阻止新用户快速回答 gpt 的浪潮。也许它仍然需要,也许不需要,但我发现在完成大量研究表明它对事情得到答复的速度产生不利影响之后,它仍然活跃,这有点问题。当然,在 6 个月内,可以采取一些措施来提供更好的解决方案......但。。。不,聊天机器人工作更重要。
3赞 user4581301 11/18/2023
很难在半小时内写出两个非平凡问题的好答案(几乎所有琐碎的问题都会重复)。
2赞 Security Hound 11/18/2023
作者提交了 7 个答案,没有一个得到好评,而且都是在很短的时间内相互提交的。如果这种接收是合理的,我没有任何建议或反馈,因为我对所讨论的标签主题知之甚少。在一天内提交 5 个高质量的答案是很困难的,因为这需要在一天内找到 5 个高质量的问题。即使这些答案中有25%被合法地点赞,那么速率限制基本上就不再是问题了
0赞 Makyen 11/18/2023
@MartinBrown 发布评论的声誉要求主要是为了防止评论中的垃圾邮件,如果允许没有声誉的用户发表一般评论,这将很猖獗,而且更难审核。不幸的是,您允许新用户发表 5 条评论的提议有效地消除了对垃圾邮件发送者的限制,同时保留了对真实用户的限制。垃圾邮件发送者可以而且确实会创建多个帐户,有时甚至创建数千个帐户。如果他们被允许为每个帐户发布 5 条评论,那么他们只会创建更多帐户以获得更多评论。
0赞 Makyen 11/18/2023
我已将这个问题作为不清楚/需要的详细信息关闭,因为您正在问“为什么”存在限制,以及您在帮助中心链接到的页面上明确说明原因(即,它增加到 30 分钟以减慢 AI 生成的内容答案的发布)。因此,我不清楚你在这里真正问的是什么。[注意:这个关闭是因为我不清楚你在这里问什么。讨论信誉< 125 的用户的应答速率限制是否应为 30 分钟就可以了。
0赞 Cam Hoang 11/18/2023
是的,请。我不想因为我的挫败感而惹恼别人。我只是不想被人工智能使用的缺点所束缚。
0赞 Security Hound 11/18/2023
@CamHoang - 如果你想重新打开这个问题,你将不得不编辑,以调整Makyen的反馈。
0赞 Martin Brown 11/18/2023
@Mayken感谢您的澄清 - 这很有道理。我没有意识到你被垃圾邮件发送者盯上了。
0赞 Gimby 11/21/2023
@MartinBrown你应该说“我们”,而不是“你”。你也是这个家庭的一份子。

答:

-4赞 code11 11/17/2023 #1

由于他人的行为而受到限制,您在网站上的互动方式受到限制是很烦人的。但是,如果您真的要面对 30 分钟的多个答案,那么您不应该有这个问题太久,因为您的答案会被点赞,并且您会发现自己很快就会脱离代表截止时间。

评论

3赞 Cerbrus 11/18/2023
这并不能真正回答这个问题......
2赞 code11 11/18/2023
我的意思是它有点。OP 说必须等待 30 分钟才能发布答案很烦人。我有点不同意,说问题会自行解决(如果你真的达到了那个极限,提供了好的答案,那么你就会被点赞)我在这里遗漏了什么吗?
0赞 code11 11/18/2023
也有点困惑,因为 A @Thom的点赞评论基本上就是我在这里说的:“如果你真的热衷于经常做出贡献,那么你用不了那么长时间就能获得 125 的声誉”
6赞 Security Hound 11/18/2023
我不明白对这个答案的反应,它本质上是说,如果你提交高质量的贡献,速率限制不是问题。
2赞 Martin Brown 11/18/2023
@securityhound我同意。没有发表评论所需的声誉的问题的解决方案是找到一个你知道答案的好问题并很好地回答它。质量而不是数量。我确实认为新手可能会合理地得到少量的评论——它们比答案的要求要低得多(任何垃圾邮件都会立即被踩踏)。只有我一个人经常违反编辑评论的 5 分钟规则吗?
0赞 Cerbrus 11/19/2023
我的问题是:“你不应该有这个问题太久,因为你的答案会被点赞”不。很多答案都没有得到点赞。我们不要认为这是意料之中的。
1赞 Kevin Loney 1/9/2009 #2

我从未使用过 matlab,但从您之前的问题来看,我怀疑您正在寻找类似于 Kdtree 或变体的东西。

澄清:由于对此似乎存在一些混淆,我认为伪代码示例是有序的。

// Some of this shamelessly borrowed from the wikipedia article
function kdtree(points, lower_bound, upper_bound) {
    // lower_bound and upper_bound are the boundaries of your bucket
    if(points is empty) {
        return nil
    }
    // It's a trivial exercise to control the minimum size of a partition as well
    else {
        // Sort the points list and choose the median element
        select median from points.x

        node.location = median;

        node.left = kdtree(select from points where lower_bound < points.x <= median, lower_bound, median);
        node.right = kdtree(select from points where median < points.x <= upper_bound, median, upper_bound);

        return node
    }
}

kdtree(points, -inf, inf)

// or alternatively

kdtree(points, min(points.x), max(points.x))

评论

0赞 Alex R 1/9/2009
我不认为我需要一棵 k-d 树;我没有按 y 方向排序。也许一个简单的二叉树可能会起作用,但我看不出如何。
0赞 Kevin Loney 1/10/2009
K-D 树是二叉树,每个节点都增加了一个分区平面。无论您拥有的维度数量如何,它们都可以缩放,因此您可以简单地忽略 y 分量,对 x 分量进行排序,并且您得到的平面应该接近存储桶的最佳边界。
0赞 Alex R 1/10/2009
即使我有一个二叉树,我也看不出我会做些什么来确定边界。
2赞 gnovice 1/9/2009 #3

听起来您想使用大小因 x 值的密度而异的条柱。我认为您仍然可以像上一篇文章的答案一样使用 HISTC 函数,但您只需要给它一组不同的边缘。

我不知道这是否正是您想要的,但这里有一个建议:不要将 x 轴拆分为 70 个等距组,而是将排序后的 x 数据拆分为 70 个相等的组并确定边值。我认为这段代码应该有效:

% Start by assuming x and y are vectors of data:

nBins = 70;
nValues = length(x);
[xsort,index] = sort(x);  % Sort x in ascending order
ysort = y(index);         % Sort y the same way as x
binEdges = [xsort(1:ceil(nValues/nBins):nValues) xsort(nValues)+1];

% Bin the data and get the averages as in previous post (using ysort instead of y):

[h,whichBin] = histc(xsort,binEdges);

for i = 1:nBins
    flagBinMembers = (whichBin == i);
    binMembers = ysort(flagBinMembers);
    binMean(i) = mean(binMembers);
end

这应该为您提供大小随数据密度而变化的箱。


更新:另一个版本...

这是我在发表一些评论后想出的另一个想法。使用此代码,您可以为 x 中相邻数据点之间的差值设置阈值 (maxDelta)。任何与较大的邻居相差大于或等于 maxDelta 的 x 值都被迫放在它们自己的 bin 中(所有这些都由它们的孤独)。您仍可为 nBin 选择一个值,但当分散点降级到其自己的 bin 时,最终的 bin 数将大于此值。

% Start by assuming x and y are vectors of data:

maxDelta = 10; % Or whatever suits your data set!
nBins = 70;
nValues = length(x);
[xsort,index] = sort(x);  % Sort x in ascending order
ysort = y(index);         % Sort y the same way as x

% Create bin edges:

edgeIndex = false(1,nValues);
edgeIndex(1:ceil(nValues/nBins):nValues) = true;
edgeIndex = edgeIndex | ([0 diff(xsort)] >= maxDelta);
nBins = sum(edgeIndex);
binEdges = [xsort(edgeIndex) xsort(nValues)+1];

% Bin the data and get the y averages:

[h,whichBin] = histc(xsort,binEdges);

for i = 1:nBins
    flagBinMembers = (whichBin == i);
    binMembers = ysort(flagBinMembers);
    binMean(i) = mean(binMembers);
end

我在几个小样本数据集上测试了它,它似乎做了它应该做的事情。希望它也适用于您的数据集,无论它包含什么!=)

评论

0赞 Alex R 1/10/2009
我正在考虑这一点,我会尝试一下。我的两个担忧是:我担心在数据不是很密集的边缘丢失行为;可能还有一些部分我需要更高的注意力。
0赞 gnovice 1/10/2009
我会尝试上面的代码,其中包含一堆不同的 nBin 值。如果将 nBins 变大,则会导致所有 Bins 的尺寸缩小。这将为您提供更高浓度的箱,其中您拥有大量数据。至于“在边缘失去行为”,我不确定你的意思。
0赞 Alex R 1/10/2009
在 x 坐标的最小值和最大值附近,数据点要少得多。这会将均值从极值拉开,如果极值附近有有趣的行为,则可能不明显。