数据处理 问答列表

用于生存分析 SAS 的展开数据

作者:Tomikuz 提问时间:9/23/2021

我有如下所示的数据: 其中 month 是过去的月数,vegetable 是兴趣类别,n_spoiled 是该类别中在 x 个月后变质的蔬菜数量。 我有兴趣进行生存分析以比较这三个类别的曲线(过程...

如何使用SQL计算稀疏共现数据帧?

作者:Matthew 提问时间:1/20/2023

我正在尝试使用 SQL 将数据帧转换为稀疏共现数据帧。原始数据帧包含与每个 ID 关联的 ID 和产品的列表。与 ID 关联的最小产品数量为 2。 为了生成稀疏共现数据帧,我正在浏览原始数据帧并计算...

扫描程序抛出 java.util.NoSuchElementException:处理大型 CSV 文件时未找到行(750000 行)

作者:HarrisonO 提问时间:6/11/2023

您好,我目前正在处理一个大型 Excel 文档,其中包含大约 270 年来世界上每个城市的年温度,并收到错误 java.util.NoSuchElementException:大约 75000 行后找...

为什么我的有效数据一直输出到错误的 switch 语句上

作者:Zximy 提问时间:9/3/2023

我的有效数据(记录.txt)不断输出到错误的大小写语句。 记录.txt: AB12MP349 Fusion5 20 17000.00 33435KMOP324 BMW 40 25000.00 AB...

使用 OpenCV 的“findContours()”进行基于 4 连通性的轮廓检测

作者:Walrus 提问时间:10/18/2023

OpenCV 库中的函数不允许您根据 4 连接自定义轮廓的选择。我检查了一张测试图像:我们可以调整此功能的所有模式,它们似乎都使用 8 连接进行轮廓检测,因为它们将图像中的物体选择为 1 个完整的轮廓...

合并两个文件并高效扩展元数据

作者:binf-er 提问时间:11/10/2023

我正在处理一个大文件,其中每行都带有 CHR 和 POS 值(这是位置坐标)。 我使用工具处理此文件,但它仅输出这些位置坐标的子集,以及所有样本的附加元数据信息。 我的目标是使用已处理文件最近位置...

操作其中的 pdf 和文本

作者:DareBaaz 提问时间:11/16/2023

目前,我正在开发一个数据库,以创建用于教学大纲映射的 Excel 工作表。 我必须从 pdf 文件中提取特定数据,然后在不同的列中将名称书籍及其出版商分开。 我已经有所有图书出版商的名单。 我必须用书...

动态数据帧名称

作者:user22927025 提问时间:11/16/2023

代码背景:对于我的项目,我有相当大的数据集,我需要处理和计算每个数据集的单个值。我的代码以这样的方式工作,我只需要填写一个示例位置编号,并且无需再更改代码本身中的任何内容即可计算所有内容。 问题:我...


共8条 当前第1页