bigdata 问答列表

Hadoop Graph 输入 - 链接作业

作者:user846445 提问时间:3/24/2015

我有一个以下格式的输入文件。 input.txt 1, 1 2 2, 1 3 3, 2 3 4, 1 4 上面的输入文件有一个键,它是行号,值是无向图的图形边缘。例如,对于第一条记录,行号为 ...

在 R 中将 tm 的语料库函数与大数据一起使用

作者:Hack-R 提问时间:8/28/2014

我正在尝试使用 R 对大数据进行文本挖掘。tm 我经常遇到内存问题(例如),并使用既定的方法来解决这些问题,例如can not allocation vector of size.... 使用 6...

MapReduce使用python脚本作为映射器和简化器使用hadoop-streaming-3.3.6.jar进行故障排除

作者:Mohamed MOUHNARI 提问时间:10/17/2023

核心站点.xml 配置: <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://Master:9000</...

键值存储属性

作者:Kay zhrani 提问时间:10/29/2023

我有一篇关于键值存储的文章。我找不到任何关于其属性的信息。键值存储是否具有属性,如果有,它们是什么?我是这个概念的新手,所以链接资源会很有帮助。 谢谢...

如何在 Gathr 中请求连接器

作者:Gaurav Ghildiyal 提问时间:11/9/2023

我是 ETL 开发人员,正在寻找 Gatr 中不可用的数据源连接器,但我不知道如何请求新的连接器。现在,由于 Gatr 中的连接器不可用,我在创建 ETL 数据管道时卡住了。...

我可以为我的静态博客网站制作多少个 Markdown 文件有限制吗?

作者:C.Tale 提问时间:11/12/2023

对于上下文(这些也是我对内存、JSON 和 JavaScript 工作原理的假设): 我在 .posts/*.mdx 当我“构建”我的静态站点时,我使用这些文件来生成 JSON 并公开一个名为的类型安...

如何在不将字典加载到内存中的情况下写入 Python 字典?

作者:O.rka 提问时间:11/14/2023

我有一个大表,我想将其转换为 Python 字典,但我不想将所有数据加载到内存中。 是否可以在不先构建对象的情况下主动写入 pickle 转储? 例如: import gzip f_out = ...


共7条 当前第1页