docker 容器内的 Google Chrome 占用大量磁盘空间

Google Chrome inside a docker container takes up a lot of disk space

提问人:Eldellano 提问时间:10/20/2023 更新时间:10/20/2023 访问量:45

问:

我使用 Google Chrome 在 Python 和 Selenium 中抓取某些网站。我把每一个都打包在一个Docker容器中,在组装过程中安装了Google Chrome。我最近注意到,经过一段时间的运行,我的容器开始大幅增长并占用数十 GB 的磁盘空间。我发现 Chrome 会下载一些文件并将它们保存在 tmp 文件夹中。在每个这样的文件夹中,文件夹“optimization_guide_prediction_model_downloads”占用的空间最多。互联网搜索显示,Google Chrome 每次都会将数据下载到 TMP。由于所有这些都在我的容器中,因此每个创建的浏览器实例都会生成自己的此类文件夹。

我找到的唯一解决方案是通过传递给浏览器的参数禁用 OptimizationGuideModelDownloading,但这并没有改变这种情况。请告诉我如何防止 Chrome 下载此类文件以防止容器增长? 在屏幕截图中,我展示了 Docker 容器中的 TMP 结构:self.options.add_argument("--disable-blink-features=OptimizationGuideModelDownloading")

https://i.stack.imgur.com/DIOHs.png https://i.stack.imgur.com/iY6vp.png https://i.stack.imgur.com/1EaBP.png

docker google-chrome selenium-chromedriver

评论


答: 暂无答案