tei 问答列表

使用星期几/月定义时间间隔 (ISO 8601?)

作者:root66 提问时间:2/14/2015

我想定义时间间隔,例如: 每周,周一上午 12:00 至周日晚上 11:59:59 每天上午 12:00 至晚上 11:59:59 每个月的第一天凌晨 12:00 到每月的最后一天晚上 11:59:...

哪种算法可以匹配集合中最相似的字符串?

作者: 提问时间:1/13/2018

假设我有一个包含书名的书籍数据库。对于来自 eBay 或 Craigslist 或其他类似网站的给定列表,我想将其标题字符串与我数据库中的所有书名进行比较,以尝试找到匹配项。 不太可能有确切的字符串...

从简单 html 中提取文本和(hlStart 和 hlEnd)标记

作者:Konrad Juszczyk 提问时间:5/10/2020

我有以下部分的html / xml文件: <p><hlstart ana="#ann224094"></<hlstart>Przed<hlend ana="#ann224094"></hlend> ...

使用自关闭标记从 xml 导出文本

作者:hedone5628 提问时间:2/19/2023

我有一组 XML TEI 文件,其中包含文档的转录。我想解析这些XML文件并仅提取文本信息。 我的 XML 如下所示: <?xml version='1.0' encoding='UTF8'?> ...

检查 null 状态时的 Kotlin null 指针

作者:user1743524 提问时间:3/29/2023

我有一个简单的 null 检查导致异常的代码块 科特林。UninitializedPropertyAccessException:lateinit 属性 currentJob 尚未初始化 在 com...

Levenshtein on dataframe 列和输入列表

作者:curios 提问时间:4/24/2023

pyspark 的新手,我需要做模糊匹配。发现 levenhenstein 是一个可以做到这一点的原生函数。我有一个这样的数据帧: +----------------+---------------...

来自 Pyspark.sql.functions 的 levenshtein 非常慢

作者:curios 提问时间:5/15/2023

我需要进行模糊匹配并使用 levenshtein pyspark 函数,因为它是内置的 pyspark 函数,我认为会比 udf 有速度优势。它非常慢,数据帧中大约有 341 行(最大),并且正在使用...

Python:获取与另一个字符串最接近的字符串的子字符串

作者:cadavre 提问时间:9/21/2023

今天给你一个很好的算法琐事。:) 我有两个字符串——一个是较长的句子,另一个是较长的句子,由 LLM 在较长的句子中发现。让我们看一个例子: 长句:“如果你是一名编码员,你应该考虑从苹果购买配备M...

Kotlin SurfaceView / lateinit 属性 surface 尚未初始化

作者:doker797 提问时间:10/5/2023

我仍然很青涩,不知道该语言的一些功能。我在这里遇到以下问题是我的代码: private lateinit var surface: SurfaceView private var _binding:...

创建用于字符串匹配的嵌入

作者:user3585510 提问时间:10/17/2023

我有 4 个公司名称列表。让我们以谷歌公司为例。在列表 A 中,Google 被写成 Google Ltd,在第二个列表中,它被写成 Google Inc(扩展等),第 3 个包含 Beta Gogl...


共11条 当前第1页