提问人:sgfit 提问时间:6/11/2023 更新时间:6/11/2023 访问量:87
如何确定电子邮件地址是否属于 K12 学校?
How to determine if a email address belongs to a K12 school?
问:
我工作的一个网站不允许使用来自 K12 学校(小学、初中和高中)的电子邮件,因为政策不允许 18 岁以下的用户使用。验证不寻常的域需要大量的手动版主工作;排名前 20 位的域名约占所有注册的 70%,但长尾很长。理想情况下,注册流程可以识别这些电子邮件的很大一部分,并禁止在注册步骤中创建帐户。
我知道这个问题在数学上是无法解决的,因为电子邮件或 DNS 标准中没有“是教育域”标志,也没有单一的教育电子邮件提供商的规范列表。但是,就我的应用程序而言,保护用户和节省版主劳动力的红利大于成本。
我目前的想法:
- 维护已知已批准电子邮件提供商的白名单和已知教育域的黑名单。
- 注册账号后,请根据白名单和黑名单检查域名,并适当批准或拒绝。
- 如果域既不在白名单中也不在黑名单中,请检查域中的某些键字符串:*.k12.*、*schools.*、*student*、*.edu、*.ac.uk。如果其中任何一个匹配,请将电子邮件添加到黑名单并禁止注册。
- 如果域与上述任何通配符匹配项不匹配,则采用 Bozocrack 方法:在根域中获取网页内容,并在其中搜索任何 K12 学校的信息。这将包括搜索诸如*教育*,*学术*,*公立学校*,*学生*,*教师*,*注册*等短语。如果找到的匹配项超过阈值 N,则将域列入黑名单并取消注册。
- 如果无法识别域,并且无法加载任何页面,则将帐户标记为使用现有的手动验证流程。人工版主可以将域添加到白名单或黑名单中,具体取决于该验证流程的结果。
- 如果域或与域关联的页面中没有捕获到危险信号,请允许正常注册。
在我开始重新发明轮子之前:是否有公认的标准来确定一个域名是否与 K12 学校相关联?
答: 暂无答案
评论