从任何类型的url提取域名

Extract domain name from ANY type of url

本文关键字:提取 域名 url 任何 类型      更新时间:2023-09-26

关于从各种url中提取域名的SO有很多问题,但没有一个问题涵盖所有子域名和后缀(.org, .uk, .com, .org.uk, .等等)。

例如

:

http://uselesstext.moretext.DOMAIN.org.uk/

结果:

DOMAIN.org.uk

这里的主要问题是,似乎不可能设计一种算法来识别URL的哪一部分是相关的部分(不使用库),因为可能有不同数量的子域和后缀。

任何想法?

您在这里寻找的是公共后缀列表。它是每个域扩展的列表,可以在其下注册独立管理的域(例如,com, org.uk等)。

这个列表有很多Javascript实现。最常见的两个是publicsuffixlist.js和tld.js。