Extract normalised domain names with tldextract

2024-04-01 15:46:55 +01:00 · 2024-04-01 15:46:55 +01:00 · dbe8a5d869
commit dbe8a5d869
parent 7d4233c9e8
1 changed files with 3 additions and 1 deletions
--- a/app/models/mirrors.py
+++ b/app/models/mirrors.py
@ -1,4 +1,5 @@
 import json
 import tldextract
 from datetime import datetime, timedelta
 from typing import Optional, List, Union, Any, Dict
@ -55,7 +56,8 @@ class Origin(AbstractConfiguration):
    @property
    def normalised_domain_name(self):
-        return self.domain_name.replace("www.", "")
+        extracted_domain = tldextract.extract(self.domain_name)
        return extracted_domain.registered_domain
    def onion(self) -> Optional[str]:
        tld = extract(self.domain_name).registered_domain