Sažetak: U posljednje vrijeme phishing napadi i mrežne krađe identiteta predstavljaju značajnu prijetnju kibernetičke sigurnosti koristeći lažne web stranice kako bi prevarili korisnike u otkrivanju osjetljivih podataka. Phishing je oblik društvenog inženjeringa u kojem napadači daju pogrešne informacije putem lažnih web stranica kako bi prevarili žrtvu da ustupi osobne podatke radi dobivanja dodatnih informacija ili ostvarivanja financijske koristi. Zbog brzog razvoja tehnologije i taktika krađe identiteta te sve češće razmjene informacija putem interneta, potrebne su učinkovite metode za otkrivanje lažnih URL-ova. Cilj ovog rada bio je procijeniti učinkovitost različitih modela strojnog i dubokog učenja u klasifikaciji zlonamjernih i sigurnih web adresa bez analize sadržaja stranica. Eksperimentalni rezultati pokazuju da konvolucijske neuronske mreže (CNN) mogu postići točnost do 98,7 %, dok ensemble modeli poput Random Foresta i XGBoosta također bilježe visoku točnost iznad 96 %, čime se značajno nadmašuju tradicionalni pristupi poput logističke regresije. Kako se strategije krađe identiteta nastavljaju razvijati, tako će adaptivni modeli poput ensemble tehnika učenja i arhitektura dubokog učenja biti ključni za zaštitu online sigurnosti te za razumijevanje učinkovitog suzbijanja novonastalih kibernetičkih prijetnji.
Ključne riječi: društveni inženjering, ensemble modeli, kibernetički napadi, klasifikacija URL adresa, SMOTE