1
2

Ivana Hartmann Tolić

1

, Mirta Vujnovac

2

Ivana Hartmann Tolić

1

, Mirta Vujnovac

2

1. Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek, Kneza Trpimira 2b, 31000 Osijek, Hrvatska
2. III. gimnazija Osijek, Kamila Firingera 14, 31000 Osijek, Hrvatska
1. Fakultet elektrotehnike, računarstva i informacijskih tehnologija Osijek, Kneza Trpimira 2b, 31000 Osijek, Hrvatska
2. III. gimnazija Osijek, Kamila Firingera 14, 31000 Osijek, Hrvatska

Sažetak: U posljednje vrijeme phishing napadi i mrežne krađe identiteta predstavljaju značajnu prijetnju kibernetičke sigurnosti koristeći lažne web stranice kako bi prevarili korisnike u otkrivanju osjetljivih podataka. Phishing je oblik društvenog inženjeringa u kojem napadači daju pogrešne informacije putem lažnih web stranica kako bi prevarili žrtvu da ustupi osobne podatke radi dobivanja dodatnih informacija ili ostvarivanja financijske koristi. Zbog brzog razvoja tehnologije i taktika krađe identiteta te sve češće razmjene informacija putem interneta, potrebne su učinkovite metode za otkrivanje lažnih URL-ova. Cilj ovog rada bio je procijeniti učinkovitost različitih modela strojnog i dubokog učenja u klasifikaciji zlonamjernih i sigurnih web adresa bez analize sadržaja stranica. Eksperimentalni rezultati pokazuju da konvolucijske neuronske mreže (CNN) mogu postići točnost do 98,7 %, dok ensemble modeli poput Random Foresta i XGBoosta također bilježe visoku točnost iznad 96 %, čime se značajno nadmašuju tradicionalni pristupi poput logističke regresije. Kako se strategije krađe identiteta nastavljaju razvijati, tako će adaptivni modeli poput ensemble tehnika učenja i arhitektura dubokog učenja biti ključni za zaštitu online sigurnosti te za razumijevanje učinkovitog suzbijanja novonastalih kibernetičkih prijetnji.

Ključne riječi: društveni inženjering, ensemble modeli, kibernetički napadi, klasifikacija URL adresa, SMOTE

Summary: Phishing attacks have posed a significant threat to cybersecurity in recent years. Phishing is a form of social engineering in which attackers provide misleading information via fake websites in order to trick the victim into disclosing private information to obtain further information or gain a financial advantage. With the rapid development of technology and phishing tactics, access to information and the frequent exchange of information, effective methods for detecting fake URLs are needed. The goal is to evaluate the effectiveness of different models in classifying malicious and legitimate web addresses without analyzing the content of the page. This study aimed to evaluate the effectiveness of various machine learning and deep learning models in classifying malicious and legitimate web addresses without analyzing page content. Experimental results show that convolutional neural networks (CNNs) can achieve accuracy rates of up to 98.7%, while ensemble models such as Random Forest and XGBoost also demonstrate high accuracy, exceeding 96%, significantly outperforming traditional approaches like logistic regression. As phishing strategies continue to evolve, adaptive models such as ensemble learning techniques, deep learning architectures will be fundamental to securing online security and crucial to understanding how to effectively counter emerging cybersecurity threats.
Keywords: Cyber attacks, Ensemble models, SMOTE, Social engineering, URL classification

Ovaj rad je licenciran pod Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International.

Zaprimljen: 10.06.2025.

Odobren: 23.07.2025

Broj pregleda: 18