Repository logo
 
Publication

User profiling with feature selection and explainability: essays on three case studies across different domains

datacite.subject.fosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
dc.contributor.advisorDias, Fernando Manuel Rosmaninho Morgado Ferrão
dc.contributor.advisorFermé, Eduardo Leopoldo
dc.contributor.authorFreitas, Diogo Nuno Teixeira
dc.contributor.authorTeixeira Freitas, Diogo Nuno
dc.date.accessioned2026-01-09T13:23:54Z
dc.date.available2026-01-09T13:23:54Z
dc.date.issued2025-11-27
dc.description.abstractUser profiling is the process of constructing a structured representation of the user within a system. This representation includes information such as preferences, behaviors, and characteristics. Based on the profile, the system can recommend services and products or, in this work, suggest actions. Machine learning methods are commonly used to this end, as they can identify complex patterns among large numbers of attributes. However, not all attributes are relevant. High-dimensional datasets often contain irrelevant, redundant, or noisy features that obscure valuable patterns and reduce model accuracy. To address this, dimensionality reduction techniques—particularly feature selection—are essential. Equally important is the ability to explain a model’s output, since understanding why a model produces a given outcome builds trust and clarifies which steps can change an undesirable situation. This thesis applies feature selection, explainability, causal discovery, and machine teaching techniques to user profiling. The goal is to support decision-making by identi fying the most relevant features, clarifying causal mechanisms, and ensuring that stake holders understand why recommendations are made. Specifically, we investigate the mRMR (minimum-Redundancy-Maximum-Relevance) method for feature selection, ex amine explainability strategies such as feature importance analysis and counterfactuals, apply causal discovery to map cause-and-effect relationships, and use machine teaching to explore profile simplification. We apply this approach in four domains: (i) Marine litter: developing static profiles to identify those who could benefit from literacy interventions; (ii) Football injuries: building predictive models based on player profile dynamics to forecast risk; (iii) Energy poverty: designing models, using counterfactuals, and applying causal discovery to understand health–poverty links; and (iv) Concept complexity: using machine teaching to study profile simplification. These applications show how profiling can deliver targeted literacy interventions, prevent sports injuries, inform preventive policies in energy poverty, and improve the efficiency of user representations and concept learnability.eng
dc.description.abstractA criação de perfis de utilizador consiste na construção de uma representação estru turada do utilizador dentro de um sistema, incluindo informações sobre preferências, comportamentos e características. Com base neste perfil, o sistema pode recomendar serviços e produtos ou, no contexto deste trabalho, sugerir ações. Para tal, recorremos a métodos de aprendizagem automática, capazes de identificar padrões complexos em grandes conjuntos de atributos. Contudo, nem todos os atributos são relevantes, sobretudo em conjuntos de dados de elevada dimensionalidade. Certas características podem ocultar padrões importantes e reduzir a precisão dos modelos. Para mitigar este problema, utilizamos técnicas de redução de dimensionalidade, em particular a seleção de características. É igualmente importante explicar os resultados dos modelos, pois compreender por que razão uma previsão é gerada aumenta a confiança e permite identificar ações para modificar situações indesejadas. Este trabalho aplica técnicas de redução de dimensionalidade, explicabilidade, causa lidade e ensino automático (machine teaching) à criação de perfis. O objetivo é apoiar a tomada de decisão, identificando atributos relevantes, clarificando mecanismos causais e assegurando que os intervenientes compreendem as recomendações. Investigamos o método mRMR (minimum-Redundancy-Maximum-Relevance), estratégias de explicabili dade como a importância de características (feature importance) e explicações contrafac tuais, aplicamos descoberta causal para identificar relações de causa-efeito e recorremos ao ensino automático para simplificação de perfis. A abordagem é aplicada em quatro domínios: (i) Lixo marinho: perfis estáticos para orientar intervenções de literacia ambiental; (ii) Lesões no futebol: modelos preditivos baseados na dinâmica do perfil do jogador; (iii) Pobreza energética: modelos preditivos, explicações contrafactuais e causalidade para compreender a relação entre saúde e pobreza; e (iv) Complexidade conceptual: uso de ensino automático para a simplificação de perfis. Estes estudos mostram como a criação de perfis pode apoiar campanhas ambientais, prevenir lesões desportivas, fundamentar políticas preventivas contra a pobreza energética e melhorar a eficiência das representações de utilizadores.por
dc.identifier.tid101728077
dc.identifier.urihttp://hdl.handle.net/10400.13/7538
dc.language.isoeng
dc.relationUser Profiling: An AGM-Based Belief Revision Approach Applied to Dynamic of Profiles
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectUser profiling
dc.subjectProfile dynamics
dc.subjectExplainable AI
dc.subjectCausal discovery
dc.subjectMachine teaching
dc.subjectFeature selection
dc.subjectPerfis de utilizador
dc.subjectDinâmica de perfis
dc.subjectInteligência artificial explicável
dc.subjectDescoberta causal
dc.subjectEnsino de máquina
dc.subjectSeleção de atributos
dc.subjectInformatics Engineering
dc.subjectspecialization: Artificial Intelligence
dc.subject.
dc.subjectFaculdade de Ciências Exatas e da Engenharia
dc.titleUser profiling with feature selection and explainability: essays on three case studies across different domainseng
dc.typedoctoral thesis
dspace.entity.typePublication
oaire.awardTitleUser Profiling: An AGM-Based Belief Revision Approach Applied to Dynamic of Profiles
oaire.awardURIinfo:eu-repo/grantAgreement/FCT//2021.07966.BD/PT
person.familyNameTeixeira Freitas
person.givenNameDiogo Nuno
person.identifieryfy16oUAAAAJ
person.identifier.ciencia-id9C13-AF9C-25F3
person.identifier.orcid0000-0002-2351-8676
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
relation.isAuthorOfPublicationb71e6dc9-523a-4300-92c3-4c459023a98c
relation.isAuthorOfPublication.latestForDiscoveryb71e6dc9-523a-4300-92c3-4c459023a98c
relation.isProjectOfPublication77b5ae6c-67a6-4f0f-b9bc-bb900a9c939b
relation.isProjectOfPublication.latestForDiscovery77b5ae6c-67a6-4f0f-b9bc-bb900a9c939b
thesis.degree.nameDoctor degree in Informatics Engineering, specialization: Artificial Intelligence

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Digital.pdf
Size:
13.06 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.03 KB
Format:
Item-specific license agreed upon to submission
Description: