Repository logo
 
Loading...
Thumbnail Image
Publication

User profiling with feature selection and explainability: essays on three case studies across different domains

Use this identifier to reference this record.
Name:Description:Size:Format: 
Digital.pdf13.06 MBAdobe PDF Download

Abstract(s)

User profiling is the process of constructing a structured representation of the user within a system. This representation includes information such as preferences, behaviors, and characteristics. Based on the profile, the system can recommend services and products or, in this work, suggest actions. Machine learning methods are commonly used to this end, as they can identify complex patterns among large numbers of attributes. However, not all attributes are relevant. High-dimensional datasets often contain irrelevant, redundant, or noisy features that obscure valuable patterns and reduce model accuracy. To address this, dimensionality reduction techniques—particularly feature selection—are essential. Equally important is the ability to explain a model’s output, since understanding why a model produces a given outcome builds trust and clarifies which steps can change an undesirable situation. This thesis applies feature selection, explainability, causal discovery, and machine teaching techniques to user profiling. The goal is to support decision-making by identi fying the most relevant features, clarifying causal mechanisms, and ensuring that stake holders understand why recommendations are made. Specifically, we investigate the mRMR (minimum-Redundancy-Maximum-Relevance) method for feature selection, ex amine explainability strategies such as feature importance analysis and counterfactuals, apply causal discovery to map cause-and-effect relationships, and use machine teaching to explore profile simplification. We apply this approach in four domains: (i) Marine litter: developing static profiles to identify those who could benefit from literacy interventions; (ii) Football injuries: building predictive models based on player profile dynamics to forecast risk; (iii) Energy poverty: designing models, using counterfactuals, and applying causal discovery to understand health–poverty links; and (iv) Concept complexity: using machine teaching to study profile simplification. These applications show how profiling can deliver targeted literacy interventions, prevent sports injuries, inform preventive policies in energy poverty, and improve the efficiency of user representations and concept learnability.
A criação de perfis de utilizador consiste na construção de uma representação estru turada do utilizador dentro de um sistema, incluindo informações sobre preferências, comportamentos e características. Com base neste perfil, o sistema pode recomendar serviços e produtos ou, no contexto deste trabalho, sugerir ações. Para tal, recorremos a métodos de aprendizagem automática, capazes de identificar padrões complexos em grandes conjuntos de atributos. Contudo, nem todos os atributos são relevantes, sobretudo em conjuntos de dados de elevada dimensionalidade. Certas características podem ocultar padrões importantes e reduzir a precisão dos modelos. Para mitigar este problema, utilizamos técnicas de redução de dimensionalidade, em particular a seleção de características. É igualmente importante explicar os resultados dos modelos, pois compreender por que razão uma previsão é gerada aumenta a confiança e permite identificar ações para modificar situações indesejadas. Este trabalho aplica técnicas de redução de dimensionalidade, explicabilidade, causa lidade e ensino automático (machine teaching) à criação de perfis. O objetivo é apoiar a tomada de decisão, identificando atributos relevantes, clarificando mecanismos causais e assegurando que os intervenientes compreendem as recomendações. Investigamos o método mRMR (minimum-Redundancy-Maximum-Relevance), estratégias de explicabili dade como a importância de características (feature importance) e explicações contrafac tuais, aplicamos descoberta causal para identificar relações de causa-efeito e recorremos ao ensino automático para simplificação de perfis. A abordagem é aplicada em quatro domínios: (i) Lixo marinho: perfis estáticos para orientar intervenções de literacia ambiental; (ii) Lesões no futebol: modelos preditivos baseados na dinâmica do perfil do jogador; (iii) Pobreza energética: modelos preditivos, explicações contrafactuais e causalidade para compreender a relação entre saúde e pobreza; e (iv) Complexidade conceptual: uso de ensino automático para a simplificação de perfis. Estes estudos mostram como a criação de perfis pode apoiar campanhas ambientais, prevenir lesões desportivas, fundamentar políticas preventivas contra a pobreza energética e melhorar a eficiência das representações de utilizadores.

Description

Keywords

User profiling Profile dynamics Explainable AI Causal discovery Machine teaching Feature selection Perfis de utilizador Dinâmica de perfis Inteligência artificial explicável Descoberta causal Ensino de máquina Seleção de atributos Informatics Engineering specialization: Artificial Intelligence . Faculdade de Ciências Exatas e da Engenharia

Pedagogical Context

Citation

Organizational Units

Journal Issue

Publisher

CC License