| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 13.06 MB | Adobe PDF |
Abstract(s)
User profiling is the process of constructing a structured representation of the user
within a system. This representation includes information such as preferences, behaviors,
and characteristics. Based on the profile, the system can recommend services and products
or, in this work, suggest actions. Machine learning methods are commonly used to this
end, as they can identify complex patterns among large numbers of attributes.
However, not all attributes are relevant. High-dimensional datasets often contain
irrelevant, redundant, or noisy features that obscure valuable patterns and reduce model
accuracy. To address this, dimensionality reduction techniques—particularly feature
selection—are essential. Equally important is the ability to explain a model’s output, since
understanding why a model produces a given outcome builds trust and clarifies which
steps can change an undesirable situation.
This thesis applies feature selection, explainability, causal discovery, and machine
teaching techniques to user profiling. The goal is to support decision-making by identi fying the most relevant features, clarifying causal mechanisms, and ensuring that stake holders understand why recommendations are made. Specifically, we investigate the
mRMR (minimum-Redundancy-Maximum-Relevance) method for feature selection, ex amine explainability strategies such as feature importance analysis and counterfactuals,
apply causal discovery to map cause-and-effect relationships, and use machine teaching
to explore profile simplification.
We apply this approach in four domains: (i) Marine litter: developing static profiles to
identify those who could benefit from literacy interventions; (ii) Football injuries: building
predictive models based on player profile dynamics to forecast risk; (iii) Energy poverty:
designing models, using counterfactuals, and applying causal discovery to understand
health–poverty links; and (iv) Concept complexity: using machine teaching to study
profile simplification.
These applications show how profiling can deliver targeted literacy interventions,
prevent sports injuries, inform preventive policies in energy poverty, and improve the
efficiency of user representations and concept learnability.
A criação de perfis de utilizador consiste na construção de uma representação estru turada do utilizador dentro de um sistema, incluindo informações sobre preferências, comportamentos e características. Com base neste perfil, o sistema pode recomendar serviços e produtos ou, no contexto deste trabalho, sugerir ações. Para tal, recorremos a métodos de aprendizagem automática, capazes de identificar padrões complexos em grandes conjuntos de atributos. Contudo, nem todos os atributos são relevantes, sobretudo em conjuntos de dados de elevada dimensionalidade. Certas características podem ocultar padrões importantes e reduzir a precisão dos modelos. Para mitigar este problema, utilizamos técnicas de redução de dimensionalidade, em particular a seleção de características. É igualmente importante explicar os resultados dos modelos, pois compreender por que razão uma previsão é gerada aumenta a confiança e permite identificar ações para modificar situações indesejadas. Este trabalho aplica técnicas de redução de dimensionalidade, explicabilidade, causa lidade e ensino automático (machine teaching) à criação de perfis. O objetivo é apoiar a tomada de decisão, identificando atributos relevantes, clarificando mecanismos causais e assegurando que os intervenientes compreendem as recomendações. Investigamos o método mRMR (minimum-Redundancy-Maximum-Relevance), estratégias de explicabili dade como a importância de características (feature importance) e explicações contrafac tuais, aplicamos descoberta causal para identificar relações de causa-efeito e recorremos ao ensino automático para simplificação de perfis. A abordagem é aplicada em quatro domínios: (i) Lixo marinho: perfis estáticos para orientar intervenções de literacia ambiental; (ii) Lesões no futebol: modelos preditivos baseados na dinâmica do perfil do jogador; (iii) Pobreza energética: modelos preditivos, explicações contrafactuais e causalidade para compreender a relação entre saúde e pobreza; e (iv) Complexidade conceptual: uso de ensino automático para a simplificação de perfis. Estes estudos mostram como a criação de perfis pode apoiar campanhas ambientais, prevenir lesões desportivas, fundamentar políticas preventivas contra a pobreza energética e melhorar a eficiência das representações de utilizadores.
A criação de perfis de utilizador consiste na construção de uma representação estru turada do utilizador dentro de um sistema, incluindo informações sobre preferências, comportamentos e características. Com base neste perfil, o sistema pode recomendar serviços e produtos ou, no contexto deste trabalho, sugerir ações. Para tal, recorremos a métodos de aprendizagem automática, capazes de identificar padrões complexos em grandes conjuntos de atributos. Contudo, nem todos os atributos são relevantes, sobretudo em conjuntos de dados de elevada dimensionalidade. Certas características podem ocultar padrões importantes e reduzir a precisão dos modelos. Para mitigar este problema, utilizamos técnicas de redução de dimensionalidade, em particular a seleção de características. É igualmente importante explicar os resultados dos modelos, pois compreender por que razão uma previsão é gerada aumenta a confiança e permite identificar ações para modificar situações indesejadas. Este trabalho aplica técnicas de redução de dimensionalidade, explicabilidade, causa lidade e ensino automático (machine teaching) à criação de perfis. O objetivo é apoiar a tomada de decisão, identificando atributos relevantes, clarificando mecanismos causais e assegurando que os intervenientes compreendem as recomendações. Investigamos o método mRMR (minimum-Redundancy-Maximum-Relevance), estratégias de explicabili dade como a importância de características (feature importance) e explicações contrafac tuais, aplicamos descoberta causal para identificar relações de causa-efeito e recorremos ao ensino automático para simplificação de perfis. A abordagem é aplicada em quatro domínios: (i) Lixo marinho: perfis estáticos para orientar intervenções de literacia ambiental; (ii) Lesões no futebol: modelos preditivos baseados na dinâmica do perfil do jogador; (iii) Pobreza energética: modelos preditivos, explicações contrafactuais e causalidade para compreender a relação entre saúde e pobreza; e (iv) Complexidade conceptual: uso de ensino automático para a simplificação de perfis. Estes estudos mostram como a criação de perfis pode apoiar campanhas ambientais, prevenir lesões desportivas, fundamentar políticas preventivas contra a pobreza energética e melhorar a eficiência das representações de utilizadores.
Description
Keywords
User profiling Profile dynamics Explainable AI Causal discovery Machine teaching Feature selection Perfis de utilizador Dinâmica de perfis Inteligência artificial explicável Descoberta causal Ensino de máquina Seleção de atributos Informatics Engineering specialization: Artificial Intelligence . Faculdade de Ciências Exatas e da Engenharia
