Marques, Eduardo Miguel DiasPinheiro, Ricardo Daniel2024-03-222024-03-222024-02-02http://hdl.handle.net/10400.13/5608Trail running is a running sport that spans across outdoor and mountainous terrain, often with hilly ascents and descents. This created a competitive scene that has garnered the interest of trail running enthusiasts into competing in 100km+ grueling races that can last for over 24 hours. Machine learning is a research field that focuses on developing algorithms capable of learning and making predictions based on data. In essence, it revolves around creating algorithms that can analyze data, identify patterns, and make informed predictions. The organizations that setup trail running events operate a system that keeps track of the competitors arrival times across the designated points in a trail running course. The data analysis of trail running can provide valuable insights in respect to the planning of the event, namely in regard to the guarantee of the runner’s safety, the scheduling of transport for runners, the allocation of human resources, and the allocation of food and beverages. A first initial research finds that the existing literature does not focus on the prediction in regards to both trail running and machine learning topics, the latter being a solution found in research related to marathon running. At first, an initial approach was conducted in order to comprehend the prediction of arrival times based on an existing implementation. This approach analyzed the velocities of the runners, and such approach revealed that it would be optimal to utilize the Mean Absolute Error (MAE) as a metric for the next approaches. The second approach evolved into the use of the models LASSO and Random Forests with features related to both the checkpoints of a race and it’s runners in competition. This approach netted a 24.45% MAE reduction when compared to the first approach. In the third approach, the LASSO model was excluded as the Random Forest model had overcome with least MAE. With the inclusion of more race time data in the last approach, we were able to reduce the MAE of the first approach by 28.71% with the employment of the Random Forest model.O trail running é um desporto de corrida que se estende por terrenos montanhosos e ao ar livre, muitas vezes com subidas e descidas acidentadas. Este desporto criou um cenário competitivo que despertou o interesse dos entusiastas do trail running para competirem em corridas extensas de mais de 100 km que podem durar mais de 24 horas. O machine learning é uma área de investigação focada no desenvolvimento de algoritmos capazes de aprenderem e de realizarem previsões baseadas em dados. Essencialmente, este centra-se na criação de algoritmos que podem analisar dados, identificar padrões e realizar previsões informadas. As organizações que organizam eventos de trail running utilizam um sistema que regista os tempos de chegada dos concorrentes aos pontos designados num percurso de trail running. A análise de dados do trail running pode fornecer informações valiosas relativamente ao planeamento do evento, nomeadamente no que diz respeito à garantia da segurança dos atletas, ao agendamento do transporte para os atletas, à alocação de recursos humanos e à alocação de alimentos e bebidas. Uma primeira investigação inicial constata que a literatura atual demonstra poucos trabalhos relacionados com a previsão e associados aos tópicos de trail running e o machine learning, sendo esta última uma solução que já surgiu em contextos ligados a corridas de maratonas. Numa primeira fase, foi efectuada uma abordagem inicial para compreender a previsão dos tempos de chegada com base numa implementação existente. A primeira abordagem baseou-se na análise das velocidades dos atletas, o que revelou que seria ótimo utilizar o Mean Absolute Error (MAE) como métrica para as abordagens seguintes. A segunda abordagem evoluiu para a utilização dos modelos LASSO e Random Forests com features relacionadas com características associadas aos postos de controlo da corrida e com os atletas em competição. Esta abordagem obteve uma redução de 24.45% do MAE em comparação com a primeira abordagem. Na terceira abordagem, o modelo LASSO foi excluído, uma vez que o modelo Random Forest obteve o menor MAE. Com a inclusão de mais dados de tempo de corrida na última abordagem, conseguimos reduzir o MAE da primeira abordagem em 28.71% com o uso do modelo Random Forest.engTrail runningMachine learningITRAMIUTInformatics Engineering.Faculdade de Ciências Exatas e da EngenhariaData analysis of trail running: runner passage predictionmaster thesis203559240