Previsão de preços de criptomoedas com Random Forest – UPM Digital Archive

O uso de criptomoedas como forma de pagamento está se tornando mais comum a cada dia. Apesar de muitos eventos indicarem que foram e continuam sendo utilizados no mercado negro, a aceitação por parte de empresas e investidores para a realização de transações é alta. De fato, 80% das empresas o assinam. No entanto, a volatilidade presente nessas moedas virtuais desacelerou a expansão dessa forma de pagamento devido ao ceticismo gerado por seu sistema descentralizado e sem autoridades controladoras. As criptomoedas são frequentemente usadas como uma forma de negociação, como nos mercados de ações. Assim como no mercado de ações, o Trading permite especular sobre o preço das criptomoedas, gerando ordens de compra e venda de ativos. A ascensão das criptomoedas levou muitos investidores a tentarem intensamente prever o preço das criptomoedas com o objetivo claro de aumentar seus lucros. O mercado de criptomoedas tem como uma de suas principais desvantagens a alta volatilidade de seus preços, devido ao risco que acarreta.

É por isso que se propõe fazer um estudo exaustivo deles. A descentralização presente nas criptomoedas às vezes está relacionada a essa oscilação de preços, pois grandes investidores podem investir em um ativo por meio de grandes movimentações de capital sem que haja qualquer explicação possível ou correlação observável sobre sua real situação, afetando diretamente os investidores.. É por isso que as formas de prever altos e baixos no preço das criptomoedas são buscadas e investigadas. A inteligência artificial (IA) teve um impacto tecnológico espetacular em muitas áreas da sociedade, como educação, medicina, finanças, engenharia ou segurança e defesa. É uma forma de computação e transformação da informação. Embora para a maioria das pessoas esse avanço passe despercebido em seu dia-a-dia, existem muitos recursos alimentados por IA em nossos dispositivos móveis.

Os avanços são tão rápidos que ninguém pode imaginar que avanços revolucionários haverá em poucos anos. O aprendizado automático ou aprendizado de máquina é um ramo da IA ​​que se baseia no aprendizado de computadores com o mínimo de interação humana. Por sua vez, existe outro ramo dentro do Machine Learning, o aprendizado supervisionado, que foca no aprendizado de máquinas por si só por meio de treinamento e dados de entrada, dados de saída são obtidos. Neste Projeto de Conclusão de Curso, são aplicadas técnicas de aprendizado supervisionado com o objetivo de fazer previsões dos valores das criptomoedas, tentando reduzir a alta volatilidade a que o mercado está exposto. Especificamente, será feito um estudo das 7 criptomoedas com maior capitalização de mercado através do uso da técnica Random Forest ou Random Forests.

As criptomoedas propostas são Bitcoin, Ethereum, Ripple, Litecoin, Dash, Cardano e EOS. A vantagem de fazer previsões e antecipar os movimentos do mercado é de grande interesse devido aos benefícios econômicos que pode trazer. Os investidores podem ter uma grande ajuda na tomada de decisões ao contar com essa ferramenta. Com a técnica proposta, pretende-se criar modelos preditivos do preço de fechamento com base em características selecionadas. Feita a previsão, serão avaliados os resultados obtidos no conjunto de validação. O procedimento seguido para realizar este estudo consiste em três etapas claramente diferenciadas. Em primeiro lugar, analisou-se o interesse deste projeto e realizou-se uma investigação para adquirir os conhecimentos necessários. Não apenas a técnica Random Forest foi investigada, mas a origem e a evolução das criptomoedas foram pesquisadas e refletidas.

Segundo, dados históricos foram obtidos e modelos de previsão foram construídos usando Random Forest para prever os preços de fechamento do conjunto de teste. Será feita uma comparação entre os modelos propostos com base na quantidade de informações obtidas de cada criptomoeda. Ou seja, os preços serão obtidos a cada quatro, duas horas e meia. Para verificar a eficácia de cada modelo proposto, serão criados um conjunto de treinamento e um conjunto de teste, sendo este último menor. Dessa forma, os 80% mais antigos dos dados serão os dados de treinamento e os 20% mais recentes serão os dados de teste. A avaliação de cada modelo será realizada em um conjunto de validação utilizando a raiz do erro quadrático médio (RMSE), o erro médio absoluto (MAE), o erro percentual médio absoluto (MAPE) e o coeficiente de determinação (R2), bem como o erro fora da bolsa ou comumente chamado de erro OOB.


Design a site like this with WordPress.com
Get started