MarketPlace Decision Score

Desenvolvimento

UNIVERSIDADE FEDERAL DO MATO GROSSO DO SUL

Autor: José Augusto Lajo Vieira Vital

Professor: Edson Takashi Matsubara

Inteligência Artificial

Estudo: Manipulação de árvores de decisão para identificar possíveis problemas em um marketplace.

Linguagem: Python

Link Colab Original

https://colab.research.google.com/drive/1LFk9HUKs-viPqtMErtP7wP46CuKbrXOu?usp=sharing

Especificações do modelo

Como entender a situação do e-commerce, sua logística e todos os seus fatores é um problema complexo, inicia-se o estudo identificando que se trata de um problema descritivo. Sendo assim, uma das soluções mais apropriadas para problemas com essas caracteristicas é árvore de decisão.

Árvore de Decisão

O conceito utilizado para a resolução do problema foi com base na lógica de árvores de decisão. Dessa forma, cada condição encontrada pode levar a inúmeras possibilidades diferentes. Portanto o modelo utilizado explora parte do dataset para treino, e com base no padrão encontrado, retorna os atributos mais relevantes para a insatisfação dos clientes.

Exemplo:

Análise de Dados

Os dados utilizados para aplicação do modelo são de um dataset real pertencente a um e-commerce que apresentava problemas relacionados a satisfação dos seus clientes. As dificuldades de identificar as razões eram o grande volume de dados e a complexidade na correlação de muitos atributos.

O conjunto de dados pode ser acessado por: https://www.kaggle.com/olistbr/brazilian-ecommerce

Tabelas

Foram utilizadas 9 tabelas do modelo relacional para filtragrem e análise de todos os valores e atributos mais relevantes para a variável decision_score da tabela olist_order_reviews_dataset. O objetivo de reunir todos os dados em uma tabela só, é justamente facilitar o aprendizado do modelo e aumentar a acurácia da IA utilizada. Inicialmente:

olist_customers_dataset.csv
olist_geolocation_dataset.csv
olist_order_items_dataset.csv
olist_order_payments_dataset.csv
olist_order_reviews_dataset.csv
olist_orders_dataset.csv
olist_products_dataset.csv
olist_sellers_dataset.csv
product_category_name_translation.csv

Filtragem e Normalização

Após o merge de todas as tabelas do dataset, os atributos menos relevantes para a variável decision_score foram removidos para facilitar o aprendizado do modelo e tornar a tabela mais limpa. O uso de variáveis sem correlação com nota dos clientes pode distorcer a saída do algoritmo.

Aprendizado

Após todo processo de análise dos dados, o dataset foi seperado em duas partes:

30 % para teste do modelo (validação)
70 % para treino do modelo

Bibliotecas dos modelos e funções/métricas

Scikit learn: https://scikit-learn.org/stable/

Teste

As funções e métricas utilizadas, bem como a conclusão do estudo está no final do código.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
LICENSE		LICENSE
README.md		README.md
decision_score.ipynb		decision_score.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MarketPlace Decision Score

Desenvolvimento

Inteligência Artificial

Link Colab Original

Especificações do modelo

Árvore de Decisão

Análise de Dados

Tabelas

Filtragem e Normalização

Aprendizado

Bibliotecas dos modelos e funções/métricas

Teste

About

Releases

Packages

Languages

License

joseaugustovital/Decision-Score-MarketPlace

Folders and files

Latest commit

History

Repository files navigation

MarketPlace Decision Score

Desenvolvimento

Inteligência Artificial

Link Colab Original

Especificações do modelo

Árvore de Decisão

Análise de Dados

Tabelas

Filtragem e Normalização

Aprendizado

Bibliotecas dos modelos e funções/métricas

Teste

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages