Sobre mim

Meu nome é Christiano Peres

Sou Cientista de Dados que trabalha atualmente com IA Generativa na extração de dados não estruturados e com chatbots.

Sou formado em Engenharia Ambiental e sou pesquisador bolsista de doutorado.

Também trabalho no meu projeto de doutorado, criando um modelo preditivo de machine learning para captura de CO2 atmosférico em fontes de biomassas e trabalho em projetos pessoais sobre Ciência de Dados, para adquirir experiência na solução de problemas de negócio e domínio sobre as ferramentas de análise de dados.

Estou buscando aprimoramento profissional para alavancar minha carreira e implementar o data driven nas empresas.

Habilidades

Habilidades de Programação

  • Python com foco em análise de dados
  • Pensamento Estratégico
  • Conceitos de ETL
  • SQL Language
  • Git
  • Terminal

Estatística e Machine Learning

  • Algoritmos de regressão, classificação e clusterização.
  • Métricas de Performance ( RMSE, MSE, MAE, MAPE, Confusion Matrix, Precision, Recall, ROC Curve, Silhouette Score e R2 )
  • Pacotes de Machine Learning: Sklearn e XGboost.

Redes Neurais e Deep Learning Learning

  • LlamaIndex
  • LLM
  • Engenharia de Prompt
  • RAG

Visualização de dados

  • Plotly.
  • Seaborn.
  • Streamlit.

Engenharia de software

  • Github.
  • Streamlit Cloud.
  • SQLite3 Database.
  • AWS Cloud
  • Docker File
  • API
  • Linux.
  • Pyenv e Conda Env.

Experiências profissionais

Cientista de Dados com experiência de mercado (Recente)

Desenvolvimento de soluções para problemas de negócio utilizando IA Generativa e ferramentas como Redes Neurais, LLM e RAG.

Desenvolvimento de soluções de IA para extração de dados não estruturados.

Desenvolvimento de soluções de IA para criação de chatbots para serviço de atendimento ao cliente.

Coletar, processar e limpar dados para treinamento e uso de modelos..

Realizar experimentos para avaliar a performance dos modelos.

4 Projetos completos de Ciência de Dados

1 protótipo de projeto de classificação de produtos com Gen IA.

1 projeto de previsão de vendas, onde foi construído um modelo de machine learning para previsão de vendas das 6 últimas semanas de uma rede de farmácias na Europa.

1 projeto de ensaio de machine learning, onde foram testados diversos algoritmos de machine learning com o intuito de observar as condições de overffiting e Underfitting, utilizando a biblioteca sckit-learn.

1 projeto em construção de soluções de dados para problemas de negócio, próximos aos desafios reais das empresas, utilizando dados públicos de competições de Ciência de Dados, onde abordei o problema desde a concepção do desafio de negócio até a publicação do dashboard, utilizando ferramentas de Cloud Computing.

4+ Anos como pesquisador bolsista

Estudo a captura de CO2 em resíduos de biomassas para promover processos ambientais amigáveis.

Publicação de 7 artigos científicos em periódicos internacionais, incluindo um artigo na área de machine learning.

2+ Anos como monitor/ajudante na pós graduação

Ajuda na criação de gráficos com matplotlib, auxílio em python e monitorias para tirar dúvidas dos alunos de pós graduação do meu orientador. Bolsista de iniciação científica.

Projetos em Ciência de Dados

Desenvolvimento de um Painel Gerencial para Marketplace de Entregas com o Streamlit.

Nesse projeto, os conceitos de Programação em Python, manipulação de dados, pensamento estratégico e lógica de negócio, junto com ferramentas de desenvolvimento web como o Streamlit e ferramentas como o Github, foram usados para desenvolver um painel gerencial com as principais métricas de uma empresa marketplace de delivery de comida.

O resultado final do projeto foi um painel hospedado em um ambiente Cloud e disponibilizado através de um link web. O painel pode ser acessado por qualquer dispositivo conectado na internet.

Ferramentas utilizadas:

  • Python.
  • VS Code.
  • Terminal.
  • Streamlit e Streamlit Cloud

Ensaio de Machine Learning.

Nesse projeto, foram explorados os principais conceitos do treinamento, ajuste de parâmetros e limiares entre overfitting e underfitting de vários algoritmos de Machine Learning dentro das tarefas de classificação, regressão e agrupamento, através de um ensaio de Machine Learning.

O resultado final do projeto foi um painel mostrando a performance desses algoritmos de Machine Learning, a partir da variações dos valores dos principais parâmetros de cada algoritmo, que controlam o estado de overfitting e underfitting.

Ferramentas utilizadas:

  • Bibliotecas utilizadas: Python 3.10 e Scikit-learn.
  • Algoritmos de classificação: KNN, Decision Tree, Random Forest e Logistic Regression.
  • Algoritmos de regressão: Linear Regression, Decision TreeRegressor, Random Forest Regressor, Polinomial Regression, Linear Regression Lasso, Linear Regression Ridge, Linear Regression Elastic Net, Polinomial Regression Lasso, Polinomial Regression Ridge e Polinomial Regression Elastic Net.
  • Algoritmos de agrupamento: K-Means e Affinity Propagation.
  • Métricas de performance: Accuracy, Precision, Recall, F1-Score, R2, MSE, RMSE, MAE, MAPE, e Silhouette Score.

Previsão de vendas.

Projeto end-to-end para previsão de vendas das 6 últimas semanas da rede de farmácias Rossmann, para isso, foi contruído um modelo de Machine Learning (XGBoost) para realizar a predição.

O algoritmo de Regressão treinado possui um erro de 12% e o resultado estimado da solução é de $ 290 milhões de faturamento.

O resultado final do projeto foi a criação de um bot no telegram (rossmannproject_bot) para consultar o faturamento de cada loja desejada .

Ferramentas utilizadas:

  • Principais Bibliotecas utilizadas: Python 3.10.13, Numpy, XGBoost, Scikit-learn, Seaborn, Flask .
  • Algoritmos de regressão: Linear Regression, Ridge Linear Regression, Random Forest Regressor, XGBoost.
  • Métricas de performance: RMSE, MAE e MAPE.

Protótipo de Classificação de Produtos com IA.

Desenvolvimento de um protótipo de modelo com IA para classificar produtos da Amazon usando Large Language Model (LLM).

O modelo foi treinado utilizando um conjunto de dados público e emprega a técnica de ”few-shot prompting” para categorizar novos produtos.

Chegou-se a uma acurácia de 90% para esse protótipo.

Ferramentas utilizadas:

  • Principais Bibliotecas utilizadas: Python 3.10.13, OpenIA, numpy, pandas .
  • Modelo de LLM utilizado: ChatGPT-4o.
  • Métricas de performance: Similaridade semântica e acucária.

Papers produzidos

Desenvolvimento de um modelo simples de machine learning para captura de CO2

Carbon adsorption on waste biomass of passion fruit peel: A promising machine learning model for CO2 capture

Entre em contato

Sinta-se à vontade para entrar em contato: