Anselmo Xavier

Engenheiro de Dados

Transformando Dados em Insights Valiosos

Especializado em Apache Airflow, dbt, PySpark e construção de pipelines ETL escaláveis

0

Anos de Experiência

0

Projetos de Dados

0

Tecnologias Dominadas

👋 Sobre Mim

Sou Anselmo Xavier, profissional em transição de carreira com forte interesse em Engenharia de Dados. Após anos trabalhando como Analista Desenvolvedor de ERP, decidi focar em soluções baseadas em dados, motivado pelo impacto que análises bem estruturadas podem gerar.

Tenho estudado e colocado em prática ferramentas como Apache Airflow, dbt, PostgreSQL, PySpark e Databricks. Por meio de projetos próprios, venho aprendendo sobre ingestão, transformação de dados e construção de dashboards que geram valor.

Meu objetivo é seguir aprendendo e contribuindo com times de dados, construindo pipelines organizados, eficientes e sustentáveis. Valorizo boas práticas, documentação e clareza nos processos.

💼 Experiência

Analista de Desenvolvimento

2010 - Atual

CSTecnologia

  • Modelagem e implantação de bancos de dados relacionais
  • Desenvolvimento de sistemas ERP utilizando low-code e SQL
  • Implantação de sistemas on-premise (Linux e Windows)
  • Instalação e configuração de Apache Tomcat, PostgreSQL e pgAdmin
  • Criação de relatórios com dados extraídos do banco PostgreSQL
  • Treinamento de usuários e Suporte técnico

🛠️ Tecnologias e Ferramentas

Linguagens

Python
SQL

Bancos de Dados

PostgreSQL
MongoDB

Big Data / Pipelines

Apache Airflow
Apache Spark
Databricks
dbt
DuckDB
BigQuery

Cloud

AWS AWS (intermediário)
Azure Azure (básico)
GCP GCP (básico)

Visualização de Dados

Power BI Power BI
Looker Studio Looker Studio

🚀 Projetos em Destaque

🚗 Pipeline Concessionária

ETL completo com Airflow e dbt para análise de vendas, com visualização em Power BI.

Airflow dbt PostgreSQL Power BI
Ver detalhes →

📊 Previsão do Tempo

Automatização com Airflow para extrair dados de previsão do tempo e gerar relatórios semanais.

Airflow Python API Data Lake
Ver detalhes →

🧊 Data Lake com Spark

Pipeline em PySpark com arquitetura medallion (Bronze, Silver, Gold) e particionamento otimizado.

PySpark Data Lake Parquet Medallion
Ver detalhes →