Anselmo Xavier

Engenheiro de Dados

Transformando Dados em Insights Valiosos

Especializado em Apache Airflow, dbt, PySpark e construção de pipelines ETL escaláveis

Ver Projetos Download CV

0

Anos de Experiência

0

Projetos de Dados

0

Tecnologias Dominadas

👋 Sobre Mim

Sou Anselmo Xavier, profissional em transição de carreira com forte interesse em Engenharia de Dados. Após anos trabalhando como Analista Desenvolvedor de ERP, decidi focar em soluções baseadas em dados, motivado pelo impacto que análises bem estruturadas podem gerar.

Tenho estudado e colocado em prática ferramentas como Apache Airflow, dbt, PostgreSQL, PySpark e Databricks. Por meio de projetos próprios, venho aprendendo sobre ingestão, transformação de dados e construção de dashboards que geram valor.

Meu objetivo é seguir aprendendo e contribuindo com times de dados, construindo pipelines organizados, eficientes e sustentáveis. Valorizo boas práticas, documentação e clareza nos processos.

💼 Experiência

Analista de Desenvolvimento

2010 - Atual

CSTecnologia

Modelagem e implantação de bancos de dados relacionais
Desenvolvimento de sistemas ERP utilizando low-code e SQL
Implantação de sistemas on-premise (Linux e Windows)
Instalação e configuração de Apache Tomcat, PostgreSQL e pgAdmin
Criação de relatórios com dados extraídos do banco PostgreSQL
Treinamento de usuários e Suporte técnico

🛠️ Tecnologias e Ferramentas

Linguagens

Python

SQL

Bancos de Dados

PostgreSQL

MongoDB

Big Data / Pipelines

Apache Airflow

Apache Spark

Databricks

dbt

DuckDB

BigQuery

Cloud

AWS (intermediário)

Azure (básico)

GCP (básico)

Visualização de Dados

Power BI

Looker Studio

🚀 Projetos em Destaque

🚗 Pipeline Concessionária

ETL completo com Airflow e dbt para análise de vendas, com visualização em Power BI.

Airflow dbt PostgreSQL Power BI

Ver detalhes →

📊 Previsão do Tempo

Automatização com Airflow para extrair dados de previsão do tempo e gerar relatórios semanais.

Airflow Python API Data Lake

Ver detalhes →

🧊 Data Lake com Spark

Pipeline em PySpark com arquitetura medallion (Bronze, Silver, Gold) e particionamento otimizado.

PySpark Data Lake Parquet Medallion

Ver detalhes →