⚖️ Comparativo Pandas vs Polars

📍 1. O que são

📍 2. Performance

Critério Pandas Polars
Velocidade Média Alta (até 10-100x mais rápido)
Uso de memória Maior Menor (otimização interna)
Processamento paralelo Não (apenas em casos limitados) Sim, nativo
Tamanho de datasets Bom até alguns GBs Muito melhor para grandes datasets

📖 Explicação:

📍 3. Sintaxe

A sintaxe é parecida, mas Polars exige que você escolha modo Lazy ou Eager:

import pandas as pd

df = pd.read_csv("dados.csv")
df = df[df["idade"] > 30]
import polars as pl

df = pl.read_csv("dados.csv")
df = df.filter(pl.col("idade") > 30)
df = pl.scan_csv("dados.csv").filter(pl.col("idade") > 30)
df.collect()  # Executa aqui

📖 Diferença-chave:

O Lazy Mode do Polars permite criar consultas que só são executadas no final, otimizando automaticamente.

📍 4. Carregamento de dados