📍 1. O que são
📍 2. Performance
Critério | Pandas | Polars |
---|---|---|
Velocidade | Média | Alta (até 10-100x mais rápido) |
Uso de memória | Maior | Menor (otimização interna) |
Processamento paralelo | Não (apenas em casos limitados) | Sim, nativo |
Tamanho de datasets | Bom até alguns GBs | Muito melhor para grandes datasets |
📖 Explicação:
📍 3. Sintaxe
A sintaxe é parecida, mas Polars exige que você escolha modo Lazy ou Eager:
import pandas as pd
df = pd.read_csv("dados.csv")
df = df[df["idade"] > 30]
import polars as pl
df = pl.read_csv("dados.csv")
df = df.filter(pl.col("idade") > 30)
df = pl.scan_csv("dados.csv").filter(pl.col("idade") > 30)
df.collect() # Executa aqui
📖 Diferença-chave:
O Lazy Mode do Polars permite criar consultas que só são executadas no final, otimizando automaticamente.
📍 4. Carregamento de dados