πŸ”· O que Γ© o Polars?

O Polars Γ© uma biblioteca de DataFrames (tabelas de dados) escrita em Rust (uma linguagem de programaΓ§Γ£o altamente performΓ‘tica), mas com APIs para Python. Ele Γ© projetado para ser extremamente rΓ‘pido e escalΓ‘vel, especialmente em conjuntos de dados grandes.

πŸ“Œ Enquanto o Pandas Γ© mais tradicional e amplamente utilizado, o Polars estΓ‘ se popularizando por sua velocidade e baixa utilizaΓ§Γ£o de memΓ³ria.

βœ… Por que usar o Polars?

CritΓ©rio Pandas Polars
Performance Boa para dados pequenos Excelente, mesmo com muitos GB
Paralelismo NΓ£o Sim, executa em mΓΊltiplos nΓΊcleos
Imutabilidade MutΓ‘vel ImutΓ‘vel (mais seguro e previsΓ­vel)
API Lazy (preguiΓ§osa) NΓ£o Sim (ideal para pipelines de dados grandes)
Linguagem base Python (C internamente) Rust (muito mais performΓ‘tico)

πŸ› οΈ Como instalar o Polars


pip install polars

πŸ“Œ Principais Conceitos do Polars

πŸ”Ή 1. Criando um DataFrame

import polars as pl

df = pl.DataFrame({
    "nome": ["Ana", "Bruno", "Carlos"],
    "idade": [23, 35, 31],
    "cidade": ["SP", "RJ", "BH"]
})
print(df)

πŸ“€ SaΓ­da:

shape: (3, 3)
β”Œβ”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚ nome  ┆ idade ┆ cidade β”‚
β”‚ ---   ┆ ---   ┆ ---    β”‚
β”‚ str   ┆ i64   ┆ str    β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚ Ana   ┆ 23    ┆ SP     β”‚
β”‚ Bruno ┆ 35    ┆ RJ     β”‚
β”‚ Carlos┆ 31    ┆ BH     β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”€β”˜

πŸ”Ή 2. Selecionando colunas

df.select("nome")
df.select(["nome", "idade"])

πŸ”Ή 3. Filtrando linhas

df.filter(pl.col("idade") > 30)

πŸ“€ Resultado:

β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚ nome   ┆ idade ┆ cidade β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚ Bruno  ┆ 35    ┆ RJ     β”‚
β”‚ Carlos ┆ 31    ┆ BH     β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”€β”˜