π· O que Γ© o Polars?
O Polars Γ© uma biblioteca de DataFrames (tabelas de dados) escrita em Rust (uma linguagem de programaΓ§Γ£o altamente performΓ‘tica), mas com APIs para Python. Ele Γ© projetado para ser extremamente rΓ‘pido e escalΓ‘vel, especialmente em conjuntos de dados grandes.
π Enquanto o Pandas Γ© mais tradicional e amplamente utilizado, o Polars estΓ‘ se popularizando por sua velocidade e baixa utilizaΓ§Γ£o de memΓ³ria.
β Por que usar o Polars?
| CritΓ©rio | Pandas | Polars |
|---|---|---|
| Performance | Boa para dados pequenos | Excelente, mesmo com muitos GB |
| Paralelismo | NΓ£o | Sim, executa em mΓΊltiplos nΓΊcleos |
| Imutabilidade | MutΓ‘vel | ImutΓ‘vel (mais seguro e previsΓvel) |
| API Lazy (preguiΓ§osa) | NΓ£o | Sim (ideal para pipelines de dados grandes) |
| Linguagem base | Python (C internamente) | Rust (muito mais performΓ‘tico) |
π οΈ Como instalar o Polars
pip install polars
πΉ 1. Criando um DataFrame
import polars as pl
df = pl.DataFrame({
"nome": ["Ana", "Bruno", "Carlos"],
"idade": [23, 35, 31],
"cidade": ["SP", "RJ", "BH"]
})
print(df)
π€ SaΓda:
shape: (3, 3)
βββββββββ¬ββββββββ¬βββββββββ
β nome β idade β cidade β
β --- β --- β --- β
β str β i64 β str β
βββββββββΌββββββββΌβββββββββ€
β Ana β 23 β SP β
β Bruno β 35 β RJ β
β Carlosβ 31 β BH β
βββββββββ΄ββββββββ΄βββββββββ
πΉ 2. Selecionando colunas
df.select("nome")
df.select(["nome", "idade"])
πΉ 3. Filtrando linhas
df.filter(pl.col("idade") > 30)
π€ Resultado:
ββββββββββ¬ββββββββ¬βββββββββ
β nome β idade β cidade β
ββββββββββΌββββββββΌβββββββββ€
β Bruno β 35 β RJ β
β Carlos β 31 β BH β
ββββββββββ΄ββββββββ΄βββββββββ