π· O que Γ© o Polars?
O Polars Γ© uma biblioteca de DataFrames (tabelas de dados) escrita em Rust (uma linguagem de programaΓ§Γ£o altamente performΓ‘tica), mas com APIs para Python. Ele Γ© projetado para ser extremamente rΓ‘pido e escalΓ‘vel, especialmente em conjuntos de dados grandes.
π Enquanto o Pandas Γ© mais tradicional e amplamente utilizado, o Polars estΓ‘ se popularizando por sua velocidade e baixa utilizaΓ§Γ£o de memΓ³ria.
β Por que usar o Polars?
CritΓ©rio | Pandas | Polars |
---|---|---|
Performance | Boa para dados pequenos | Excelente, mesmo com muitos GB |
Paralelismo | NΓ£o | Sim, executa em mΓΊltiplos nΓΊcleos |
Imutabilidade | MutΓ‘vel | ImutΓ‘vel (mais seguro e previsΓvel) |
API Lazy (preguiΓ§osa) | NΓ£o | Sim (ideal para pipelines de dados grandes) |
Linguagem base | Python (C internamente) | Rust (muito mais performΓ‘tico) |
π οΈ Como instalar o Polars
pip install polars
πΉ 1. Criando um DataFrame
import polars as pl
df = pl.DataFrame({
"nome": ["Ana", "Bruno", "Carlos"],
"idade": [23, 35, 31],
"cidade": ["SP", "RJ", "BH"]
})
print(df)
π€ SaΓda:
shape: (3, 3)
βββββββββ¬ββββββββ¬βββββββββ
β nome β idade β cidade β
β --- β --- β --- β
β str β i64 β str β
βββββββββΌββββββββΌβββββββββ€
β Ana β 23 β SP β
β Bruno β 35 β RJ β
β Carlosβ 31 β BH β
βββββββββ΄ββββββββ΄βββββββββ
πΉ 2. Selecionando colunas
df.select("nome")
df.select(["nome", "idade"])
πΉ 3. Filtrando linhas
df.filter(pl.col("idade") > 30)
π€ Resultado:
ββββββββββ¬ββββββββ¬βββββββββ
β nome β idade β cidade β
ββββββββββΌββββββββΌβββββββββ€
β Bruno β 35 β RJ β
β Carlos β 31 β BH β
ββββββββββ΄ββββββββ΄βββββββββ