Vix Blog
No Result
View All Result
  • Economia
  • Educação
  • Segurança
  • Mundo
  • Negócios
  • Notícias
  • Tecnologia
  • DMCA
NEWSLETTER
  • Economia
  • Educação
  • Segurança
  • Mundo
  • Negócios
  • Notícias
  • Tecnologia
  • DMCA
No Result
View All Result
Vix Blog
No Result
View All Result
Home Segurança

Porquê preencher dados ausentes usando pandas Python

Carolina por Carolina
27 de março de 2022
Tempo de leitura:6min de leitura
0
Porquê preencher dados ausentes usando pandas Python

A limpeza de dados, sem incerteza, leva muito tempo na ciência de dados, e a falta de dados é um dos desafios que você enfrentará com frequência. pandas é uma valiosa instrumento de manipulação de dados Python que ajuda a emendar valores ausentes em seu conjunto de dados, entre outras coisas.

Você pode emendar dados ausentes descartando ou preenchendo-os com outros valores. Neste item, explicaremos e exploraremos as diferentes maneiras de preencher dados ausentes usando pandas.

1. Use o método fillna():

O preencher() A função itera em seu conjunto de dados e preenche todas as linhas nulas com um valor especificado. Ele aceita alguns argumentos opcionais – tome nota dos seguintes:

Valor: leste é o valor que você deseja inserir nas linhas ausentes.

Método: permite que você preencha os valores ausentes para frente ou para trás. Ele aceita um ‘bencher’ ou ‘preencher’ parâmetro.

No lugar: aceita uma instrução condicional. Se True, modifica o DataFrame permanentemente. Caso contrário, não.

Antes de começarmos, certifique-se de instalar pandas em seu envolvente virtual Python usando pip no seu terminal:

pip install pandas

Em seguida, dentro do script Python, criaremos um DataFrame de prática e inseriremos valores nulos (Nan) em algumas linhas:

import pandas
df = pandas.DataFrame({'A' :[0, 3, None, 10, 3, None],
'B' : [None, None, 7.13, 13.82, 7, 7],
'C' : [None, "Pandas", None, "Pandas", "Python", "JavaScript"]})

MAKEUSEO VÍDEO DO DIA

Relacionado:Porquê importar dados do Excel para scripts Python usando Pandas

Agora, confira porquê você pode preencher esses valores ausentes usando os vários métodos disponíveis em pandas.

Preencher valores ausentes com média, mediana ou voga

Nascente método envolve a substituição de valores omissos por médias computadas. O preenchimento de dados ausentes com um valor médio ou mediano é aplicável quando as colunas envolvidas têm tipos de dados inteiros ou flutuantes.

Você também pode preencher os dados ausentes com o valor da voga, que é o valor mais frequente. Isso também se aplica a inteiros ou floats. Mas é mais prático quando as colunas em questão contêm strings.

Veja porquê inserir a média e a mediana nas linhas ausentes no DataFrame que você criou anteriormente:

#To insert the mean value of each column into its missing rows: 
df.fillna(df.mean().round(1), inplace=True)
#For median:
df.fillna(df.median().round(1), inplace=True)
print(df)

Inserir o valor modal porquê você fez para a média e a mediana supra não tomada o DataFrame inteiro. Mas você pode inseri-lo em uma pilar específica, digamos, pilar C:

df['C'].fillna(df['C'].mode()[0], inplace=True)

Com isso dito, ainda é provável inserir o valor modal de cada pilar em suas linhas ausentes de uma só vez usando um loop for:

for i in df.columns:
df[i].fillna(df[i].mode()[0], inplace=True)
print(df)

Se você quiser ser específico da pilar ao inserir a média, mediana ou voga:

df.fillna({"A":df['A'].mean(), 
"B": df['B'].median(),
"C": df['C'].mode()[0]},
inplace=True)
print(df)

Preencha linhas nulas com valores usando ffill

Isso envolve especificar o método de preenchimento dentro porquê o preencher() função. Nascente método preenche cada risca ausente com o valor da risca mais próxima supra dela.

Você também pode chamá-lo de preenchimento antecipado:

df.fillna(method='ffill', inplace=True)

Preencher linhas ausentes com valores usando bfill

Cá, você substituirá o preencher método mencionado supra com encher. Ele preenche cada risca ausente no DataFrame com o valor mais próximo inferior dele.

Nascente é chamado de preenchimento para trás:

df.fillna(method='bfill', inplace=True)

2. O método replace()

Você pode substituir o Nan valores em uma pilar específica com a média, mediana, voga ou qualquer outro valor.

Relacionado:Comandos pandas para manipular DataFrames

Veja porquê isso funciona substituindo as linhas nulas em uma pilar nomeada por sua média, mediana ou modo:

import pandas
import numpy #this requires that you've previously installed numpy
#Replace the null values with the mean:
df['A'].replace([numpy.nan], df[A].mean(), inplace=True)
#Replace column A with the median:
df['B'].replace([numpy.nan], df[B].median(), inplace=True)
#Use the modal value for column C:
df['C'].replace([numpy.nan], df['C'].mode()[0], inplace=True)
print(df)

3. Preencha os dados ausentes com interpolar()

O interpolar() A função usa valores existentes no DataFrame para prezar as linhas ausentes.

Execute o seguinte código para ver porquê isso funciona:

#Interpolate backwardly across the column:
df.interpolate(method ='linear', limit_direction ='backward', inplace=True)
#Interpolate in forward order across the column:
df.interpolate(method ='linear', limit_direction ='forward', inplace=True)

RELATED POSTS

7 maneiras de emendar a instrumento Windows Miracast quando ela funciona mal

Porquê enganar aplicativos para pensar que seu Android não está enraizado

Uma vez que usar gestos do mouse no Vivaldi para velejar mais rápido

Lide com as linhas ausentes com zelo

Embora tenhamos considerado exclusivamente preencher dados ausentes com valores padrão, porquê médias, voga e outros métodos, existem outras técnicas para emendar valores ausentes. Os cientistas de dados, por exemplo, às vezes removem essas linhas ausentes, dependendo do caso.

Outrossim, é importante pensar criticamente sobre sua estratégia antes de usá-la. Caso contrário, você pode obter análises indesejáveis ​​ou resultados de previsão. Algumas estratégias iniciais de visualização de dados podem ajudar.


imagem do gráfico
Porquê traçar gráficos no Jupyter Notebook

Exiba seus dados com gráficos do Jupyter Notebook.

Leia a seguir


Sobre o responsável

Idowu Omisola
(125 Artigos Publicados)

Idowu é enamorado por qualquer tecnologia inteligente e produtividade. Em seu tempo livre, ele brinca com a codificação e muda para o tabuleiro de xadrez quando está entediado, mas também adora romper com a rotina de vez em quando. Sua paixão por mostrar às pessoas o caminho da tecnologia moderna o motiva a grafar mais.

Mais de Idowu Omisola

Assine a nossa newsletter

Junte-se à nossa newsletter para dicas de tecnologia, análises, e-books gratuitos e ofertas exclusivas!

Clique cá para assinar

Novidades no seu e-mail!

Não enviamos spam! Leia mais em nossa Política de privacidade

Verifique sua caixa de entrada ou a pasta de spam para confirmar sua assinatura.

ShareTweetPin
Carolina

Carolina

Relacionado Posts

Segurança

7 maneiras de emendar a instrumento Windows Miracast quando ela funciona mal

24 de março de 2022
Porquê enganar aplicativos para pensar que seu Android não está enraizado
Segurança

Porquê enganar aplicativos para pensar que seu Android não está enraizado

24 de março de 2022
Porquê usar guias no Vivaldi para organizar sua navegação
Segurança

Uma vez que usar gestos do mouse no Vivaldi para velejar mais rápido

24 de março de 2022
Uma vez que trabalhar em mansão sem experiência
Segurança

Uma vez que trabalhar em mansão sem experiência

24 de março de 2022
O que é hash e porquê funciona?
Segurança

O que é hash e porquê funciona?

24 de março de 2022
Porquê emendar o erro “Vídeo indisponível” no Apple TV +
Segurança

Uma vez que ativar e personalizar legendas no Apple TV+

24 de março de 2022
Next Post
Os prós e contras de usar a informação somente texto no sítio de trabalho virtual

Os prós e contras de usar a informação somente texto no sítio de trabalho virtual

As 14 melhores ferramentas de colaboração sem letreiro que você pode usar em 10 segundos

As 14 melhores ferramentas de colaboração sem letreiro que você pode usar em 10 segundos

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

No Result
View All Result

Últimas Notícias

7 maneiras de emendar a instrumento Windows Miracast quando ela funciona mal

24 de março de 2022
Porquê enganar aplicativos para pensar que seu Android não está enraizado

Porquê enganar aplicativos para pensar que seu Android não está enraizado

24 de março de 2022
Uma vez que parar de compartilhar recibos de leitura no iMessage

Uma vez que parar de compartilhar recibos de leitura no iMessage

24 de março de 2022
Porquê usar guias no Vivaldi para organizar sua navegação

Uma vez que usar gestos do mouse no Vivaldi para velejar mais rápido

24 de março de 2022
Uma vez que trabalhar em mansão sem experiência

Uma vez que trabalhar em mansão sem experiência

24 de março de 2022

Novidades no seu e-mail!

Não enviamos spam! Leia mais em nossa Política de privacidade

Verifique sua caixa de entrada ou a pasta de spam para confirmar sua assinatura.

Categorias

  • Entretenimento
  • Mundo
  • Segurança
Vix Blog

Somos entusiastas da tecnologia com a missão de ensinar ao mundo como usar e compreender a tecnologia em suas vidas.
SAIBA MAIS »

Entre em contato conosco enviando um e-mail para [email protected]

Posts recentes

  • 7 maneiras de emendar a instrumento Windows Miracast quando ela funciona mal
  • Porquê enganar aplicativos para pensar que seu Android não está enraizado
  • Uma vez que parar de compartilhar recibos de leitura no iMessage

Categorias

  • Entretenimento
  • Mundo
  • Segurança

Links Importantes

  • Quem Somos
  • Blog
  • Fale Conosco
  • Política de Privacidade
  • DMCA

© 2021 VixBlog - Notícias e dicas para o seu dia dia.

No Result
View All Result
  • Economia
  • Educação
  • Segurança
  • Mundo
  • Negócios
  • Notícias
  • Tecnologia
  • DMCA

© 2021 VixBlog - Notícias e dicas para o seu dia dia.