Vix Blog
No Result
View All Result
Social icon element need JNews Essential plugin to be activated.
  • Economia
  • Educação
  • Segurança
  • Mundo
  • Negócios
  • Notícias
  • Tecnologia
  • DMCA
NEWSLETTER
  • Economia
  • Educação
  • Segurança
  • Mundo
  • Negócios
  • Notícias
  • Tecnologia
  • DMCA
No Result
View All Result
Vix Blog
No Result
View All Result

Como explorar conjuntos de dados em Go

Carolina by Carolina
6 de julho de 2022
Reading Time: 10 mins read
0
Como explorar conjuntos de dados em Go

Para analisar um conjunto de dados, primeiro você precisa entender os dados. Às vezes, você pode não ter conhecimento prévio de um conjunto de dados, impedindo que você aproveite ao máximo. Como analista de dados, você pode usar a análise exploratória de dados (EDA) para obter conhecimento de seu conjunto de dados antes de uma análise aprofundada.

A análise exploratória de dados (EDA) investiga um conjunto de dados para obter insights significativos. O processo de execução da EDA envolve a consulta de informações sobre a estrutura e o conteúdo de um conjunto de dados.

MAKEUSEO VÍDEO DO DIA

Instalando o Pacote Gota

O pacote Gota é o mais popular para análise de dados em Go; é como o pacote Python Pandas, mas para Go. O pacote Gota contém muitos métodos para analisar conjuntos de dados e ler os formatos JSON, CSV e HTML.

Execute este comando em seu terminal no diretório onde você inicializou um arquivo de módulo Go:

go get -u github.com/go-gota/gota

O comando instalará o Gota no diretório local, pronto para você importar o pacote para usá-lo.

Assim como o Pandas, o Gota suporta operações de séries e dataframes. Existem dois subpacotes no pacote Gota: a série e o pacote dataframe. Você pode importar um ou ambos, dependendo de suas necessidades.


import (
"github.com/go-gota/gota/series"
"github.com/go-gota/gota/dataframe"
)

Lendo um conjunto de dados usando o pacote Gota

Você pode usar qualquer arquivo CSV que desejar, mas os exemplos a seguir mostram resultados de um conjunto de dados do Kaggle, contendo dados de preços de laptops.

Gota permite ler formatos de arquivo CSV, JSON e HTML para criar dataframes usando o Ler CSV, ReadJSONe LeiaHTML métodos. Veja como você carrega um arquivo CSV em um objeto dataframe:

file, err := os.Open("/path/to/csv-file.csv")

if err != nil {
fmt.Println("file open error")
}

dataFrame := dataframe.ReadCSV(file)
fmt.Println(dataFrame)

Você pode usar o Abrir método do SO pacote para abrir um arquivo CSV. O método ReadCSV lê o objeto de arquivo e retorna um objeto de dataframe.

Quando você imprime este objeto, a saída está em um formato tabular. Você pode manipular ainda mais o objeto dataframe usando os vários métodos que o Gota fornece.


Um DataFrame mostrando 10 linhas e colunas, incluindo 'marca' e 'modelo'

O objeto imprimirá apenas algumas das colunas se um conjunto de dados tiver mais de um valor definido.

Buscando a dimensão do conjunto de dados

As dimensões de um dataframe são o número de linhas e colunas que ele contém. Você pode buscar essas dimensões usando o Escurece método do objeto dataframe.

var rows, columns = dataFrame.Dims()

Substitua uma das variáveis ​​por um sublinhado para buscar apenas a outra dimensão. Você também pode consultar o número de linhas e colunas individualmente, usando o Novo e Ncol métodos.

var rows = dataFrame.Nrow()
var columns = dataFrame.Ncol()

Buscando os tipos de dados das colunas

Você precisará conhecer os tipos de dados compostos nas colunas de um conjunto de dados para analisá-lo. Você pode buscá-los usando o Tipos método do seu objeto de dataframe:

var types = dataFrame.Types()
fmt.Println(types)

O método Types retorna uma fatia contendo os tipos de dados da coluna:

Uma fatia de Golang contendo tipos como string, int e float

Buscando os nomes das colunas

Você precisará dos nomes das colunas para selecionar colunas específicas para operações. Você pode usar o Nomes método para buscá-los.

var columnNames := dataFrame.Names()
fmt.Println(columnNames)
Uma fatia de Golang contendo nomes de coluna como 'marca' e 'modelo'

O método Names retorna uma fatia dos nomes das colunas.

Verificando valores ausentes

Você pode ter um conjunto de dados que contém valores nulos ou não numéricos. Você pode verificar esses valores usando o HasNaN e IsNaN métodos de um objeto de série:

aCol := dataFrame.Col("display_size")
var hasNull = aCol.HasNaN()
var isNotNumber = aCol.IsNaN()

HasNan verifica se uma coluna contém elementos nulos. IsNaN retorna uma fatia de booleanos representando se cada valor na coluna é um número.

Realização de Análise Estatística Descritiva

A análise estatística descritiva ajuda você a entender a distribuição de colunas numéricas. Usando o Descrever método, você pode gerar uma análise estatística descritiva do seu conjunto de dados:

description := dataFrame.Describe()
fmt.Println(description)

O método Describe retorna métricas como média, desvio padrão e valores máximos de colunas em um conjunto de dados. Ele os resume em um formato tabular.

Estatísticas para colunas em um Gota DataFrame, incluindo média e stddev

Você também pode ser específico e se concentrar em colunas e métricas selecionando uma coluna específica e consultando a métrica desejada. Você deve primeiro buscar a série que representa uma coluna específica e, em seguida, usar seus métodos da seguinte forma:

aCol := dataFrame.Col("display_size")
var mean = aCol.Mean()
var median = aCol.Median()
var minimum = aCol.Min()
var standardDeviation = aCol.StdDev()
var maximum = aCol.Max()
var quantiles25 = aCol.Quantile(25.0)

Esses métodos espelham os resultados da análise estatística descritiva que o Descrever realiza.

Buscando os elementos em uma coluna

Uma das tarefas finais que você deseja realizar é verificar os valores em uma coluna para obter uma visão geral. Você pode usar o Registros método para visualizar os valores de uma coluna.

aCol := dataFrame.Col("brand")
fmt.Println(aCol.Records())

Este método retorna uma fatia de strings contendo os valores em sua coluna selecionada:

Uma fatia de Golang contendo valores como 'Lenovo' e 'DELL'

Exportando um Gota Dataframe para um Arquivo

Se você optar por ir mais longe e usar o pacote Gota para análise completa de dados, precisará salvar os dados em arquivos. Você pode usar o Escrever CSV e WriteJSON métodos de dataframe para exportar arquivos. Os métodos recebem um arquivo que você criará usando o SO pacote Crio método.

Veja como você pode exportar um dataframe usando o pacote Gota.

dataFrame := dataframe.ReadCSV(file)
outputFile, err := os.Create("output.csv")

if err != nil {
log.Fatal(err)
}

err = dataFrame.WriteCSV(outputFile)

if err != nil {
log.Fatalln("There was an error writing the dataframe contents to the file")
}

RELATED POSTS

Porquê desativar a risca de contatos sugeridos na planilha de compartilhamento do seu iPhone

O que é o LockBit 3.0 Ransomware e o que você pode fazer sobre isso?

5 tecnologias para ajudá-lo a gerenciar o TDAH

o quadro de dados variável é uma representação do dataframe. Quando você usa o Crio método do SO pacote, ele cria um novo arquivo vazio com o nome especificado e retorna o arquivo. O método WriteCSV recebe a instância do arquivo e retorna um erro ou nada se não houver erro.

A análise exploratória de dados é importante

Uma compreensão de dados e conjuntos de dados é essencial para analistas de dados e especialistas em aprendizado de máquina. É uma operação crítica em seu ciclo de trabalho, e a análise exploratória de dados é uma das técnicas que eles usam para conseguir isso.

Há mais no pacote Gota. Você pode usá-lo para várias funções de manipulação de dados da mesma forma que usaria a biblioteca Python Pandas para análise de dados. No entanto, o Gota não suporta tanta funcionalidade quanto o Pandas.

Carolina

Carolina

Next Post
Como corrigir um mouse que clica duas vezes em um único clique no Windows

Como corrigir um mouse que clica duas vezes em um único clique no Windows

Como habilitar o desbloqueio automático para unidades BitLocker

Como habilitar o desbloqueio automático para unidades BitLocker

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

No Result
View All Result

Categorias

  • Entretenimento
  • Mundo
  • Notícias
  • Segurança

Posts recentes

  • Porquê desativar a risca de contatos sugeridos na planilha de compartilhamento do seu iPhone
  • 6 maneiras de mourejar com o estresse usando a tecnologia
  • Obtenha a chave vitalícia do Windows 10 Pro OEM por US $ 14

Categorias

  • Entretenimento
  • Mundo
  • Notícias
  • Segurança

Links Importantes

  • Quem Somos
  • Blog
  • Fale Conosco
  • Política de Privacidade
  • DMCA
Social icon element need JNews Essential plugin to be activated.

© 2021 VixBlog - Notícias e dicas para o seu dia dia.

No Result
View All Result
  • Economia
  • Educação
  • Segurança
  • Mundo
  • Negócios
  • Notícias
  • Tecnologia
  • DMCA

© 2021 VixBlog - Notícias e dicas para o seu dia dia.