Tutorial básico Julia Python
ubuntu2004
FÍSICA EXPERIMENTAL - 2021-2 - PARTE III
Carga Horária: 4h
Prof João Marcello Pereira ([email protected])
Data frame
Um DataFrame
é uma estrutura bidimensional semelhante à uma matriz no qual os dados são tabelados em colunas nomeadas no qual possuem a mesma quantidade de linhas. JOSHI (2016) define data frame como:
É uma estrutura de dados que tem colunas rotuladas, que individualmente podem ter diferentes tipos de dados. Como uma tabela SQL ou uma planilha, ela tem duas dimensões. Também pode ser pensado como uma lista de dicionários, mas, fundamentalmente, é diferente.
É uma ótima forma de organizar informações pois além de manter uma boa formatação dos dados, ainda permite que sejam gravados em arquivos do tipo "CSV", "XLSX", "ODS" entre outros, que podem ser abertos e manipulados em softwares de planilha tipo excel ou calc. Exemplo de DataFrame
:
Sintaxe:
Exemplo 1: Criar do seguinte Dataframe:
Tempo (s) | Velocidae (m/s) |
0 | 0.0 |
1 | 0.5 |
2 | 1.0 |
3 | 1.5 |
4 | 2.0 |
Visualizar Dados em um DataFrame
Imprimir nome das colunas:
Imprimir dados de toda a coluna:
Imprimir dado de uma coluna:
Total de dados de um DataFrame:
Numero de elementos de um DataFrame:
Imprimir todos os dados de uma linha:
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
<ipython-input-2-94eeb269a080> in <module>()
1 # ver o conteúdo da linha de índice 2 até o fim
2
----> 3 dataframe1.loc[Integer(2):]
NameError: name 'dataframe1' is not defined
Alterar Dados em um DataFrame
Editar dados em uma DataFrame
Para editar um dado em um dataframe:
Exemplo 1: Alterar o valor da velocidade da linha de índice 2 para 55.0
Filtro de dados
É muito importante filtrar os dados de um dataframe de tal forma que seja exibido somente aqueles que estejam de acordo com determinadas especificações. Imagine selecionar somente os dados de velocidade de um carro de tal forma que somente velocidades acima de 5m/s sejam exibidas, é assim que a função query()
(significa consulta) trabalha. Se a condição é satisfeita, as linhas de dados contendo as informações são exibidas.
Função
query()
ARQUIVOS CSV
A melhor forma de trabalhar com dataframes é salva-los no formato "CSV". Comma-separated values (ou CSV) é um formato de arquivo que armazena dados tabelados, cujo grande uso data da época dos mainframes. Por serem bastante simples, os arquivos '.csv' são comuns em todas as plataformas de computador.
O CSV é um implementação particular de arquivos de texto separados por um delimitador, que usa a vírgula e a quebra de linha para separar os valores. O formato também usa as aspas em campos no qual são usados os caracteres reservados (vírgula e quebra de linha). Essa robustez no formato torna o CSV mais amplo que outros formatos digitais do mesmo segmento (WIKIPEDIA, 2020).
Forma geral de um arquivo CSV na forma de texto:
Uma forma prática de criar arquivos CSV é usando uma planilha (excel, calc-libreoffice/openoffice). Basta preencher os dados nas celulas e depois salvar como CSV.
Importar um Arquivo CSV
index_col = 0
, corresponde a primeira coluna
Salvar dados em um Arquivo CSV
Sintaxe para salvar:
,tempo,velocidade
0,0,0
1,1,0.500000000000000
2,2,55.0
3,3,1.50000000000000
4,4,2.00000000000000
Manipular Colunas, Linhas, Dados e Concatenar Dataframes
Para adicionar uma nova coluna de dados ao DataFrame
Para deletar uma coluna
Para deletar uma coluna
Para deletar mais de uma coluna
Para alterar nome de uma coluna
Exemplo 1: Alterar o nome da coluna 'tempo' para 'tempo_s', sendo o 's' de segundo.
Para concatenar Dataframes
Exemplo 1: Criar um novo dataframe chamado 'Posição' contendo novos dados da posição do carro, importar o dataframe 'dataframe1.csv' com o nome de 'dataF1' e anexar (concatenação horizontal) o dataframe 'Posição' ao dataframe 'dataF1'.
Exemplo 2: Criar um novo dataframe chamado 'dataF1_1' contendo novas linhas de dados da posição e velocidade do carro, e anexá-lo (concatenação vertical) ao dataframe 'dataF1'.
Adicionar Linhas
A maneira mais prática de adicionar linhas em um DataFrame no Sage é através do comando loc
. Sintaxe:
Para inserir mais de uma linha a soluão é concatenar na horizontal
Para deletar linhas e linhas com dados repetidos
Para ordenar os elementos de um Dataframe
Ordenar por índice
Ordenar por valor