Importar y exportar datos
Crear DataFrames
en Pandas a partir de diferentes tipos de entradas de datos es sencillo y flexible. A continuación, se explican diversas formas de crear DataFrames
, así como métodos para exportarlos a diferentes formatos de archivo.
Creación de DataFrames
1. A partir de un diccionario
Una de las formas más comunes de crear un DataFrame
es a partir de un diccionario de listas o arrays. Cada clave del diccionario representa el nombre de la columna y su valor correspondiente es la lista de datos de esa columna.
import pandas as pd
# Creando un DataFrame a partir de un diccionario
data = {
'Nombre': ['Alice', 'Bob', 'Charlie'],
'Edad': [24, 27, 22],
'Salario': [50000, 60000, 55000]
}
df_dict = pd.DataFrame(data)
print(df_dict)
Output:
Nombre Edad Salario
0 Alice 24 50000
1 Bob 27 60000
2 Charlie 22 55000
2. A partir de listas de listas (o tuplas)
Puedes crear un DataFrame
a partir de una lista de listas o tuplas. En este caso, puedes especificar los nombres de las columnas al momento de crear el DataFrame
.
# Creando un DataFrame a partir de listas de listas
data = [
['Alice', 24, 50000],
['Bob', 27, 60000],
['Charlie', 22, 55000]
]
df_list = pd.DataFrame(data, columns=['Nombre', 'Edad', 'Salario'])
print(df_list)
Output:
Nombre Edad Salario
0 Alice 24 50000
1 Bob 27 60000
2 Charlie 22 55000
3. A partir de un archivo CSV
Pandas permite importar datos desde archivos CSV fácilmente utilizando el método read_csv()
. Esto es útil para trabajar con grandes conjuntos de datos que ya están almacenados en archivos.
# Supongamos que tienes un archivo 'datos.csv' con el siguiente contenido:
# Nombre,Edad,Salario
# Alice,24,50000
# Bob,27,60000
# Charlie,22,55000
df_csv = pd.read_csv('datos.csv')
print(df_csv)
4. A partir de un archivo Excel
Pandas también puede leer datos desde archivos Excel usando el método read_excel()
.
# Asegúrate de tener 'openpyxl' o 'xlrd' instalado para poder leer archivos Excel
df_excel = pd.read_excel('datos.xlsx')
print(df_excel)
Exportación de DataFrames
Una vez que hayas creado un DataFrame
y realizado cualquier manipulación de datos, es posible que desees exportarlo a diferentes formatos de archivo. A continuación, se describen algunos métodos para exportar DataFrames
.
1. Exportar a CSV
Para exportar un DataFrame
a un archivo CSV, puedes usar el método to_csv()
. Puedes especificar el nombre del archivo y otros parámetros opcionales.
# Exportar a un archivo CSV
df_dict.to_csv('datos_exportados.csv', index=False) # index=False para no incluir el índice
2. Exportar a Excel
Para exportar un DataFrame
a un archivo Excel, utiliza el método to_excel()
. Similarmente, necesitarás tener openpyxl
instalado para exportar a Excel.
# Exportar a un archivo Excel
df_dict.to_excel('datos_exportados.xlsx', index=False)
3. Exportar a formato JSON
Pandas permite exportar datos a formato JSON utilizando el método to_json()
.
# Exportar a un archivo JSON
df_dict.to_json('datos_exportados.json', orient='records')
4. Exportar a formato HTML
Si deseas exportar un DataFrame
a un archivo HTML, puedes usar el método to_html()
.
# Exportar a un archivo HTML
df_dict.to_html('datos_exportados.html', index=False)
Resumen
Pandas proporciona una forma flexible y eficiente de crear DataFrames
a partir de diversas fuentes de datos, como diccionarios, listas, archivos CSV y Excel. Además, ofrece múltiples opciones para exportar estos DataFrames
a varios formatos, facilitando el trabajo con datos en distintos entornos. Esto hace de Pandas una herramienta muy poderosa para la manipulación y el análisis de datos.