Tenemos en una carpeta, una serie de archivos PDF, que corresponden a las ventas de productos en una provincia, y, queremos combinar todos los archivos PDF en uno solo, en una hoja de cálculo de Excel.
Si copiamos y pegamos, seria una tarea interminable, además, de no ser nada recomendable.
En su ligar, haremos lo siguiente, abrimos una hoja de calculo en blanco, vamos a la pestaña de datos, dentro del grupo, obtener y transformar, desplegamos obtener datos, desplegamos de un archivo, y, seleccionamos de una carpeta.
Seleccionamos el directorio, donde tenemos los PDF, que se llama provincias, y, hacemos clic en abrir.
Se abre una ventana, donde podemos ver el contenido de la carpeta.
Vamos a hacer clic en transformar datos.
Se abre el editor de Power Query, donde podemos ver más información sobre cada archivo, como la extensión, la fecha de creación, la ruta, entre otros.
Aun no vemos el contenido de cada archivo PDF, para poder verlo, tengo que hacer clic en el icono combinar archivos.
Al hacer clic en dicho icono, se abre la ventana de combinar archivos, donde vemos una primera ventana, llamada archivo de ejemplo, donde nos da un archivo de ejemplo, que es el primer archivo.
Si desplegamos la ventana, veremos que el primer archivo es la provincia de Albacete.
Pero, podemos elegir otro archivo para representar el archivo de ejemplo, pero, lo dejamos como esta.
Si hacemos clic en el siguiente icono:
Veremos una vista previa de los datos a la derecha, ya sabemos que el primer icono que aparece a la izquierda del archivo, quiere decir que el modelo esta en formato de tabla, y, el segundo icono, que es un rango, voy a seleccionar el modelo de tabla, y, hago clic en aceptar.
¿Qué hemos conseguido?
Pues, hemos conseguido tener en una única consulta, todas las provincias, todo esto se hizo de manera automática.
Vemos que ha detectado, correctamente, el tipo de datos.
Podemos ver en pasos aplicados, todos los pasos que se han dado.
La primera columna es el nombre del archivo.
Pero, tenemos otra columna llamada provincias, donde tenemos las provincias, por lo que esta columna la voy a eliminar, para ello, la selecciono, clic con botón alternativo del ratón, y, selecciono quitar.
Voy a mover la columna provincia, a la primera posición.
Lo siguiente que vamos a hacer, es cargarla en la hoja de cálculo, para ello, desde la pestaña de inicio, hacemos clic en cerrar y cargar.
Tenemos el modelo cargado en Excel, en formato de tabla, con todas las provincias.
Le doy otro formato a la tabla.
¿Qué ocurre si recibimos un nuevo archivo?
Por ejemplo, hemos recibido la provincia de Badajoz.
Pues, vamos a la ultima fila, que no haría falta, pero para ver como aparece cuando actualicemos, en la ultima celda, hacemos clic con botón alternativo de ratón, y, seleccionamos actualizar, y, vemos como aparece la provincia de Badajoz.
Lo siguiente que queremos hacer, es dividir la columna fecha, en día, mes, y, año, para ello, volvemos a Power Query, seleccionamos la columna de fecha, vamos a la pestaña de inicio, dentro del grupo transformar, desplegamos dividir columna, y, seleccionamos por delimitador.
Se abre la ventana de dividir columna por delimitador, donde vemos en la ventana seleccione o escriba el delimitador, que ha detectado el delimitador, y, de forma predeterminada, en dividir en, aparece marcado cada aparición del delimitador, eso lo dejamos, y, hacemos clic en aceptar.
Cambiamos los nombres de los encabezados, y, ya la tenemos dividida la columna fecha.
Si dentro de esta carpeta, donde solo hay archivos PDF, si pegamos un archivo, que no sea PDF, obtendremos un error al actualizar, la forma de arreglarlo es eliminar el archivo, o, si no queremos eliminarlo, podemos hacer lo siguiente, estando dentro de Power Query, vamos a pasos aplicados, y, seleccionamos el primer paso, donde vemos los archivos.
Aun no veo el archivo, por lo que voy a ir a la pestaña de inicio, y, hago clic en actualizar vista previa.
Ya aparece el archivo Excel.
Vamos a desplegar el icono de filtro de la columna extensión.
Desplegamos filtros de texto, en la ventana de la derecha.
Aparece una ventana, donde nos dice que si estamos seguro de insertar un paso, hacemos clic en insertar.
Se abre la ventana de filtrar filas, en la ventana de la derecha de termina con, ponemos .pdf, es decir, que nos deje solo los archivos con extensión PDF.
Clic en aceptar, y, vemos como no aparece ya el archivo Excel.
Volvemos al ultimo paso, de pasos aplicados, y, volvemos a cerrar y cargar, vemos como ya no hay error.
Comments