Lakehouse
- Jaime Franco Jimenez

- 26 jun 2023
- 4 Min. de lectura
Lakehouse es un lugar donde podemos almacenar información, como tablas de datos, datos estructurados, y, no estructurados, archivos, imágenes.
Veamos un ejemplo, vamos a crear una nueva área de trabajo, para ello, hacemos clic en el siguiente icono:

Se abre la ventana áreas de trabajo, seleccionamos nueva área de trabajo en la parte inferior de la ventana.
Le damos un nombre, y, una descripción si queremos.

Hacemos clic en avanzado, y, elegimos el tipo de licencia, en mi caso es de prueba.

Bajamos un poco, en formato de almacenamiento predeterminado, dejamos marcado formato de almacenamiento en conjunto de datos de tamaño pequeño.

Hacemos clic en aplicar.
Se abre nuestra área de trabajo.
Hacemos clic en el icono de Power Bi, y, seleccionamos ingeniería de datos (Data Engineering).

Seleccionamos Lakehouse.

Damos un nombre y hacemos clic en crear.

Llegamos al panel de exploración, en la ventana central vemos diferentes opciones para la obtención de datos.

En la parte izquierda, vemos tablas y archivos, si desplegamos, en este momento, no hay nada.

En archivos (files) podemos tener imágenes, y, claro que si tablas.
Hacemos clic en nuevo flujo de datos Gen2.

Hacemos clic en importe desde Excel.

Marcamos cargar archivo.

Hacemos clic en examinar, y, seleccionamos un archivo, y, clic en siguiente, si el archivo que nos vamos a traer está en nuestro OneDrive, seleccionamos vinculo al archivo.
En la parte izquierda, vemos que tenemos una tabla llamada Ventas, y, una hoja de cálculo llamada DATOS.

Marcamos Ventas, y, vemos una vista de los datos.
Hacemos clic en crear.
Ya tenemos el modelo cargado.

En la parte derecha tenemos la misma ventana que tenemos en Power Query, donde vemos el nombre de la tabla, y, los pasos aplicados.

Hacemos clic en publicar, volvemos al área de trabajo, donde podemos ver el flujo que acabamos de crear.

Si hacemos clic en flujo de datos 1, volvemos a la tabla.
Vamos a traernos ahora un archivo CSV, para ello, estando en el are de trabajo Lakehouse, desplegamos nuevo, y, seleccionamos Lakehouse.

Le llamamos pruebas2, y, hacemos clic en crear.

En la ventana siguiente hacemos clic en nuevo flujo de datos gen2.
Hacemos clic en importe desde un archivo de texto o CSV.

Marcamos cargar archivo, hacemos clic en examinar, o, arrastramos el archivo.


Clic en siguiente.
Vemos una vista previa de los datos.

Hacemos clic en crear.
Entramos en Power Query, y, vemos nuestro modelo.

Hacemos clic en publicar.
Vemos nuestros dos flujos creados.

En estos ejemplos hemos creado una nueva área de trabajo, pero realmente no hace, por ejemplo, ahora estoy en el área de trabajo mi área de trabajo.

Hacemos clic en icono ingeniería de datos, y, seleccionamos ingeniería de datos.

Y accedemos a la pantalla donde al inicio.

Vamos a hacer clic de nuevo en Lakehouse, le vamos a llamar pruebas3, y, hacemos clic en crear.

En la ventana del explorador, vemos igual que antes, tablas y archivos.

Si pasamos el ratón por filas, vemos que aparece a la derecha tres puntitos, pues, vamos hacia ellos, y, vemos que tenemos diferentes opciones.

Vamos a desplegar cargar, y, seleccionamos cargar archivos.

Hacemos clic en el siguiente icono de la ventana que se abre a la derecha.

Seleccionamos un archivo, vemos que podemos sobrescribir en caso de que el archivo exista, hacemos clic en cargar.

Una vez cargado, cerramos la ventana haciendo clic en la “X” en la parte superior derecha.

Si seleccionamos filas, veremos en la parte central nuestro archivo.

Vemos que también tenemos esos tres puntitos, donde podemos cambiar el nombre, eliminar el archivo, o, ver sus propiedades.

He vuelto mi área de trabajo, podemos ver el nombre pruebas que aparece tres veces con un icono diferente a la izquierda, el primer icono hace referencia a que es un conjunto de datos.

El segundo icono es el punto de conexión de SQL.

Y el tercer icono es el Lakehouse.

Pues vamos a hacer clic en pruebas de Lakehouse.
Vemos la tabla ventas.

En la parte superior derecha, desplegamos Lakehouse, y, seleccionamos punto de conexión de SQL.

Vemos en la ventana de explorador diferentes opciones, y, en el centro los datos.

Vamos a realizar una consulta SQL, para ello, hacemos clic en nueva consulta de SQL.

Vemos el editor para introducir funciones.

En la línea 1, ponemos la palabra SELECT, seguido de un asterisco, este asterisco quiere decir todos los encabezados, ponemos la palabra FROM y el nombre de la tabla.

Hacemos clic en Run.
Vemos la tabla ventas.

Si queremos ver una columna, sustituimos el asterisco por el nombre del encabezado.

Si queremos ver más de un encabezado, ponemos coma, y, el nombre del siguiente encabezado.

Si queremos la tabla filtrada por una condición, por ejemplo, idcanal igual a 2, volvemos a poner el asterisco, después del nombre de la tabla ponemos la palabra WHERE ponemos idcanal y lo igualamos a 2.

De esta manera, estamos realizando una consulta a través de SQL.
Si no queremos escribir código, hacemos clic en nueva consulta visual.

Debemos de arrastrar la tabla con la que vamos a trabajar, pues, desde la ventana del explorador arrastramos la tabla ventas.
En la parte superior, vemos la siguiente ventana que es igual que pasos aplicados en Power Query, cada paso que demos se ira añadiendo a dicha ventana.

En la parte inferior, vemos la tabla.

Solo debemos de filtrar la columna Idcanal por el id 2, y, tendremos los mismos resultados.
En la ventana de explorador, vemos que tenemos pruebas y queries.

Si desplegamos queries, veremos todas las consultas que hemos realizado.

Si hacemos clic en una de ellas, accederemos a dicha Query.
Cuando queramos podemos volver al modo Lakehouse.

Voy a acceder a mi workspace, es donde tenemos todos nuestros archivos, y, hago clic en el Lakehouse pruebas.
Desde esta ventana podemos crear un informe en Power BI, para ello, hacemos clic en nuevo conjunto de datos de Power BI.

En la ventana que se abre seleccionamos la tabla ventas.

Clic en confirmar.
En la parte derecha, vemos nuestra tabla con sus campos.

Podemos crear relaciones, pero en este caso, solo tenemos una tabla.
También, podemos crear medidas, un informe, editar tablas.

Vamos a hacer clic en nuevo informe, y, vemos que se abre una versión de Power BI, donde podemos crear nuestro informe.
Mas adelante, veremos mas ejemplos, esto es solo conocer la herramienta.
Miguel Angel Franco




Comentarios