Descripción del video
En esta ocasión quiero platicar acerca de un tema que me mencionaron en el grupo de SerDataPro de Facebook, donde Tavo me dijo que si podíamos ver la actualización incremental.
Verás, normalmente cuando actualizas tus datos en Power BI, lo que se hace es borrar el set de datos que ya estaba en sistema y luego se vuelve a cargar por completo, tomando en cuenta los nuevos datos. Esto no es lo ideal cuando estás manejando un set de datos muy grande, por ejemplo cuando tienes datos de varios años. Esto no tiene sentido porque la gran mayoría de esta información no va a cambiar. Solamente se están agregando nuevos campos con cada día que pasa, y en otros casos, se actualiza información hasta cierto momento.
Aquí es donde entra la actualización incremental. Esta configuración te permite actualizar únicamente los cambios más recientes, sin tener que volver a cargar los datos históricos. Esto te permite que:
– La actualización sea más rápida. Solamente se actualiza la información que ha cambiado o la más reciente.
– Las actualizaciones son más seguras, ya que no es necesario mantener una conexión constante prolongada al actualizar la información.
– Se reduce la utilización de recursos al actualizar.
Antes de continuar, asegúrate de suscribirte al canal y de dejarme un comentario para saber qué más quieres aprender. También es importante que te quedes hasta el final porque vamos a poner esto a prueba y vamos a ver las consideraciones que debes de tener en cuenta al momento de utilizar la actualización incremental.
Bueno vamos a empezar. La actualización incremental se configura en Power BI Desktop, pero se utiliza en Power BI Service. Y justo vamos a ver el proceso completo aquí, además de que vamos a verificar que la actualización incremental se está cumpliendo.
Aquí tengo conectado un archivo de Excel a Power BI, es un archivo normal con muy pocas filas. Este archivo únicamente lo estoy usando para demostrar el proceso y poder hacer la demostración de lo que la actualización incremental hacer.
Si quiero por ejemplo, agregar la actualización incremental aquí en esta tabla, vas a ver cómo me va a decir que tenemos que establecer unos parámetros. Estos parámetros los configuramos en el Query Editor.
Entramos y hacemos clic en Manage Parameters. Estos parámetros tienen nombres reservados, lo que significa que se tienen que llamar exactamente como los estoy escribiendo aquí. El de la fecha de inicio se llama RangeStart. El de la fecha de fin se llama RangeEnd. Estos parámetros tienen que ser de tipo Date/Time, y les tienes que poner una fecha inicial. Realmente no importa qué valor le pongas, Power BI los va a sobreescribir en la primera actualización de datos, ya vas a ver más adelante.
Una vez que están definidos los parámetros, tienes que filtrar tu tabla con ellos utilizando una columna tipo Date/Time también. Voy a filtrar la tabla de Ventas con la columna de Fecha. Aquí agrego un filtro de fecha, custom. Y pongo que mis filtros sean “Después o igual a” RangeStart y “Antes de” RangeEnd. Aquí tienes que asegurarte que solamente uno de esos diga “igual a” porque si no se puede duplicar la información.
Aplicamos los cambios. Ahora en Power BI Desktop ya vamos a poder agregar la actualización incremental en la tabla. Hago clic derecho en la tabla que quiero actualizar de esta manera y selecciono Incremental Refresh. Se va a abrir una ventana.
En esta ventana lo primero que vamos a ver es un mensaje de advertencia que nos está diciendo que no se pudo corroborar que la fuente permite que se apliquen los pasos del lado del servidor, lo cual se conoce como Query Folding. Hagamos clic en “Learn More” para entender a qué se refiere esto. Básicamente es un proceso donde los pasos de la consulta se aplican del lado del servidor, en lugar de en Power BI.
Es importante porque si no se permite el Query Folding, la actualización incremental no nos va a servir de mucho, porque de todas maneras va a tener que obtener todos los datos y luego va a tener que aplicar los filtros pero una vez que ya se han obtenido todos.
La gran mayoría de los administradores de bases de datos permiten esta manera de trabajar, lo cual te puede dar tranquilidad. Pero sí hay maneras de revisar si tu fuente de datos lo permite, si te interesa que haga un video acerca de eso, déjamelo saber en los comentarios.
Lo otro que tenemos que tomar en cuenta es que no vas a poder descargar el archivo una vez que publique este archivo en Power BI Service. Esto se debe a que la actualización incremental está diseñada para trabajar con fuentes de datos muy grandes, por lo que sería complicado trabajar con un archivo con esta información en Power BI Desktop. Por eso es importante que guardes una copia en tu computadora.
Bien, entonces vamos a configurar la actualización incremental. Primero tenemos que establecer cuánta información histórica queremos almacenar. Esto es importante porque es la información que se va a obtener en la primera actualización, además de que todo lo que sea más viejo que esto, Power BI lo va a ir quitando de nuestro conjunto de datos.
Luego tenemos que ponerle cuanta información queremos actualizar. Esto es lo que va a correr en cada actualización.
Después podemos establecer la columna con la que podemos establecer que únicamente se actualicen aquellas filas que han cambiado, pero eso lo vamos a probar más adelante. Por lo pronto lo dejamos así. Lo guardamos, lo publicamos en Power BI Service. Ahora me paso a Power BI Service e intentamos actualizar esto. Nos va a dar error porque tengo que configurar los permisos. Los configuro y ahora sí me va a permitir actualizar los datos.
Ahora, en esta primera actualización me cargó todos los datos. Pero ahora, si hago dos cambios en mi tabla de Excel. Uno con unos días antes y otro en años atrás y actualizo en Power BI Service, verás que únicamente me va a actualizar la información del último el día, porque la que está antes de eso ni la revisó.
Si ahora hago lo mismo en Power BI Desktop, verás que aquí sí actualizó ambas filas, porque esta manera de hacer la actualización incremental no funciona en la versión de escritorio de Power BI.
Otra cosa, si aquí tuviera configurada la columna de última actualización de la fila, esta fila también me la actualizaría. Pero esa columna la tienes que tener configurada en tu administrador de base de datos.
Esta configuración tiene su mayor beneficio cuando estamos trabajando con sets de datos muy grandes, por lo que este ejemplo no nos permite realmente evaluar los beneficios que se obtienen al trabajar con esta manera. Para ver qué tan eficiente es esto, puedes hacer pruebas de actualización para ver si la actualización se está haciendo más rápidamente.
Ya te fui mencionando las consideraciones, pero te lo quiero volver a mencionar:
– Esta funcionalidad no está disponible con una licencia gratis de Power BI, únicamente con licencias PRO y Premium.
– Lo que ya te mencionaba del Query Folding, que si te estás conectando . Hay maneras en las que puedes revisar si tu fuente permite el Query Folding. Si quieres saber cómo, déjame un comentario para saber que estás interesado.
Eso es todo en esta ocasión. Puedes seguir aprendiendo Power BI, solamente ve uno de estos videos que aparecen en seguida de mí y aprenderás algo nuevo aquí mismo. También suscríbete y déjame un comentario porque me gusta escuchar de ti. Nos vemos la próxima ocasión, hasta luego.