Vistas En El Paso De Datos De SAS

★★★★★Valoración: 4.58 (7276 votos)

En el vasto mundo de la gestión de datos, a menudo necesitamos acceder a información de manera flexible y eficiente sin necesariamente almacenar versiones duplicadas o intermedias de los datos. Aquí es donde entran en juego las vistas. Aunque el concepto de vista existe en muchos sistemas de bases de datos, su implementación y funcionalidad pueden variar significativamente. En el entorno de SAS, existe un tipo particular y muy potente: la vista del Paso de Datos.

Crear Vistas (View) en SQL Server | Como crear una vista (View) en SQL Server Management Studio

Una Vista en el contexto más general de bases de datos se define a menudo como una tabla virtual. A diferencia de una tabla tradicional que almacena datos directamente, una vista no guarda sus propios datos (a menos que sea una vista indizada o materializada en algunos sistemas). En cambio, su contenido se define mediante una consulta (típicamente una sentencia `SELECT`). Cuando accedes a una vista, el sistema ejecuta la consulta subyacente en tiempo real y te presenta el resultado como si fuera una tabla.

¿Qué es una vista de base de datos? — Una vista de base de datos es un subconjunto de una base de datos y se basa en una consulta que se ejecuta en una o más tablas de base de datos. Las vistas de base de datos se guardan en la base de datos como consultas con nombre y se pueden utilizar para guardar consultas completas que se utilizan con frecuencia.

Las vistas generales ofrecen múltiples beneficios, como simplificar consultas complejas al encapsularlas, mejorar la seguridad al restringir el acceso directo a las tablas subyacentes y mostrar solo columnas o filas específicas, o proporcionar compatibilidad con versiones anteriores de esquemas de datos. En sistemas como SQL Server, existen incluso tipos especializados como las vistas indizadas (que sí almacenan datos para mejorar el rendimiento de agregaciones) o las vistas con particiones (que combinan datos de múltiples tablas o servidores).

Índice de Contenido

Vistas en el Paso de Datos (SAS)
Preguntas Frecuentes sobre Vistas del Paso de Datos
Conclusión

Vistas en el Paso de Datos (SAS)

Dentro del entorno SAS, la vista del Paso de Datos es un tipo de vista nativa con un alcance excepcionalmente amplio. Lo que la distingue es que contiene programas completos del Paso de Datos de SAS almacenados. Esto le permite leer datos de una gran variedad de fuentes, que incluyen:

Archivos de datos planos (raw data files).
Archivos de datos SAS (.sas7bdat, por ejemplo).
Vistas creadas con PROC SQL.
Vistas creadas con SAS/ACCESS.
Datos directamente de sistemas de gestión de bases de datos externos como DB2, ORACLE, etc.

Su capacidad para integrar la lógica del Paso de Datos le confiere una flexibilidad superior para manipular y gestionar los datos de entrada.

Creación de Vistas en el Paso de Datos

Crear una vista del Paso de Datos es un proceso directo dentro de SAS. Se realiza especificando la opción `VIEW=` después del nombre del conjunto de datos en la sentencia `DATA`. La opción `VIEW=` le indica a SAS que compile el programa fuente del Paso de Datos, pero *no* que lo ejecute inmediatamente. En su lugar, el código compilado se almacena en la vista de entrada nombrada en la opción.

La sintaxis básica es la siguiente:

DATA nombre-vista <nombre-conjunto-salida-1> ... / VIEW=nombre-vista <opciones-vista>;
 ... sentencias del Paso de Datos ...
RUN;

Donde:

`nombre-vista`: Es el nombre de la vista que se está creando.
`nombre-conjunto-salida`: Especifica un nombre válido para un posible conjunto de datos de salida que el programa fuente podría crear. Puedes especificar múltiples nombres de conjuntos de datos.
`opciones-vista`: Pueden incluir opciones como `PASSWORD=` para asignar una contraseña o `SOURCE=` para controlar si el código fuente se guarda o encripta.

Es importante saber que si una vista con el mismo nombre ya existe en la librería SAS, será sobrescrita por la nueva definición.

Por ejemplo, para crear una vista simple:

LIBNAME mi_libreria 'ruta/a/tu/libreria/SAS';
DATA mi_libreria.mi_vista / VIEW=mi_libreria.mi_vista;
 SET mi_libreria.datos_origen;
 nueva_columna = columna_existente * 2;
RUN;

Este código compila el Paso de Datos que lee `datos_origen`, crea una `nueva_columna` y almacena esta lógica en `mi_libreria.mi_vista`. La lógica se ejecutará solo cuando `mi_libreria.mi_vista` sea referenciada en otro Paso de Datos o un PROC.

Capacidades y Uso

Gracias a que están generadas por el Paso de Datos, las vistas de este tipo tienen un alcance mucho más amplio que otras vistas de datos SAS. Puedes:

Procesar directamente cualquier archivo que pueda ser leído con una sentencia `INPUT`.
Leer otros conjuntos de datos SAS (usando `SET`, `MERGE`, `UPDATE`, `MODIFY`).
Generar datos completamente nuevos sin necesidad de fuentes de datos externas ni archivos intermedios.

Básicamente, cualquier lógica que puedas implementar en un Paso de Datos regular para leer y transformar datos, puedes almacenarla en una vista del Paso de Datos para su ejecución dinámica.

Diferencias con Programas Compilados Almacenados

Es crucial distinguir las vistas del Paso de Datos de los programas compilados almacenados (creados con la opción `PGM=` en la sentencia `DATA`). Aunque ambos almacenan código compilado del Paso de Datos, su propósito y ejecución difieren:

Característica	Vista del Paso de Datos	Programa Compilado Almacenado
Ejecución	Implícita (cuando se referencia como entrada)	Explícita (usando la opción PGM=)
Propósito Principal	Proporcionar datos (generalmente una observación a la vez) a otro paso o PROC	Realizar una tarea específica (crear archivos, generar reportes, etc.)
Referencia	Como un conjunto de datos de entrada (`DATA ...; SET vista; RUN;` o `PROC PRINT DATA=vista; RUN;`)	Mediante la opción PGM= (`DATA ... PGM=programa_almacenado; RUN;`)

La vista está diseñada para ser la fuente de datos para otro proceso, actuando como una capa virtual sobre los datos origen.

Restricciones Importantes: Las Sentencias Globales

Una limitación crítica de las vistas del Paso de Datos es que las sentencias globales de SAS *no* aplican dentro de su definición. Sentencias como `LIBNAME`, `FILENAME`, `OPTIONS`, `TITLE` o `FOOTNOTE`, aunque las incluyas en el código fuente que defines para la vista, no tendrán efecto cuando la vista se ejecute. SAS almacena la vista, pero ignora estas sentencias globales dentro de la definición. Para que una vista pueda acceder a librerías o archivos externos, las sentencias `LIBNAME` o `FILENAME` correspondientes deben estar activas en la sesión SAS *antes* de que la vista sea referenciada.

Consideraciones de Rendimiento

Dado que el código del Paso de Datos asociado a una vista se ejecuta cada vez que se utiliza la vista, esto puede añadir una sobrecarga significativa al sistema, especialmente si la lógica es compleja o si la vista se accede múltiples veces. Además, debido a esta ejecución dinámica, existe el riesgo de que los datos de origen cambien entre diferentes usos de la vista, lo que podría llevar a resultados inconsistentes si no se gestiona adecuadamente.

El rendimiento también depende de cuántas "pasadas" sobre los datos requiera la lógica de la vista. Si la vista solo necesita una pasada, el rendimiento puede ser bueno, ya que no se crea un archivo intermedio. Sin embargo, si la lógica requiere múltiples pasadas sobre los datos (lo cual es menos común en vistas simples pero posible con lógica compleja), la vista puede necesitar construir un archivo temporal ("spill file") para almacenar las observaciones generadas, lo que incrementa la sobrecarga.

Ejemplos Prácticos

Veamos algunos ejemplos basados en la información proporcionada para ilustrar la creación y uso de vistas del Paso de Datos.

Ejemplo 1: Combinando Datos

Supongamos que queremos combinar datos de ventas de dos archivos SAS diferentes, pero no necesitamos crear un archivo SAS permanente con el resultado combinado. Podemos usar una vista:

LIBNAME misdatos 'ruta/a/mis/datos';
/* Definir la vista que combina datos */
DATA misdatos.ventas_totales / VIEW=misdatos.ventas_totales;
 MERGE misdatos.ventas_ropa misdatos.ventas_equipos;
 BY fecha;
 total = ventas_ropa + ventas_equipos; /* Suponiendo que las columnas se llaman asi */
RUN;

/* Usar la vista en un PROC PRINT */
PROC PRINT DATA=misdatos.ventas_totales;
RUN;

Cuando `PROC PRINT` se ejecuta, invoca la vista `misdatos.ventas_totales`. La vista, a su vez, ejecuta su Paso de Datos interno, combina los datos de `ventas_ropa` y `ventas_equipos`, calcula el total y entrega las observaciones a `PROC PRINT` una a una. No se crea un nuevo archivo físico `misdatos.ventas_totales`.

Ejemplo 2: Procesando un Archivo Externo y Filtrando

Este ejemplo muestra cómo leer un archivo de texto plano (`STUDENT`), identificar observaciones con errores y enviarlas a un archivo SAS permanente (`PROBLEMS`), mientras que las observaciones "limpias" se exponen a través de una vista (`CLASS`).

/* --- NOTA IMPORTANTE: FILENAME y LIBNAME DEBEN ESTAR FUERA DE LA VISTA --- */
FILENAME student 'ruta/al/archivo/STUDENT.txt';
LIBNAME mi_libreria 'ruta/a/tu/libreria';

/* Definir la vista y el archivo de problemas */
DATA mi_libreria.class(KEEP=name major credits) /* Esto es la vista */
 mi_libreria.problems(KEEP=code date); /* Esto es un archivo SAS normal */
 VIEW=mi_libreria.class; /* SOLO aplica a la vista, no al archivo PROBLEMS */

 INFILE student;
 INPUT name $ 1-10 major $ 12-14 credits 16-18;

 SELECT;
 WHEN (name=' ' OR major=' ' OR credits=.) DO;
 code=01; date=datetime();
 OUTPUT mi_libreria.problems; /* Escribe al archivo SAS */
 END;
 WHEN (0 < credits < 90) DO;
 code=02; date=datetime();
 OUTPUT mi_libreria.problems; /* Escribe al archivo SAS */
 END;
 OTHERWISE OUTPUT mi_libreria.class; /* Escribe a la vista */
 END;
RUN;

/* Usar la vista y el archivo */
PROC PRINT DATA=mi_libreria.class; /* Ejecuta la lógica de la vista dinámicamente */
RUN;

PROC PRINT DATA=mi_libreria.problems; /* Lee el archivo SAS permanente creado */
 FORMAT date datetime18.;
RUN;

En este ejemplo, cuando se ejecuta el primer `PROC PRINT`, la vista `mi_libreria.class` lee el archivo `student`, aplica la lógica de filtrado y entrega solo las observaciones que cumplen la condición `OTHERWISE`. Si el contenido del archivo `student` cambia, la próxima vez que se use la vista `mi_libreria.class`, reflejará los cambios inmediatamente.

Por otro lado, el archivo `mi_libreria.problems` se crea *una vez* cuando se ejecuta el Paso de Datos que define la vista. Si el archivo `student` cambia después de esa ejecución, esos cambios *no* se verán reflejados en `mi_libreria.problems` hasta que se vuelva a ejecutar el Paso de Datos completo.

Esta es la diferencia clave: una vista es dinámica y siempre refleja el estado actual de sus fuentes de datos subyacentes (siempre que las sentencias globales necesarias estén activas), mientras que un archivo SAS permanente es estático una vez creado y solo cambia si se le escriben datos explícitamente.

¿Qué es la vista de una hoja de datos? — Una vista hoja de datos web en una aplicación de Access muestra los datos en línea organizados en filas y columnas en un explorador web. Puede permitir o no editar datos, como prefiera.

Recuperación del Código Fuente

En versiones recientes de SAS (a partir de la Versión 8), las vistas del Paso de Datos retienen las sentencias de código fuente utilizadas para crearlas. Puedes recuperar este código usando la sentencia `DESCRIBE` dentro de un Paso de Datos que referencia la vista:

DATA _NULL_; /* O cualquier otro DATA step */
 SET nombre-vista; /* O simplemente referenciarla */
 DESCRIBE nombre-vista; /* Especifica la vista a describir */
 STOP; /* O RUN; */
RUN;

Esto escribirá el código fuente de la vista en el log de SAS, lo cual es muy útil para documentación o depuración.

Preguntas Frecuentes sobre Vistas del Paso de Datos

Aquí respondemos algunas dudas comunes:

¿Una vista del Paso de Datos almacena los datos físicamente?
Generalmente no. Una vista del Paso de Datos almacena el código compilado del Paso de Datos que define cómo acceder y manipular los datos. Los datos se obtienen dinámicamente de las fuentes de origen cada vez que se utiliza la vista. La única excepción es si la lógica requiere múltiples pasadas, en cuyo caso podría crear un archivo temporal (spill file) internamente.

¿Puedo incluir sentencias LIBNAME o FILENAME dentro del código fuente de una vista DATA Step?
No. Las sentencias globales como `LIBNAME`, `FILENAME`, `OPTIONS`, `TITLE`, etc., *no* son almacenadas ni ejecutadas como parte de la definición de la vista. Deben estar definidas y activas en la sesión SAS *antes* de que la vista sea referenciada para que pueda acceder a las fuentes de datos externas o librerías.

¿Una vista del Paso de Datos se actualiza automáticamente si cambian los datos origen?
Sí, de forma dinámica. Cada vez que accedes a una vista del Paso de Datos, el código almacenado se ejecuta sobre las fuentes de datos actuales. Si las fuentes de datos han cambiado desde la última vez que usaste la vista, los resultados reflejarán esos cambios.

¿Cuál es la diferencia principal entre una vista del Paso de Datos y un programa compilado almacenado?
La diferencia fundamental radica en su propósito y ejecución. Una vista del Paso de Datos está diseñada principalmente para actuar como una fuente de datos dinámica, ejecutándose implícitamente cuando otro paso o PROC la lee. Un programa compilado almacenado se ejecuta explícitamente (usando `PGM=`) y está diseñado para realizar tareas específicas, como crear archivos permanentes o generar reportes.

¿Por qué una vista del Paso de Datos puede tener sobrecarga de rendimiento?
La sobrecarga ocurre porque el código del Paso de Datos se ejecuta cada vez que se accede a la vista. Si la lógica es compleja, si la vista se lee repetidamente, o si requiere múltiples pasadas sobre los datos de origen (necesitando archivos temporales), el costo de procesamiento puede ser significativo en comparación con leer un archivo SAS permanente precalculado.

Conclusión

Las vistas del Paso de Datos en SAS son una herramienta poderosa para la manipulación y el acceso dinámico a datos provenientes de una amplia gama de fuentes. Permiten encapsular lógica compleja de Paso de Datos y presentar el resultado como una tabla virtual, simplificando así el acceso para análisis o reportes posteriores. Aunque tienen consideraciones importantes respecto a las sentencias globales y el rendimiento, su flexibilidad para integrar cualquier lógica del Paso de Datos las convierte en un componente valioso en el arsenal de cualquier usuario avanzado de SAS que necesite trabajar con datos de forma dinámica y eficiente.

Si quieres conocer otros artículos parecidos a Vistas en el Paso de Datos de SAS puedes visitar la categoría Bases de datos.

Ivan

Soy un entusiasta de la tecnología con especialización en bases de datos, particularmente en MySQL. A través de mis tutoriales detallados, busco desmitificar los conceptos complejos y proporcionar soluciones prácticas a los desafíos cotidianos relacionados con la gestión de datos

Aprende mas sobre MySQL