top 30 sas interview questions
Lista de las preguntas más frecuentes de la entrevista SAS con respuestas:
En este artículo, analizaremos algunos de los conceptos básicos y avanzados de la programación SAS a través de las preguntas y respuestas más frecuentes de las entrevistas SAS.
El sistema de análisis estadístico, comúnmente conocido como SAS, se considera un conjunto de software múltiple que se integra y se utiliza para diversas operaciones como la gestión de datos, el análisis predictivo y descriptivo, la mejora de la calidad, el análisis empresarial, el desarrollo de aplicaciones, etc.
La gran cantidad de personalización de componentes de SAS, así como su amplio enfoque de programación, realizan en conjunto tareas de análisis de datos y transformación de datos. Puede ejecutarse en cualquier sistema operativo (Linux, Windows, etc.) ya que es independiente de la plataforma.
Preguntas y respuestas más populares de la entrevista SAS
Aquí vamos..
P # 1) Enlista las funciones que realiza SAS.
Responder: SAS (Statistical Analysis System) tiene su propia importancia en todos los dominios comerciales.
A continuación se enumeran algunas de las funciones resumidas que realiza SAS:
- Gestión de datos y gestión de proyectos
- Almacenamiento de datos
- Investigación operativa y apoyo decisional
- Recuperación de información y gestión de la calidad
- Planificación empresarial
- Análisis estadístico
P # 2) ¿Cuáles son los 3 componentes en la programación SAS?
Responder: Los 3 componentes de la programación SAS son:
- Declaraciones
- Variables
- Conjunto de datos
P # 3) Incluya las reglas de sintaxis que se siguen en las declaraciones SAS.
Responder: El programa SAS está escrito en la ventana del editor. Aquí, contiene una serie de declaraciones seguidas de la sintaxis adecuada en un orden para que el programa SAS lo entienda.
Algunas de las reglas de sintaxis que se siguen en el caso del componente Statement de SAS son las siguientes:
- El final de cualquier declaración se marca con un punto y coma (;).
- El punto y coma también se utiliza para separar varias declaraciones que aparecen en una sola línea.
- Las declaraciones SAS no distinguen entre mayúsculas y minúsculas y tienen un espacio adicional antes de que las declaraciones se eliminen automáticamente.
- Los comentarios se pueden incluir en el programa SAS para declaraciones de dos formas diferentes como:
- Una línea que comienza con un asterisco (*) y termina con un punto y coma (;).
- Una línea que comienza con una barra inclinada y un asterisco (/ *) y termina con un asterisco y una barra inclinada (* /).
P # 4) ¿Cuáles son los tipos de datos que contiene SAS?
Responder: 'Numérico' y 'Personaje' son los dos tipos de tipos de datos que contiene el programa SAS.
P # 5) ¿Qué son las PDV y sus funciones?
Responder: Program Data Vector (PDV) es un concepto lógico y se define como un área de memoria donde SAS está construyendo un conjunto de datos.
Las funciones de PDV son las siguientes:
- Se crea una base de datos que tiene una observación a la vez.
- El búfer de entrada para almacenar los datos de un archivo externo se crea en el momento de la compilación.
- PDV contiene dos variables automáticas, a saber, _N_ (muestra el recuento del paso de datos que se está ejecutando) y _ERROR_ (notifica el error que ocurre en el momento de la ejecución).
P # 6) ¿Qué sabe sobre el conjunto de datos SAS?
Responder: El conjunto de datos SAS se conoce básicamente como los datos que están disponibles para el análisis dentro de un programa SAS. El conjunto de datos SAS también se conoce como tabla de datos SAS.
La tabla de datos SAS consta de dos partes:
- Columnas de variables
- Filas de observaciones
La información útil sobre el conjunto de datos SAS se puede resumir de la siguiente manera:
- SAS Dataset puede leer tan bien como tiene fuentes de datos integradas para usar como Excel, Access, etc.
- El conjunto de datos que se utiliza solo en la ejecución de la sesión actual y se descarta una vez finalizada la sesión se conoce como conjunto de datos temporal.
- El conjunto de datos que se almacena para su uso en la sesión futura también se conoce como conjunto de datos permanente.
- Se puede acceder al conjunto de datos incorporado usando esta ruta Bibliotecas -> Mis bibliotecas-> SASHELP.
P # 7) Explique por qué se usa doble @@ en las declaraciones de entrada.
Responder: Durante la iteración del paso de datos, la inclusión de @@ al final doble en las declaraciones de entrada implica que SAS debe mantener el registro actual con el propósito de ejecutar la siguiente declaración de entrada en lugar de cambiar al nuevo registro.
P # 8) ¿Explica la diferencia entre las opciones NODUP y NODUPKEY?
Responder: Para eliminar valores duplicados de la tabla, PROC SORT se clasifica básicamente entre dos opciones:
- NODUP
- NODUPKEY
La diferencia entre estas dos opciones se puede ver a continuación:
NODUPKEY | NODUP |
---|---|
Compara solo la variable BY presente en el conjunto de datos. | Compara todas las variables presentes en el conjunto de datos. |
Elimina opciones duplicadas para los valores de la variable enumerados en la instrucción BY. | Identifica y elimina observaciones duplicadas. |
Sintaxis: PROC SORT DATA = leer NODUPKEY; POR nombre de variable; CORRER; | Sintaxis: PROC SORT DATA = leer NODUP; POR nombre de variable; CORRER; |
P # 9) ¿Qué comando se utiliza para realizar la clasificación en el programa SAS?
Responder: El comando PROC SORT se utiliza para realizar la clasificación, ya sea en una sola variable o en múltiples variables. Este comando se realiza en el conjunto de datos donde se crea el nuevo conjunto de datos como resultado de la clasificación, pero el conjunto de datos original permanece sin cambios.
Sintaxis:
|_+_| Dónde,
'Original' se refiere al conjunto de datos original
'Ordenado' se refiere al resultado como conjunto de datos ordenados
'Variable' se refiere a la columna en la que se realiza la operación de clasificación.
La clasificación se puede realizar tanto en orden ascendente como descendente.
Para que el conjunto de datos se muestre en orden descendente, la palabra clave 'Descending' se usa en la declaración BY con el nombre de la columna en la que se realizará la clasificación.
|_+_|P # 10) Explique la diferencia entre Informat y Format con un ejemplo.
Responder: La diferencia entre Informat y Format se puede explicar como:
informado | Formato |
---|---|
Indique a SAS cómo leer datos en la variable SAS. | Indique a SAS cómo mostrar valores en la variable. |
Se utilizan para leer los datos o tomar datos de entrada de archivos externos. | Estos se utilizan para escribir los datos. |
P # 11) Diferenciar INPUT e INFILE.
Responder: La inclusión de una instrucción INFILE dentro de la programación SAS identifica un archivo externo que consta de los datos, mientras que la inclusión de una instrucción INPUT en la programación SAS describe las variables utilizadas.
La sintaxis de INFILE:
|_+_|La sintaxis de INPUT:
|_+_|P # 12) ¿Explica el uso de PROC print y PROC content?
Responder: El paso PROC del programa SAS se utiliza para invocar procedimientos integrados para analizar los datos del conjunto de datos.
Impresión PROC: Asegura que los datos presentes en el conjunto de datos se lean correctamente.
Contenido de PROC: Muestra la información sobre el conjunto de datos SAS.
P # 13) ¿Explica DATA_NULL_?
Responder: Como su nombre lo define, DATA_NULL_ es un paso de datos que en realidad no crea ningún conjunto de datos.
Se utiliza para:
- Creando macro variables.
- Escribiendo la salida sin ningún conjunto de datos.
P # 14) ¿Cómo se convierte la variable de caracteres en una variable numérica y viceversa?
Responder: Bajo la programación SAS, surgen muchas tareas en las que el valor de un carácter debe convertirse en numérico y, de la misma manera, un valor numérico debe convertirse en un valor de carácter.
PONER() se utiliza para convertir numérico a carácter. En este caso, el formato de origen y el tipo de variable de origen siempre deben ser similares.
Ejemplo:
|_+_|INPUT () se utiliza para convertir un carácter en numérico. En este caso, el tipo de variable de origen debe ser siempre variables de carácter.
Ejemplo:
|_+_|P # 15) ¿Cuál es el propósito de _CHARACTER_ y _NUMERIC_?
Responder: En el conjunto de datos actual,
_PERSONAJE_ define todas las variables de carácter que están definidas actualmente.
Ejemplo : Para incluir todas las variables de caracteres en PROC MEANS, se utilizan las siguientes declaraciones:
|_+_|_NUMÉRICO_ define todas las variables numéricas que están definidas actualmente.
Ejemplo: Para incluir todas las variables numéricas en PROC MEANS, se utilizan las siguientes declaraciones:
|_+_|P # 16) ¿Qué comandos se utilizan en el caso de incluir o excluir variables específicas en el conjunto de datos?
Responder: Las opciones DROP, KEEP y conjunto de datos se utilizan para este propósito.
La variable que queremos eliminar del paso de datos se especifica en la declaración DROP.
La variable que queremos retener del paso de datos se especifica en la instrucción KEEP.
P # 17) Diferenciar entre PROC MEANS y PROC SUMMARY.
Responder: La diferencia entre PROC MEANS y PROC SUMMARY se puede entender de la siguiente manera:
PROC SIGNIFICA | RESUMEN DEL PROC |
---|---|
Este procedimiento produce el informe impreso por defecto en la ventana SALIDA. | Este procedimiento incluye el PRINT en el estado de cuenta para producir el informe impreso. |
PROC MEANS toma por defecto todas las variables numéricas del análisis. | PROC SUMMARY lleva las variables al análisis estadístico que se describen en la instrucción VAR. |
P # 18) Explique el propósito de las funciones SUBSTR en la programación SAS.
Responder: En la programación SAS, siempre que exista un requisito del programa para abstraer una subcadena, la función SUBSTR se utiliza en el caso de una variable de carácter.
Cuando se especifican una posición inicial y una longitud, esta función se utiliza para abstraer la cadena de caracteres.
Sintaxis: SUBSTR (char_var, inicio, longitud);
P # 19) Nombre y describa brevemente algunas funciones de caracteres SAS que se utilizan para la limpieza de datos.
Responder: A continuación se enumeran pocas funciones de caracteres SAS que se utilizan para la limpieza de datos:
- Comprimir (char_string) La función se utiliza para eliminar espacios en blanco o algunos caracteres especificados de una cadena determinada.
- TRIM (str) La función se utiliza para eliminar los espacios en blanco finales de una cadena determinada.
- LOWCASE (char_string) La función se usa para convertir todos los caracteres en una cadena dada a minúsculas.
- UPCASE (char_string) La función se usa para convertir todos los caracteres en una cadena dada a mayúsculas.
- COMPBL (str) La función se utiliza para convertir varios espacios en blanco en un solo espacio en blanco.
P # 20) Mencione algunas formas en las que se realiza una 'búsqueda de tabla' en la programación SAS.
Responder: En la programación SAS, los valores de búsqueda de la tabla se pueden almacenar de las siguientes formas:
- Código
- Formación
- Objeto hash
- Formato
- Conjunto de datos
Las siguientes técnicas se utilizan para realizar una 'búsqueda de tablas' en SAS respectivamente:
- Declaraciones SELECT / WHEN o IF / THEN
- Valor de índice de matriz
- Valor de clave de objeto hash
- Instrucción FORMAT, función PUT
- Fusionar, unirse, CLAVE = Opción
Veamos un ejemplo que muestra la forma de 'Código' para realizar la búsqueda de tablas mediante declaraciones 'SI / ENTONCES':
|_+_|P # 21) Diferenciar entre funciones CEIL y FLOOR.
Respuesta: función CEIL se utiliza para truncar valores numéricos donde muestra la salida como el número entero más pequeño. Por entero más pequeño, aquí significa que el valor entero es mayor / igual que el argumento.
Ejemplo: CEIL (12.85) mostrará la salida como 13.
Función PISO se utiliza para truncar valores numéricos donde muestra la salida como el mayor número entero. Por mayor entero, aquí significa que el valor entero es menor / igual que el argumento.
Ejemplo: FLOOR (12.85) mostrará la salida como 12.
P # 22) ¿Cuáles son las formas en que se pueden crear variables macro en la programación SAS?
Responder: Bueno, se pueden usar varias técnicas diferentes para crear variables macro en la programación SAS.
A continuación se enumeran los cinco métodos más utilizados:
- Declaración% LET
- Parámetros macro (con nombre y posicionales)
- Sentencia% DO (iterativa)
- INTO en PROC SQL
- Rutina CALL SYMPUTX
P # 23) Explique el propósito de la declaración RETAIN.
Responder: Como el significado de la palabra 'RETAIN' significa mantener el valor una vez asignado, el propósito de la instrucción RETAIN es el mismo en la programación SAS, ya que su significado implica.
Dentro de un programa SAS, cuando se requiere pasar de la iteración actual al siguiente paso de datos, en ese momento la instrucción RETAIN le dice a SAS que retenga los valores en lugar de establecerlos como perdidos.
Ejemplo: Imprimamos un programa que mostrará el valor de salida de 'z' comenzando desde 1 usando la instrucción RETAIN.
|_+_|P # 24) ¿Qué comando se usa para guardar registros en el archivo externo?
Responder: PROCESO IMPRESO El comando se usa para guardar registros en el archivo externo.
unión izquierda vs unión externa izquierda
Ejemplo:
|_+_|P # 25) Mencione algunos errores comunes que generalmente se cometen en la programación SAS.
Responder: A continuación se enumeran algunos de los errores comunes que generalmente se cometen, especialmente cuando es nuevo en este lenguaje de programación.
- La sintaxis básica incluye un punto y coma al final de cada declaración y la falta de un punto y coma es el error más común.
- Omite la comprobación de los registros después de enviar el programa.
- Comentarios de errores como no utilizar los comentarios cuando sea necesario o utilizarlos de forma inapropiada.
- No utilizar métodos de depuración adecuados.
P # 26) Mencione las opciones del sistema SAS para depurar macros SAS.
Responder: Para ayudar a rastrear el código de macro, así como el código SAS generado por las macros, se pueden utilizar algunas opciones del sistema.
Son:
- MLOGIC
- MPRINT
- SÍMBOLOS
El mensaje que generarán estas opciones del sistema se puede ver en el registro de SAS.
P # 27) Diferenciar entre funciones SAS y procedimientos SAS.
Responder: Las principales diferencias se pueden descubrir / comprender mediante el caso explicado tanto para las funciones como para los procedimientos de SAS.
Caso:
Xa Función , el valor del argumento se proporciona o se toma para el cálculo a través de la observación mencionada en la declaración del programa mientras que, en el caso de Procedimiento , se espera que cada observación tenga solo una variable a través de la cual se realiza el cálculo como se menciona en el siguiente ejemplo.
Entendamos con ejemplos:
|_+_|Aquí, en los ejemplos anteriores, los argumentos pasados a la función media se toman para el cálculo como una observación.
|_+_|Aquí, en el ejemplo anterior, la función Proc significa que calcula la temperatura promedio para un argumento que se pasa como una observación, es decir, por mes.
P # 28) ¿Qué sabe acerca de SYMPUT y SYMGET?
Respuesta: Las principales diferencias entre los dos se mencionan a continuación.
SYMPUT se utiliza para almacenar el valor de un conjunto de datos en la variable macro, mientras que SYMGET se utiliza para recuperar el valor de la variable macro en el conjunto de datos.
P # 29) Explique los delimitadores de entrada especiales que se utilizan en la programación SAS.
Responder: Los delimitadores de entrada especiales que se utilizan en la programación SAS son:
- DLM
- DSD
Se utilizan en la declaración 'INFILE' y DSD tiene la funcionalidad de ignorar los delimitadores que aparecen entre comillas.
P # 30) ¿Qué función se usa para contar el número de intervalos entre dos fechas SAS?
Responder: La función de intervalo INTCK se utiliza para contar el número de intervalos entre dos fechas SAS dadas.
Sintaxis:
|_+_|Conclusión
Hasta ahora, hemos visto múltiples preguntas y respuestas que le habrían dado una comprensión clara de los conceptos de programación de SAS y le habrían dado una idea sobre la naturaleza de las preguntas que se formulan en las entrevistas de SAS.
Bueno, si es nuevo en la programación SAS, el conocimiento de algunas tecnologías de programación informática y la familiaridad con SQL (Lenguaje de consulta estructurado) será una ventaja adicional para comprender y aprender SAS rápidamente.
¡Espero que esté listo para enfrentar cualquier entrevista de SAS con confianza!