top 64 informatica interview questions with answers
Preguntas y respuestas más frecuentes de las entrevistas de Informatica:
Este artículo cubre las principales preguntas de Informatica MDM, PowerCenter, Data Quality, Cloud, ETL, Admin, Testing y Developer.
En el escenario actual, INFORMATICA ha logrado la etiqueta de un producto más exigente en todo el mundo. Sus productos se introdujeron recientemente pero se hicieron populares en poco tiempo.
A lo largo de los años, INFORMATICA ha actuado como líder en el campo de la tecnología, Integración de datos. Basada en la arquitectura ETL (Extract, Transfer, Load), esta herramienta de integración de datos tiene varios productos que se enfocan en brindar servicios para organizaciones gubernamentales, compañías financieras y de seguros, atención médica y varias otras empresas.
Bueno, esto fue solo el trasfondo de INFORMATICA. Pero hoy, el campo del almacenamiento de datos tiene un crecimiento tremendo y, por lo tanto, hay muchas oportunidades de trabajo disponibles en la industria.
Las mejores preguntas y respuestas de la entrevista de Informatica
A continuación se incluye una lista de las preguntas y respuestas más frecuentes en las entrevistas. Incluye alrededor de 64 preguntas que, a su vez, le permitirán mejorar sus conocimientos sobre los conceptos de Informatica de una manera más sencilla.
P # 1) ¿Qué es INFORMATICA? ¿Por qué lo necesitamos?
Responder: INFORMATICA es una empresa de desarrollo de software que ofrece alguna solución de integración de datos para ETL, virtualización de datos, gestión de datos maestros, calidad de datos, réplica de datos, ultramensajería, etc.
Algunos de los productos INFORMATICA más populares son:
- IT PowerCenter
- INFORMATICA PowerConnect
- CÓMPUTO Power Mart
- INFORMATICA Power Exchange
- INFORMATICA Análisis de potencia
- INFORMATICA Calidad de energía
Necesitamos INFORMATICA mientras trabajamos con sistemas de datos que contienen datos para realizar ciertas operaciones junto con un conjunto de reglas. Facilita la limpieza de líneas de operaciones y la modificación de datos de sistemas de datos estructurados y no estructurados.
P # 2) ¿Cuál es el formato de los objetos INFORMATICA en un repositorio? ¿Cuáles son las bases de datos que se pueden conectar a Windows?
Responder: Los objetos INFORMATICA se pueden escribir en formato XML.
A continuación se muestra la lista de bases de datos a las que se puede conectar:
- servidor SQL
- Oráculo
- MS Access
- MS Excel
- DB2
- Sybase
- Teradata
P # 3) ¿Qué es INFORMATICA PowerCenter?
Responder: Es una herramienta ETL / Integración de datos que se utiliza para conectar y recuperar datos de diferentes fuentes y procesamiento de datos. PowerCenter procesa un gran volumen de datos y admite la recuperación de datos de fuentes ERP como SAP, PeopleSoft, etc.
Puede conectar PowerCenter a sistemas de administración de bases de datos como SQL y Oracle para integrar datos en el tercer sistema.
P # 4) ¿Cuáles son las diferentes ediciones de INFORMATICA PowerCenter que están disponibles?
Respuesta: Las diferentes ediciones de INFORMATICA PowerCenter son:
- edición estándar
- Edición avanzada
- Edición premium
La versión actual de PowerCenter disponible es la v10 con un aumento de alto rendimiento.
P # 5) ¿Cómo se puede diferenciar entre PowerCenter y Power Map?
Respuesta: A continuación se muestran las diferencias entre PowerCenter y Power Map.
IT PowerCenter | Ciencias de la Computación PowerMart | ||
---|---|---|---|
5858 | 4566 | 3550 | 23/01/2016 |
1. | Procesa un gran volumen de datos | Procesa bajo volumen de datos | |
2. | Admite repositorios globales y locales | Admite solo repositorios locales | |
3. | Admite la recuperación de datos de ERP Fuentes como SAP, PeopleSoft, etc. | No admite la recuperación de datos de fuentes ERP | |
4. | Convierte repositorios locales en globales | No convierta repositorios locales a globales |
P # 6) ¿Cuáles son los diferentes componentes de PowerCenter?
Respuesta: A continuación se muestran los 7 componentes importantes de PowerCenter:
- Servicio PowerCenter
- Clientes de PowerCenter
- Repositorio de PowerCenter
- Dominio de PowerCenter
- Servicio de repositorio
- Servicio de integracion
- Consola de administración de PowerCenter
- Centro de servicios web
P # 7) ¿Cuáles son los diferentes clientes de PowerCenter?
Respuesta: Aquí está la lista de clientes de PowerCenter:
- Diseñador de PowerCenter
- Monitor de flujo de trabajo de PowerCenter
- Administrador de flujo de trabajo de PowerCenter
- Administrador de repositorio de PowerCenter
P # 8) ¿Qué es el repositorio INFORMATICA PowerCenter?
Responder: El repositorio de PowerCenter es una base de datos relacional o una base de datos del sistema que contiene metadatos como,
- Definición de fuente
- Definición de destino
- Sesiones y registros de sesiones
- Flujo de trabajo
- Conexión ODBC
- Cartografía
Hay dos tipos de repositorios:
- Repositorios globales
- Repositorios locales
El repositorio de PowerCenter es necesario para realizar la extracción, transformación y carga (ETL) en función de los metadatos.
P # 9) ¿Cómo elaborar el nivel de rastreo?
Responder: El nivel de seguimiento se puede definir como la cantidad de información que el servidor escribe en el archivo de registro. El nivel de seguimiento se crea y configura ya sea en el nivel de transformación o en el nivel de sesión en ambos niveles.
A continuación se muestran los 4 tipos de nivel de seguimiento:
- Ninguno
- Breve
- Inicialización detallada
- Datos detallados
P # 10) ¿Cómo elaborar el servicio de integración de PowerCenter?
Responder: Los servicios de integración controlan el flujo de trabajo y la ejecución de los procesos de PowerCenter.
Hay tres componentes de los servicios de integración de INFORMATICA como se muestra en la siguiente figura.
Proceso de servicio de integración: Se llama pmserver, el servicio de integración puede iniciar más de un proceso para monitorear el flujo de trabajo.
Balanceo de carga: El equilibrio de carga se refiere a la distribución de toda la carga de trabajo en varios nodos de la cuadrícula. Un equilibrador de carga realiza diferentes tareas que incluyen comandos, sesiones, etc.
Administrador de transformación de datos (DTM): Data Transformation Manager permite realizar las siguientes transformaciones de datos:
- Activo: Para cambiar el número de filas en la salida.
- Pasivo: No se puede cambiar el número de filas en la salida.
- Conectado: Enlace a la otra transformación.
- Desconectado: Sin vínculo a otras transformaciones.
Q #11) ¿Qué es PowerCenter en Grid?
Responder: INFORMATICA tiene la característica de computación Grid que se puede utilizar para la mayor escalabilidad de datos para el rendimiento. La función de cuadrícula se utiliza para el equilibrio de carga y el procesamiento paralelo.
Los dominios de PowerCenter contienen un conjunto de múltiples nodos para configurar la carga de trabajo y luego ejecutarla en Grid.
A dominio es una base para la administración de servicios eficiente proporcionada por PowerCenter.
Nodo es una máquina física independiente que está representada lógicamente para ejecutar el entorno de PowerCenter.
P # 12) ¿Qué es el almacenamiento de datos empresariales?
Responder: Cuando se reúne una gran cantidad de datos en un solo punto de acceso, se denomina Almacenamiento de datos empresarial. Estos datos se pueden reutilizar y analizar a intervalos regulares o según la necesidad del requisito de tiempo.
Considerado como la base de datos central o, digamos, un único punto de acceso, el almacenamiento de datos empresariales proporciona una vista global completa y, por lo tanto, ayuda a tomar decisiones.
Puede entenderse mejor a partir de los siguientes puntos que definen sus características:
- Se puede acceder a toda la información comercial importante almacenada en esta base de datos unificada desde cualquier lugar de la organización.
- Aunque el tiempo requerido es mayor, el análisis periódico de esta única fuente siempre produce mejores resultados.
- La seguridad y la integridad de los datos nunca se ven comprometidas mientras se hacen accesibles en toda la organización.
P # 13) ¿Cuál es el beneficio de la partición de sesiones?
Responder: Mientras el servicio de integración se ejecuta en el entorno, el flujo de trabajo está dividido para un mejor rendimiento. Estas particiones luego se utilizan para realizar la extracción, transformación y carga.
Q #14) ¿Cómo podemos crear un índice después de completar el proceso de carga?
Responder: Las tareas de comando se utilizan para crear un índice. Los scripts de tareas de comando se pueden utilizar en una sesión del flujo de trabajo para crear un índice.
P # 15) ¿Qué son las sesiones?
Responder: La sesión es un conjunto de instrucciones que se utilizan al mover datos desde el origen al destino. Podemos particionar la sesión para implementar varias secuencias de sesiones para mejorar el rendimiento del servidor.
Después de crear una sesión, podemos usar el administrador del servidor o el programa de línea de comandos pmcmd para detener o iniciar la sesión.
P # 16) ¿Cómo podemos usar lotes?
Responder: Los lotes son la colección de sesiones que se utilizan para migrar los datos del origen al destino en un servidor. Los lotes pueden tener la mayor cantidad de sesiones, pero causan más tráfico de red, mientras que menos sesiones de un lote se pueden mover rápidamente.
P # 17) ¿Qué es el mapeo?
Responder: El mapeo es una colección de fuentes y destinos que están vinculados entre sí a través de ciertos conjuntos de transformaciones, como Transformación de expresión, Transformación de clasificador, Transformación de agregación, Transformación de enrutador, etc.
P # 18) ¿Qué es la transformación?
Responder: La transformación se puede definir como un conjunto de reglas e instrucciones que se aplicarán para definir el flujo de datos y la carga de datos en el destino.
P # 19) ¿Qué es la transformación de expresión?
Responder: Es una transformación de mapeo que se utiliza para transformar datos en un registro a la vez. La transformación de expresión puede ser pasiva o conectada. La expresión se utiliza para la manipulación de datos y la generación de resultados mediante declaraciones condicionales.
P # 20) ¿Qué es la transformación de la estrategia de actualización?
Responder: La estrategia de actualización en Informatica se utiliza para controlar los datos que pasan a través de ella y etiquetarla como INSERT, UPDATE, DELETE y REJECT. Podemos establecer una lógica condicional dentro de la transformación de la estrategia de actualización para etiquetarla.
P # 21) ¿Qué es la transformación del clasificador?
¿Qué es un archivo 7z?
Responder: La transformación del clasificador se utiliza para clasificar grandes volúmenes de datos a través de varios puertos. Es muy probable que funcione como la cláusula ORDER BY en SQL. La transformación del clasificador puede ser activa, pasiva o conectada.
La transformación activa pasa por el mapeo y cambia el número de filas, mientras que la transformación pasiva pasa por el mapeo pero no cambia el número de filas.
La mayoría de las transformaciones de INFORMATICA están conectadas a la ruta de datos.
P # 22) ¿Qué es la transformación del enrutador?
Responder: La transformación del enrutador se utiliza para filtrar los datos de origen. Puede utilizar la transformación del enrutador para dividir una única fuente de datos.
Es muy similar a la transformación de filtro, pero la única diferencia es que la transformación de filtro usa solo una condición de transformación y devuelve las filas que no cumplen la condición, mientras que la transformación de enrutador usa múltiples condiciones de transformación y devuelve las filas que coinciden incluso con una sola condición.
P # 23) ¿Qué es la transformación de rango?
Responder: La transformación de rango es Activa y Conectada. Se utiliza para ordenar y clasificar un conjunto de registros en la parte superior o inferior. También se utiliza para seleccionar datos con el valor numérico más grande o más pequeño en función de un puerto específico.
P # 24) ¿Qué es el índice de rango en la transformación de rango?
Responder: El diseñador de tareas asigna el índice de clasificación a cada registro. El puerto de índice de clasificación se utiliza para almacenar la posición de clasificación para cada fila. La transformación de rango identifica cada fila de arriba a abajo y luego asigna el índice de rango.
P # 25) ¿Qué es el código de estado en INFORMATICA?
Responder: El código proporciona un mecanismo de manejo de errores durante cada sesión. El código de estado es emitido por el procedimiento almacenado para reconocer si se comprometió con éxito o no y proporciona información al servidor de INFORMATICA para decidir si la sesión debe detenerse o continuar.
P # 26) ¿Qué son las dimensiones basura?
Responder: La dimensión basura es una estructura que consta de un grupo de algunos atributos basura, como códigos aleatorios o banderas. Forma un marco para almacenar códigos relacionados con respecto a una dimensión específica en un solo lugar en lugar de crear varias tablas para la misma.
P # 27) ¿Qué es Mapplet en Informatica?
Responder: Mapplet es un objeto reutilizable que contiene un determinado conjunto de reglas para la transformación y la lógica de transformación que se puede utilizar en múltiples asignaciones. Mapplet se crea en Mapplet Designer en la herramienta de diseño.
Q #28) ¿Qué es Decode en Informatica?
Responder: Para comprender Decode, consideremos que es similar a la instrucción CASE en SQL. Es básicamente la función que utiliza una transformación de expresión para buscar un valor específico en un registro.
Puede haber búsquedas ilimitadas dentro de la función Decodificar donde se especifica un puerto para devolver valores de resultado. Esta función se usa generalmente en los casos en que se requiere reemplazar declaraciones IF anidadas o reemplazar valores de búsqueda mediante la búsqueda en tablas pequeñas con valores constantes.
Decodificar es una función que se utiliza dentro de la transformación de expresión. Se usa como la instrucción CASE en SQL para buscar un registro específico.
A continuación se muestra un ejemplo simple de un CASO en SQL:
Sintaxis:
|_+_|P # 29) ¿Qué es la Transformación Joiner en INFORMATICA?
Responder: Con la ayuda de la transformación Joiner, puede hacer uso de Joins en INFORMATICA.
Se basa en dos fuentes a saber:
- Fuente maestra
- Fuente de detalle
Las siguientes combinaciones se pueden crear utilizando la transformación de combinación como en SQL.
- Unión normal
- Unión externa completa
- Unión externa maestra (unión externa derecha)
- Detalle de unión exterior (unión exterior izquierda)
P # 30) ¿Qué es la transformación de agregadores en INFORMATICA?
Responder: La transformación de agregador puede estar activa o conectada. Funciona como la cláusula GROUP BY en SQL. Es útil realizar cálculos agregados en grupos en INFORMATICA PowerCenter. Realiza un cálculo agregado sobre los datos utilizando la función de tipo agregado a saber. SUM, AVG, MAX y MIN.
P # 31) ¿Qué es la transformación del generador de secuencia en INFORMATICA?
Responder: La transformación del generador de secuencia puede ser pasiva o conectada. Su uso básico es generar valor entero con NEXTVAL y CURRVAL.
P # 32) ¿Qué es la transformación sindical en INFORMATICA?
Responder: La transformación de unión se utiliza para combinar los datos de diferentes fuentes y enmarcarlos con el mismo puerto y tipo de datos. Es muy parecido a una cláusula en SQL.
P # 33) ¿Qué es la transformación del calificador de origen en INFORMATICA?
Responder: La transformación del calificador de origen es útil en el mapeo, siempre que agregamos archivos planos relacionales, se crea automáticamente. Es una transformación activa y conectada que representa las filas que lee el servicio de integración.
P # 34) ¿Qué es INFORMATICA Worklet?
Responder: Worklet funciona como un Mapplet con la función de reutilización, la única diferencia es que podemos aplicar el Worklet a cualquier cantidad de flujos de trabajo en INFORMATICA, a diferencia de Mapplet. Worklet guarda la lógica y las tareas en un solo lugar para reutilizarlas.
Worklet es muy similar al Mapplet y se define como el grupo de tareas que pueden ser reutilizables o no reutilizables a nivel de flujo de trabajo. Se puede agregar a tantos flujos de trabajo como sea necesario. Con su función de reutilización, se ahorra mucho tiempo, ya que la lógica reutilizable se puede desarrollar una vez y se puede colocar desde donde se puede reutilizar.
En el entorno INFORMATICA PowerCenter, los mapplets se consideran la característica más ventajosa. Se crean en los diseñadores de Mapplet y forman parte de la herramienta Designer.
Básicamente contiene un conjunto de transformaciones que están diseñadas para ser reutilizadas en múltiples mapeos.
Se dice que los mapplets son objetos reutilizables que simplifican el mapeo al:
- Incluyendo múltiples transformaciones y definiciones de fuentes.
- No es necesario conectarse a todos los puertos de entrada y salida.
- Acepte datos de fuentes y pase a múltiples transformaciones
Bueno, en general, cuando se requiere reutilizar la lógica de mapeo, la lógica debe colocarse en Mapplet.
P # 35) ¿Qué es SUBSTR en INFORMATICA?
Responder: SUBSTR es una función que extrae o elimina un conjunto de caracteres de un conjunto de caracteres más grande.
Sintaxis: SUBSTR (cadena, inicio (, longitud))
Dónde,
cuerda define el personaje que queremos buscar.
comienzo es un número entero que se usa para establecer la posición en la que debe comenzar el conteo.
Largo es un parámetro opcional que se usa para contar la longitud de una cadena para regresar desde su posición inicial.
Por ejemplo, SUBSTR (Contacto, 5, 8), donde comenzamos en el quinto carácter de nuestro contacto y regresamos a los siguientes 8 caracteres.
P # 36) ¿Qué es la compatibilidad de páginas de códigos?
Responder: Cuando los datos se transfieren desde la página de códigos fuente a la página de códigos de destino, todas las características de la página de origen deben estar presentes en la página de destino para evitar la pérdida de datos, esta característica se llama Compatibilidad de página de códigos.
La compatibilidad de la página de códigos entra en escena cuando el servidor INFORMATICA se ejecuta en modo de movimiento de datos Unicode. En este caso, se dice que las dos páginas de códigos son idénticas cuando sus caracteres codificados son prácticamente idénticos y, por lo tanto, no se producen pérdidas de datos.
Para mayor precisión, se dice que la página de códigos fuente es el subconjunto de la página de códigos de destino.
P # 37) ¿Cómo se puede diferenciar entre búsqueda conectada y búsqueda no conectada?
Responder: Connected Lookup es parte del flujo de datos que está conectado a otra transformación, toma la entrada de datos directamente de otra transformación que realiza una búsqueda. Utiliza caché estática y dinámica.
La búsqueda no conectada no toma la entrada de datos de otra transformación, pero puede usarse como una función en cualquier transformación que use la expresión LKP (búsqueda). Utiliza la única caché estática.
P # 38) ¿Qué es la agregación incremental?
Responder: La agregación incremental se genera tan pronto como se crea una sesión. Se utiliza para calcular cambios en los datos de origen que no cambian los datos de destino con cambios significativos.
NINGÚN CLIENTE | BILL_NO | MONTO | FECHA |
---|---|---|---|
1001 | 4001 | 1000 | 11/01/2016 |
2001 | 4002 | 2550 | 11/01/2016 |
3001 | 5012 | 4520 | 11/01/2016 |
1001 | 6024 | 2000 | 23/01/2016 |
1001 | 6538 | 5240 | 23/01/2016 |
2001 | 7485 | 5847 | 23/01/2016 |
1515 | 4572 | 6000 | 23/01/2016 |
En la primera carga, la salida es:
NINGÚN CLIENTE | BILL_NO | LOAD_KEY | MONTO |
---|---|---|---|
1001 | 4001 | 20011 | 1000 |
2001 | 4002 | 20011 | 2550 |
3001 | 5012 | 20011 | 4520 |
Ahora, en la segunda carga, agregará los datos con la fecha de la próxima sesión.
NINGÚN CLIENTE | BILL_NO | LOAD_KEY | MONTO | Observaciones / Operación |
---|---|---|---|---|
1001 | 6538 | 20011 | 8240 | El archivo de caché se actualiza después de la agregación |
2001 | 7485 | 20011 | 8397 | El archivo de caché se actualiza después de la agregación |
3001 | 5012 | 20011 | 4520 | Ningún cambio |
5858 | 4566 | 20011 | 3550 | Ningún cambio |
1515 | 4572 | 20011 | 6000 | Ningún cambio |
P # 39) ¿Qué es una clave sustituta?
Responder: Una clave sustituta es un valor entero generado secuencialmente que se usa como otro sustituto o reemplazo de la clave primaria que se requiere como identificación única de cada fila en una tabla.
La clave principal se puede cambiar con frecuencia según la necesidad, lo que dificulta el proceso de actualización para un requisito futuro. La clave sustituta es la única solución para este problema.
P # 40) ¿Qué es la tarea de sesión y la tarea de comando?
Responder: La tarea de sesión es un conjunto de instrucciones que se aplicarán mientras se transfieren datos desde el origen al destino mediante el comando de sesión. El comando de sesión puede ser un comando previo a la sesión o un comando posterior a la sesión.
La tarea de comando es una tarea específica que permite que uno o varios comandos de shell de UNIX se ejecuten en Windows durante el flujo de trabajo
P # 41) ¿Qué es la tarea de comando independiente?
Responder: La tarea de comando independiente se puede utilizar para ejecutar el comando Shell en cualquier lugar y en cualquier momento del flujo de trabajo.
Q #42) ¿Qué es el flujo de trabajo? ¿Cuáles son los componentes del Workflow Manager?
Responder: El flujo de trabajo es la forma en que se debe implementar la tarea. Es una colección de instrucciones que informan al servidor sobre cómo implementar la tarea.
A continuación se muestran los tres componentes principales del Workflow Manager:
- Diseñador de tareas
- Desarrollador de tareas
- Diseñador de flujo de trabajo
P # 43) ¿Qué es el Evento y cuáles son las tareas relacionadas con él?
Responder: El evento puede ser cualquier acción o función que se produzca en el flujo de trabajo.
Hay dos tareas relacionadas con él, que incluyen:
- Tarea de espera de evento: Esta tarea espera hasta que ocurra un evento, una vez que se activa el evento, esta tarea se completa y asigna la siguiente tarea.
- Tarea de aumento de eventos: La tarea Event Raise desencadena el evento específico en el flujo de trabajo.
Q #44) ¿Qué es un evento predefinido y un evento definido por el usuario?
Responder: Los eventos predefinidos son eventos definidos por el sistema que esperan hasta la llegada de un archivo específico a una ubicación específica. También se denomina evento File-Watcher.
Los eventos definidos por el usuario son creados por el usuario para generarlos en cualquier momento en el flujo de trabajo una vez creados.
P # 45) ¿Qué es el diseñador de destino y el orden de carga de destino?
Responder: Target Designer se utiliza para definir el destino de los datos.
Cuando hay múltiples fuentes o una sola fuente con múltiples particiones vinculadas a diferentes destinos a través del servidor INFORMATICA, el servidor usa Target Load Order para definir el orden en el que se cargarán los datos en un destino.
P # 46) ¿Qué es el área de espera?
Responder: El área de preparación es una base de datos donde se almacenan tablas temporales conectadas al área de trabajo o tablas de hechos para proporcionar entradas para el procesamiento de datos.
P # 47) ¿Cuál es la diferencia entre STOP y ABORT?
Respuesta: Las diferencias son las siguientes:
- DETENER El comando se ejecuta en la tarea de sesión, una vez que se genera, el servicio de integración solo deja de leer los datos en el origen de datos, pero continúa procesándolos y escribiéndolos en el destino.
- ABORTO El comando se utiliza para detener completamente el servicio de integración de leer, procesar y escribir datos en el destino. Tiene su propio período de tiempo de espera de 60 segundos para finalizar el procesamiento y escritura de datos a través del servicio de integración, si no, simplemente mata la sesión.
P # 48) ¿Cuáles son los diferentes cachés de búsqueda?
Responder: La búsqueda puede almacenarse en caché o no. Básicamente, se divide en cinco partes.
Son:
- Caché estático
- Caché dinámico
- Recache
- Caché persistente
- Caché compartido
La caché estática permanece como está sin cambios mientras se ejecuta una sesión.
Dynamic Cache se actualiza con frecuencia mientras se ejecuta una sesión.
P # 49) ¿Cómo actualizar la definición de fuente?
Responder: Hay dos formas de actualizar la definición de fuente.
Son:
- Puede editar la definición de fuente existente.
- Puede importar una nueva fuente de la base de datos.
P # 50) ¿Cómo implementar medidas de seguridad usando un administrador de repositorio?
Responder: Hay 3 formas de implementar medidas de seguridad.
Son:
- Permiso de carpeta dentro de propietarios, grupos y usuarios.
- Bloqueo (leer, escribir, recuperar, guardar y ejecutar).
- Privilegios de repositorio a saber.
- Examinar repositorio.
- Utilice el Administrador de flujo de trabajo (para crear sesiones y lotes y establecer sus propiedades).
- Operador de flujo de trabajo (para ejecutar sesiones y lotes).
- Use Designer, Admin Repository (permite a cualquier usuario crear y administrar el repositorio).
- Usuario administrador (permite al usuario crear un servidor de repositorio y establecer sus propiedades).
- SuperUser (todos los privilegios se otorgan al usuario).
Q # 51) Obtenga las ventajas de INFORMATICA.
Responder: Al ser considerada como la herramienta de integración de datos más favorecida, existen múltiples ventajas que deben tenerse en cuenta.
Son:
- Puede comunicar y transformar de manera efectiva y muy eficiente los datos entre diferentes fuentes de datos como Mainframe, RDBMS, etc.
- Suele ser más rápido, robusto y de fácil aprendizaje que cualquier otra plataforma disponible.
- Con la ayuda de INFORMATICA Workflow Monitor, los trabajos se pueden monitorear fácilmente, los trabajos fallidos se pueden recuperar y se pueden señalar los trabajos de ejecución lenta.
- Tiene características como procesamiento sencillo de la información de la base de datos, validación de datos, migración de proyectos de una base de datos a otra, desarrollo de proyectos, iteración, etc.
P # 52) Incluya algunas áreas o situaciones en tiempo real donde se requiere INFORMATICA.
Responder: Almacenamiento de datos, integración de datos, migración de datos y migración de aplicaciones de una plataforma a otras plataformas son algunos ejemplos de áreas de uso en tiempo real.
P # 53) Explique el programa ETL con algunos ejemplos.
Responder: Conocida por su singularidad, la herramienta ETL significa Extraer, Transformar y Cargar herramienta que básicamente resuelve el propósito de extraer datos y enviarlos a algún lugar según se define modificándolos.
Para ser muy precisos:
- La tarea de extracción es recopilar los datos de fuentes como la base de datos, archivos, etc.
- Se considera que la transformación modifica los datos que se han recibido de la fuente.
- La carga define el proceso de alimentar los datos alterados al objetivo definido.
Para comprenderlo de manera técnica, la herramienta ETL recopila datos de fuentes heterogéneas y los altera para hacerlos homogéneos para que puedan utilizarse más para el análisis de la tarea definida.
Algunos ejemplos de programas básicos incluyen:
- Los mapeos derivan el proceso ETL de leer datos de sus fuentes originales donde el proceso de mapeo se realiza en el diseñador.
- Los flujos de trabajo constan de varias tareas que se deciden y diseñan en la ventana del Administrador de flujo de trabajo.
- La tarea consta de un conjunto de varios pasos que determinan la secuencia de acciones a realizar durante el tiempo de ejecución.
P # 54) Enumere las diferencias entre la base de datos y el almacén de datos.
Responder: Consulte la siguiente tabla para comprender las diferencias entre los dos:
admite preguntas y respuestas de entrevistas
Base de datos | Almacén de datos |
---|---|
Almacena / registra los datos actuales y actualizados que se utilizan en las operaciones diarias. | Almacena / analiza datos históricos que se utilizan para soporte de información a largo plazo. |
Su orientación es el procesamiento transaccional en línea que incluye transacciones simples y breves. | Su orientación es el Procesamiento Analítico en Línea que incluye consultas complejas. |
Consiste en datos detallados y primitivos donde su vista es relacional plana. | Consiste en un resumen de datos consolidados donde su vista es multidimensional. |
Se observa un bajo rendimiento para las consultas analíticas. | Las consultas analíticas se consideran aquí de alto rendimiento. |
La eficiencia se determina midiendo el rendimiento de las transacciones. | La eficiencia se determina midiendo el rendimiento de las consultas y el tiempo de respuesta. |
P # 55) Explique las características de la búsqueda de Conectado y Desconectado.
Respuesta: Las características de Connected Lookup se pueden explicar de la siguiente manera:
- Hay una fuente directa de entrada de la canalización para la búsqueda conectada.
- Tiene participación activa en el flujo de datos y se utiliza tanto el caché dinámico como el estático, según sea el caso.
- Almacena en caché todas las columnas de búsqueda y devuelve los valores predeterminados como salida cuando la condición de búsqueda no coincide.
- Se pueden devolver valores de más de una columna al puerto de salida.
- Se pasan varios valores de salida y los puertos de salida se vinculan a otra transformación.
- La búsqueda conectada admite valores predeterminados definidos por el usuario.
Las características de la búsqueda no conectada se pueden explicar de la siguiente manera:
- La búsqueda no conectada usa caché estática y su fuente de entrada es el resultado recibido de la salida de la expresión LKP.
- Solo almacena en caché los puertos de salida de búsqueda y devuelve el valor como NULL cuando la condición de búsqueda no coincide.
- Solo se devuelve una columna de cada puerto.
- Solo se pasa un valor de salida a otra transformación.
- Los valores predeterminados definidos por el usuario no son compatibles con la búsqueda no conectada.
P # 56) Durante la sesión en ejecución, el servidor de Informatica crea los archivos de salida. Reclute a algunos de ellos.
Responder: A continuación se mencionan los pocos archivos de salida:
- Archivos de caché: Estos archivos se crean en el momento de la creación de la memoria caché. Para circunstancias como transformación de búsqueda, transformación de agregador, etc., el servidor de Informatica crea archivos de caché de datos e índices.
- Archivo de detalles de la sesión: Como lo define el nombre, este archivo contiene estadísticas de carga como el nombre de la tabla, filas rechazadas o escritas para cada objetivo en el mapeo y se puede ver en la ventana del monitor.
- Archivo de detalles de rendimiento: Este archivo forma parte de la hoja de propiedades de la sesión y contiene información sobre el rendimiento de la sesión para determinar las áreas de mejora.
- Registro del servidor INFORMATICA: El servidor crea un registro para todos los mensajes de estado y error y se puede ver en el directorio de inicio.
- Archivo de registro de sesión: Para cada sesión, el servidor crea un archivo de registro de la sesión según el nivel de seguimiento establecido. La información que se puede ver en los archivos de registro sobre las sesiones puede ser:
- Proceso de inicialización de la sesión,
- Creación de comandos SQL para hilos de lectura y escritura,
- Lista de errores encontrados y
- Resumen de carga
- Correo electrónico posterior a la sesión: Esto ayuda a comunicar la información sobre la sesión (sesión completada / sesión fallida) a los destinatarios deseados automáticamente.
- Rechazar archivo: Este archivo contiene información sobre los datos que no se han utilizado / escrito en los destinos.
- Archivo de control: En caso de que, cuando la sesión use el cargador externo, el archivo de control consiste en cargar instrucciones y formato de datos sobre el archivo de destino.
- Archivo indicador: Este archivo contiene básicamente un número que resalta las filas marcadas para INSERTAR / ACTUALIZAR / ELIMINAR o RECHAZAR.
- Archivo de salida: El archivo de salida se crea según las propiedades del archivo.
Q # 57) ¿Cómo diferenciar entre las transformaciones activa y pasiva?
Responder: Para comprender la diferencia entre las transformaciones activa y pasiva, veamos sus características que explicarán las diferencias de una mejor manera.
La acción realizada por las transformaciones activas incluye:
- Cambiar el número de filas según el requisito, que pasa por las transformaciones. Por ejemplo, Transformación de filtro que elimina la fila que no cumple la condición.
- Cambiar el límite de la transacción estableciendo los puntos de reversión y compromiso. Por ejemplo, Transformación de control de transacciones.
- Cambiar el tipo de fila para INSERT / UPDATE / DELETE o REJECT.
La acción realizada por las transformaciones pasivas incluye:
- El número de filas que pasan por la transformación nunca cambia.
- Se establece el límite de la transacción.
- Se establece el tipo de fila.
Q # 58) Enlista los distintos tipos de Transformaciones.
Respuesta: Los distintos tipos de transformaciones son los siguientes:
- Transformación de agregador
- Transformación de expresión
- Transformación de normalizador
- Transformación de rango
- Transformación de filtro
- Transformación de carpintero
- Transformación de búsqueda
- Transformación de procedimiento almacenado
- Ordenar transformación
- Actualizar la transformación de la estrategia
- Transformación de calificador de fuente XML
- Transformación de enrutador
- Transformación del generador de secuencia
P # 59) ¿Qué es la caché dinámica?
Responder: Las búsquedas de INFORMATICA se pueden clasificar como en caché o sin caché. En el caso de la caché dinámica, las filas se pueden insertar o eliminar en el momento de pasar las filas y se sincroniza con el destino. La memoria caché se actualiza cada vez que se realizan operaciones de eliminación / actualización dentro de la sesión.
P # 60) ¿Qué es la decodificación en la caché estática?
Responder: La caché estática es la que no se actualiza ni se actualiza durante la ejecución de la sesión. Es la caché predeterminada y devuelve el valor solo cuando la condición de devolución es verdadera. En otros casos, devuelve un valor nulo. En este caso, no se puede realizar la inserción o actualización de la caché.
P # 61) Mencione algunas ventajas de la transformación de enrutador sobre la transformación de filtro.
Responder: La transformación de enrutador y la transformación de filtro son iguales porque ambas usan una condición para probar y filtrar los datos.
Sin embargo, las ventajas de la transformación del enrutador sobre el filtro pueden entenderse mediante los puntos mencionados a continuación.
Transformación del enrutador:
- Permite más de una condición de prueba.
- Proporcionar la capacidad de probar los mismos datos de entrada en varios números de condiciones.
- En el caso del mapeo, el servidor procesa los datos de entrada solo una vez y, por lo tanto, mejora el rendimiento.
- Menos complejo y más eficiente.
- Los registros que no superan la condición de prueba nunca se bloquean, sino que se pasan al grupo predeterminado.
Q # 62) Incluya algunas propiedades de las sesiones.
Responder: Una sesión está disponible en el administrador de flujo de trabajo y se configura creando una tarea de sesión. Dentro de un programa de mapeo, puede haber múltiples sesiones y puede ser reutilizable o no reutilizable.
Algunas de las propiedades de la sesión son las siguientes:
- Según el requisito, las tareas de la sesión se pueden ejecutar de forma simultánea o secuencial.
- Se puede configurar una sesión para analizar el rendimiento.
- Para crear o ejecutar una tarea de sesión, es necesario tener información general sobre el nombre de la sesión, la programación y el servicio de integración.
- Otra propiedad importante de la sesión incluye el archivo de registro de la sesión, la carga de prueba, el manejo de errores, el intervalo de confirmación, las propiedades de destino, etc.
P # 63) Enumere las tareas para las que se utiliza la transformación del calificador de origen.
Responder: El calificador de origen se considera una transformación activa que lee las filas que están involucradas en el servicio de integración dentro de la sesión en ejecución. Determina la forma en que se obtienen los datos de la fuente y se agregan automáticamente al agregar una fuente al mapeo.
La lista de diferentes tareas donde se usa el calificador de origen es la siguiente:
- Filtrado de filas
- Clasificación de datos
- Creación de consultas personalizadas
- Unir tablas de la misma fuente
- Seleccionar valores distintos
P # 64) ¿Menciona algunas aplicaciones cliente de Power Center con su propósito básico?
Responder: Las aplicaciones cliente de PowerCenter realizan tareas como la creación de sesiones y flujos de trabajo, la supervisión del progreso del flujo de trabajo, el diseño de mapplets, etc.
A continuación se incluye la lista de aplicaciones cliente de PowerCenter con su propósito:
- Gerente de repositorio: Es una herramienta administrativa y su finalidad básica es gestionar carpetas, objetos, grupos, etc. del repositorio.
- Consola de administración: Aquí se realizan las tareas de servicio como iniciar / detener, respaldar / restaurar, actualizar / eliminar, etc.
- Diseñador de centros de energía: El diseñador consta de varias herramientas de diseño que sirven para varios propósitos. Estas herramientas de diseño son:
- Analizador de fuente
- Diseñador de destino
- Desarrollador de transformación
- Diseñador de Mapplet
- Gerente de mapeo
- Administrador de flujo de trabajo: Su propósito básico es definir un conjunto de instrucciones / flujo de trabajo que se requiere para ejecutar mapeos diseñados en el diseñador. Para ayudar a desarrollar un flujo de trabajo, hay 3 herramientas disponibles, a saber, desarrollador de tareas, diseñador de flujo de trabajo y diseñador de trabajo.
- Monitor de flujo de trabajo: Como sugiere el nombre, el monitor de flujo de trabajo supervisa el flujo de trabajo o las tareas. La lista de ventanas disponibles son:
- Ventana del navegador
- Ventana de salida
- Ventana de tiempo
- Ventana de propiedades
- Vista de tareas
- Vista de diagrama de Gantt
Conclusión
Espero que a estas alturas ya tengas una idea clara sobre la herramienta y el tipo de preguntas que se harán en las entrevistas.
INFORMATICA es la mejor solución para realizar la Integración de Datos. Funciona con la gestión de datos múltiples en un entorno multiplataforma como Windows, Linux, Unix, etc. y se prueba en más de 50.000 plataformas para obtener mejores resultados y el mejor rendimiento, entre muchas otras.
En pocas palabras, INFORMATICA es una herramienta ETL que recopila información o datos de varias fuentes y carga esa información en los objetivos específicos definidos sin realmente guardarla. Su tarea es entregar varios servicios y recursos a diferentes máquinas y, por lo tanto, los datos entregados deben ser correctos con resultados notables.
Repase sus conocimientos sobre los conceptos de Informatica a través de este artículo y prepárese para su entrevista de inmediato.
¡¡¡Todo lo mejor!!!
Lectura recomendada
- Preguntas y respuestas de la entrevista
- Preguntas y respuestas de la entrevista de prueba ETL
- Algunas preguntas y respuestas complicadas sobre pruebas manuales
- Las 32 mejores preguntas y respuestas de las entrevistas de Datastage
- Principales preguntas y respuestas de la entrevista de Teradata
- Las 30 preguntas y respuestas principales de la entrevista SAS
- Las 24 preguntas principales de la entrevista de modelado de datos con respuestas detalladas
- Las 10 mejores herramientas de análisis de datos para una gestión de datos perfecta (LISTA 2021)
- Función de agrupación de datos en IBM Rational Quality Manager para la gestión de datos de prueba
- Concepto, proceso y estrategia de gestión de datos de prueba
- Las 14 MEJORES herramientas de gestión de datos de prueba en 2021