top 50 database interview questions
Preguntas y respuestas más frecuentes de la entrevista de la base de datos:
Este artículo cubrirá una lista de todas las preguntas y respuestas más importantes y más frecuentes de las entrevistas de la 'Base de datos', que le ayudarán a resolver cualquier entrevista.
Habilidades organizativas, gran capacidad de resolución de problemas, atención a los detalles y alto nivel de precisión, son algunas de las cualidades esenciales que una persona debe poseer para estar en el 'Base de datos' campo.
Si bien debe estar actualizado con las últimas tendencias en la industria, sus conceptos básicos también deben ser sólidos por otro lado. Para comenzar su carrera en bases de datos, lo primero y más importante que debe tener es el conocimiento de DBMS (sistema de gestión de bases de datos) y SQL (lenguaje de consulta estructurado).
Preguntas y respuestas de entrevistas de base de datos más populares
A continuación se incluye una lista de las preguntas y respuestas más populares de las entrevistas de la base de datos para su referencia.
P # 1) ¿Qué entiende por 'base de datos'?
Responder: La base de datos es una colección organizada de datos relacionados donde los datos se almacenan y organizan para cumplir un propósito específico.
Por ejemplo , Un bibliotecario mantiene una base de datos de toda la información relacionada con los libros que están disponibles en la biblioteca.
P # 2) Definir DBMS.
Responder: DBMS son las siglas de Database Management System. Es una colección de programas de aplicación que permiten al usuario organizar, restaurar y recuperar información sobre datos de la manera más eficiente y efectiva posible.
Algunos de los DBMS más populares son MySql, Oracle, Sybase, etc.
Q # 3) Defina RDBMS.
Responder: El sistema de gestión de bases de datos relacionales (RDBMS) se basa en un modelo relacional de datos que se almacenan en bases de datos en tablas separadas y están relacionados con el uso de una columna común. Se puede acceder fácilmente a los datos desde la base de datos relacional mediante el lenguaje de consulta estructurado (SQL).
P # 4) Obtenga las ventajas de DBMS.
Respuesta: Las ventajas de DBMS incluyen:
- Los datos se almacenan de forma estructurada y, por tanto, se controla la redundancia.
- Valida los datos ingresados y proporciona restricciones sobre el acceso no autorizado a la base de datos.
- Proporciona respaldo y recuperación de los datos cuando sea necesario.
- Proporciona múltiples interfaces de usuario.
P # 5) ¿Qué entiende por redundancia de datos?
Responder: La duplicación de datos en la base de datos se conoce como redundancia de datos. Como resultado de la redundancia de datos, los datos duplicados están presentes en múltiples ubicaciones, por lo que se desperdicia el espacio de almacenamiento y se destruye la integridad de la base de datos.
P # 6) ¿Cuáles son los distintos tipos de relaciones en la base de datos? Defínalos.
Respuesta: Hay 3 tipos de relaciones en la base de datos:
- Doce y cincuenta y nueve de la noche: Una tabla tiene una relación con otra tabla que tiene un tipo de columna similar. Cada clave primaria se relaciona con un solo registro o con ningún registro en la tabla relacionada.
- Uno a muchos: Una tabla tiene una relación con otra tabla que tiene relaciones de clave primaria y externa. La tabla de clave primaria contiene solo un registro que se relaciona con ninguno, uno o muchos registros en la tabla relacionada.
- Muchos a muchos: Cada registro en ambas tablas puede relacionarse con muchos números de registros en otra tabla.
P # 7) Explique la normalización y desnormalización.
Responder:
Normalización es el proceso de eliminar datos redundantes de la base de datos dividiendo la tabla de una manera bien definida para mantener la integridad de los datos. Este proceso ahorra gran parte del espacio de almacenamiento.
De-normalization es el proceso de sumar datos redundantes en la tabla para acelerar las consultas complejas y así lograr un mejor rendimiento.
P # 8) ¿Cuáles son los diferentes tipos de normalización?
Respuesta: Los diferentes tipos de normalización son:
- Primera forma normal (1NF): Se dice que una relación está en 1NF solo cuando todas las entidades de la tabla contienen valores únicos o atómicos.
- Segunda forma normal (2NF): Se dice que una relación está en 2NF solo si está en 1NF y todos los atributos que no son clave de la tabla dependen completamente de la clave primaria.
- Tercera forma normal (3NF): Se dice que una relación está en 3NF solo si está en 2NF y cada atributo que no es clave de la tabla no depende transitivamente de la clave primaria.
P # 9) ¿Qué es BCNF?
Responder: BCNF es la forma normal del código de Boyce. Es la versión superior de 3Nf que no tiene múltiples claves candidatas superpuestas.
P # 10) ¿Qué es SQL?
Responder: Lenguaje de consulta estructurado, SQL es un lenguaje de programación estándar ANSI (American National Standard Institute) que está diseñado específicamente para almacenar y administrar los datos en el sistema de administración de bases de datos relacionales (RDBMS) utilizando todo tipo de operaciones de datos.
P # 11) ¿Cuántas sentencias SQL se utilizan? Defínalos.
Responder: Las declaraciones SQL se dividen básicamente en tres categorías, DDL, DML y DCL.
Pueden definirse como:
- Lenguaje de definición de datos (DDL) Los comandos se utilizan para definir la estructura que contiene los datos. Estos comandos se confirman automáticamente, es decir, los cambios realizados por los comandos DDL en la base de datos se guardan de forma permanente.
- Lenguaje de manipulación de datos (DML) Los comandos se utilizan para manipular los datos de la base de datos. Estos comandos no se confirman automáticamente y se pueden revertir.
- Lenguaje de control de datos (DCL) Los comandos se utilizan para controlar la visibilidad de los datos en la base de datos, como revocar el permiso de acceso para usar datos en la base de datos.
P # 12) Incluya algunos comandos de DDL, DML y DCL.
Respuesta: Comandos del lenguaje de definición de datos (DDL):
- CREAR para crear una nueva tabla o base de datos.
- ALTER para alteración.
- TRUNCATE para eliminar datos de la tabla.
- DROP para dejar caer una mesa.
- RENAME para cambiar el nombre de una tabla.
Comandos de lenguaje de manipulación de datos (DML):
- INSERTAR para insertar una nueva fila.
- ACTUALIZAR para actualizar una fila existente.
- BORRAR para eliminar una fila.
- MERGE para fusionar dos filas o dos tablas.
Comandos de lenguaje de control de datos (DCL):
- COMPROMETE para guardar permanentemente.
- ROLLBACK para deshacer el cambio.
- SAVEPOINT para guardar temporalmente.
P # 13) Defina el compilador DML.
Responder: El compilador DML traduce las declaraciones DML en un lenguaje de consulta a una instrucción de bajo nivel y la instrucción generada puede ser entendida por Query Evaluation Engine.
P # 14) ¿Qué es el intérprete DDL?
Responder: El intérprete DDL interpreta las declaraciones DDL y registra las declaraciones generadas en la tabla que contiene metadatos.
P # 15) Obtenga las ventajas de SQL.
Respuesta: Las ventajas de SQL son:
- Se pueden utilizar consultas SQL simples para recuperar una gran cantidad de datos de la base de datos de manera muy rápida y eficiente.
- SQL es fácil de aprender y casi todos los DBMS admiten SQL.
- Es más fácil administrar la base de datos usando SQL ya que no se requiere una gran cantidad de codificación.
P # 16) Explique los términos 'Registro', 'Campo' y 'Tabla' en términos de base de datos.
Responder:
Registro: El registro es una colección de valores o campos de una entidad específica. Por ejemplo, Un empleado, cuenta de salario, etc.
Campo: Un campo se refiere a un área dentro de un registro que está reservada para datos específicos. Por ejemplo, ID de empleado.
Mesa: La tabla es la colección de registros de tipos específicos. Por ejemplo, la tabla Empleado es una colección de registros relacionados con todos los empleados.
P # 17) ¿Qué entiende por independencia de datos? ¿Cuáles son sus dos tipos?
Responder: La independencia de datos se refiere a la capacidad de modificar la definición del esquema en un nivel de tal manera que no afecte la definición del esquema en el siguiente nivel superior.
Los 2 tipos de independencia de datos son:
inicialización de variable estática c ++
- Independencia de datos físicos : Modifica el esquema a nivel físico sin afectar el esquema a nivel conceptual.
- Independencia de datos lógicos: Modifica el esquema a nivel conceptual sin afectar o provocar cambios en el esquema a nivel de vista.
P # 18) Defina la relación entre 'Vista' e 'Independencia de datos'.
Responder: La vista es una tabla virtual que no tiene sus datos por sí sola, sino que los datos se definen a partir de una o más tablas base subyacentes.
Las vistas dan cuenta de la independencia lógica de los datos, ya que el crecimiento y la reestructuración de las tablas base no se reflejan en las vistas.
P # 19) ¿Cuáles son las ventajas y desventajas de las vistas en la base de datos?
Respuesta: Ventajas de las vistas:
- Como no hay una ubicación física donde se almacenan los datos en la vista, genera resultados sin desperdiciar recursos.
- El acceso a los datos está restringido ya que no permite comandos como la inserción, actualización y eliminación.
Desventajas de las vistas:
- La vista se vuelve irrelevante si descartamos una tabla relacionada con esa vista.
- Se ocupa mucho espacio de memoria cuando se crea la vista para tablas grandes.
P # 20) ¿Qué entiendes por dependencia funcional?
Responder: Se dice que una relación está en dependencia funcional cuando un atributo define unívocamente otro atributo.
Por ejemplo, R es una Relación, X e Y son dos atributos. T1 y T2 son dos tuplas. Entonces,
T1(X)=T2(X) and T1(Y)=T2(Y)
Significa que el valor del componente X define de manera única el valor del componente Y.
Además, X-> Y significa que Y es funcionalmente dependiente de X.
P # 21) ¿Cuándo se dice que la dependencia funcional es completamente dependiente funcional?
Responder: Para cumplir con los criterios de dependencia completamente funcional, la relación debe cumplir con el requisito de dependencia funcional.
Se dice que una dependencia funcional 'A' y 'B' son completamente dependientes cuando la eliminación de cualquier atributo dice 'X' de 'A' significa que la dependencia ya no se mantiene.
P # 22) ¿Qué entiende por modelo E-R?
Responder: El modelo E-R es un modelo Entidad-Relación que define la vista conceptual de la base de datos.
El modelo E-R básicamente muestra las entidades del mundo real y sus asociaciones / relaciones. Las entidades aquí representan el conjunto de atributos en la base de datos.
P # 23) Defina Entidad, Tipo de entidad y Conjunto de entidades.
Responder:
Entidad puede ser cualquier cosa, ya sea un lugar, clase u objeto que tenga una existencia independiente en el mundo real.
Tipo de entidad representa un conjunto de entidades que tienen atributos similares.
Conjunto de entidades en la base de datos representa una colección de entidades que tienen un tipo de entidad particular.
P # 24) Defina un conjunto de entidades débiles.
Responder: El conjunto de entidad débil es aquel cuya clave principal comprende su clave parcial, así como la clave principal de su entidad principal. Este es el caso porque el conjunto de entidades puede no tener suficientes atributos para formar una clave primaria.
P # 25) Explique los términos 'Atributo' y 'Relaciones'
Responder:
Atributo se describe como las propiedades o características de una entidad. Por ejemplo , ID de empleado, Nombre del empleado, Edad, etc., pueden ser atributos de la entidad Empleado.
Relación es una tabla bidimensional que contiene una serie de filas y columnas donde cada fila representa un registro de la relación. Aquí, las filas también se conocen como 'Tuplas' y las columnas se conocen como 'Atributos'.
P # 26) ¿Qué son VDL y SDL?
Respuesta: VDL es el lenguaje de definición de vistas que representa las vistas del usuario y su asignación al esquema conceptual.
SDL es el lenguaje de definición de almacenamiento que especifica el mapeo entre dos esquemas.
Q # 27) Defina Cursor y sus tipos.
Responder: El cursor es un área de trabajo temporal que almacena los datos, así como el conjunto de resultados, ocurrido después de la manipulación de los datos recuperados. Un cursor solo puede contener una fila a la vez.
Los 2 tipos de Cursor son:
- Cursores implícitos se declaran automáticamente cuando se ejecutan sentencias DML como INSERT, UPDATE, DELETE.
- Cursores explícitos deben declararse cuando se ejecutan sentencias SELECT que devuelven más de una fila.
P # 28) ¿Qué es la transacción de la base de datos?
Responder: La secuencia de operación realizada que cambia el estado consistente de la base de datos a otro se conoce como transacción de la base de datos. Después de la finalización de la transacción, la finalización exitosa se refleja en el sistema o la transacción falla y no se refleja ningún cambio.
P # 29) Defina el bloqueo de la base de datos y sus tipos.
Responder: El bloqueo de la base de datos básicamente significa la transacción sobre el estado actual del elemento de datos, es decir, si esos datos están siendo utilizados por otras transacciones o no en el momento actual.
Hay dos tipos de bloqueo de base de datos: Bloqueo compartido y Bloqueo exclusivo.
P # 30) ¿Qué es el almacenamiento de datos?
Responder: El almacenamiento así como el acceso a los datos, que se derivan de las transacciones y otras fuentes, desde una ubicación central para realizar el análisis se denomina Data Warehousing.
P # 31) ¿Qué entiendes por Join?
Responder: Unir es el proceso de derivar la relación entre diferentes tablas combinando columnas de una o más tablas que tienen valores comunes en cada una. Cuando una tabla se une a sí misma, se conoce como Self Join.
P # 32) ¿Qué entiendes por búsqueda de índices?
Responder: La búsqueda de índices es el proceso de impulsar la colección de índices que ayuda a mejorar el rendimiento de la consulta, así como la velocidad de la base de datos.
P # 33) ¿Cómo mejorar el rendimiento de las consultas mediante la búsqueda de índices?
Respuesta: La búsqueda de índices ayuda a mejorar el rendimiento de las consultas al:
- Usar un optimizador de consultas para coordinar las consultas con la carga de trabajo.
- Observar el rendimiento y el efecto de la distribución de índices y consultas.
P # 34) Diferenciar entre índice 'Clúster' y 'No clúster'.
Responder: El índice agrupado altera la tabla y reordena la forma en que se almacenan los registros en la tabla. La recuperación de datos se acelera mediante el uso del índice agrupado.
Un índice no agrupado altera los registros que se almacenan en la tabla, pero crea un objeto completamente diferente dentro de la tabla.
P # 35) ¿Cuáles son las desventajas de una consulta?
Respuesta: Las desventajas de una consulta son:
- Los índices no están presentes.
- Los procedimientos almacenados se compilan excesivamente.
- Dificultad para interactuar.
P # 36) ¿Qué entiendes por fragmentación?
Responder: La fragmentación es una característica que controla las unidades de datos lógicas, también conocidas como fragmentos que se almacenan en diferentes sitios de un sistema de base de datos distribuido.
Q # 37) Definir tipos de unión.
Responder: A continuación se muestran los tipos de combinación, que se explican con respecto a las tablas como un Ejemplo.
mesa de empleados:
tabla employee_info:
a) UNIÓN INTERIOR: Inner JOIN también se conoce como JOIN simple. Esta consulta SQL devuelve resultados de ambas tablas que tienen un valor común en filas.
Consulta SQL:
|_+_|Resultado:
b) UNIÓN Natural: Este es un tipo de Inner JOIN que devuelve resultados de ambas tablas que tienen los mismos valores de datos en las columnas de ambas tablas que se unirán.
Consulta SQL:
|_+_|Resultado:
c) Cross JOIN: Cross JOIN devuelve el resultado como todos los registros donde cada fila de la primera tabla se combina con cada fila de la segunda tabla.
Consulta SQL:
|_+_|Resultado:
Hagamos algunas modificaciones en las tablas anteriores para entender Right JOIN, Left JOIN y Full JOIN.
mesa de empleados:
tabla employee_info:
a) Derecho UNIRSE: Right JOIN también se conoce como Right Outer JOIN. Esto devuelve todas las filas como resultado de la tabla de la derecha, incluso si la condición JOIN no coincide con ningún registro de la tabla de la izquierda.
Consulta SQL:
|_+_|Resultado:
b) Izquierda JOIN: Left JOIN también se conoce como Left Outer JOIN. Esto devuelve todas las filas como resultado de la tabla de la izquierda, incluso si la condición JOIN no coincide con ningún registro de la tabla de la derecha. Esto es exactamente lo contrario de Right JOIN.
Consulta SQL:
|_+_|Resultado:
c) ÚNICA EXTERNA / COMPLETA: El retorno completo de JOIN da como resultado la combinación del resultado de Left JOIN y Right JOIN.
Consulta SQL:
|_+_|Resultado:
P # 38) ¿Qué entiendes por 'Atomicidad' y 'Agregación'?
Respuesta: Atomicidad es la condición en la que se realizan todas las acciones de la transacción o ninguna. Esto significa que, cuando hay una transacción incompleta, el propio sistema de gestión de la base de datos deshará los efectos realizados por la transacción incompleta.
Agregación es el concepto de expresar la relación con el conjunto de entidades y sus relaciones.
Q # 39) Defina el punto muerto fantasma.
Responder: La detección de interbloqueo fantasma es la condición en la que el interbloqueo no existe realmente, pero debido a un retraso en la propagación de la información local, los algoritmos de detección de interbloqueo identifican los interbloqueos.
Q # 40) Definir punto de control.
Responder: Checkpoint declara un punto antes del cual todos los registros se almacenan permanentemente en el disco de almacenamiento y es el estado inconsistente. En el caso de fallas, la cantidad de trabajo y tiempo se ahorra ya que el sistema puede reiniciarse desde el punto de control.
P # 41) ¿Qué es la partición de bases de datos?
Responder: El particionamiento de la base de datos es el proceso de particionar tablas, índices en partes más pequeñas para administrar y acceder a los datos en un nivel más fino.
Este proceso de partición reduce el costo de almacenar una gran cantidad de datos y mejora el rendimiento y la capacidad de administración.
P # 42) Explique la importancia del particionamiento de la base de datos.
Respuesta: La importancia de la partición de la base de datos es:
- Mejora el rendimiento y la capacidad de administración de las consultas.
- Simplifica las tareas de administración comunes.
- Actúa como una herramienta clave para los sistemas de construcción con requisitos de disponibilidad extremadamente altos.
- Permite acceder a gran parte de una única partición.
Q # 43) Explique el diccionario de datos.
Responder: El diccionario de datos es un conjunto de información que describe el contenido y la estructura de las tablas y los objetos de la base de datos. El trabajo de la información almacenada en el diccionario de datos es controlar, manipular y acceder a la relación entre los elementos de la base de datos.
Q # 44) Explique la clave principal y la clave compuesta.
Respuesta: Clave principal es esa columna de la tabla cuyos datos de cada fila se identifican de forma única. Cada fila de la tabla debe tener una clave principal y dos filas no pueden tener la misma clave principal. El valor de la clave principal nunca puede ser nulo ni puede modificarse o actualizarse.
Clave compuesta es una forma de la clave candidata donde un conjunto de columnas identificará de forma única cada fila de la tabla.
P # 45) ¿Qué entiende por la clave única?
Responder: Una clave única es la misma que la clave principal, cuyos datos de cada fila se identifican de forma única con una diferencia de valor nulo, es decir, la clave única permite un valor como valor NULO.
P # 46) ¿Qué entiende por activadores de base de datos?
Responder: Un conjunto de comandos que se ejecutan automáticamente cuando ocurre un evento como Antes de insertar, Después de insertar, Al actualizar, Al eliminar de una fila en una tabla, se llama como activador de base de datos.
Q # 47) Definir procedimientos almacenados.
Responder: Un procedimiento almacenado es una colección de consultas SQL precompiladas, que cuando se ejecuta denota un programa que toma la entrada, procesa y da la salida.
Q # 48) ¿Qué entiendes por B-Trees?
Responder: B-Tree representa la estructura de datos en forma de árbol para la memoria externa que lee y escribe grandes bloques de datos. Se usa comúnmente en bases de datos y sistemas de archivos donde todas las inserciones, eliminaciones, ordenaciones, etc., se realizan en tiempo logarítmico.
P # 49) Nombre los diferentes modelos de datos que están disponibles para los sistemas de bases de datos.
Respuesta: Los diferentes modelos de datos son:
- Modelo relacional
- Modelo de red
- Modelo jerárquico
P # 50) Diferenciar entre los comandos 'DELETE', 'TRUNCATE' y 'DROP'.
Responder: Después de la ejecución de 'ELIMINAR' operación, las declaraciones COMMIT y ROLLBACK se pueden realizar para recuperar los datos perdidos.
Después de la ejecución de 'TRUNCAR' operación, COMMIT y ROLLBACK no se pueden realizar para recuperar los datos perdidos.
'SOLTAR' El comando se usa para eliminar la tabla o la clave como la clave principal / clave externa.
Q # 51) Basado en la tabla dada, resuelva las siguientes consultas.
Mesa de empleados
a) Escriba el comando SELECT para mostrar los detalles del empleado con empid como 1004.
Consulta SQL:
|_+_|Resultado:
b) Escriba el comando SELECT para mostrar todos los registros de la tabla Empleados.
agregar elemento a la matriz de ejemplo de java
Consulta SQL:
|_+_|Resultado:
c) Escriba el comando SELECT para mostrar todos los registros del empleado cuyo nombre comienza con el carácter 'R'.
Consulta SQL:
|_+_|Resultado:
D) Escriba un comando SELECT para mostrar la identificación, la edad y el nombre de los empleados con su edad tanto en orden ascendente como descendente.
Consulta SQL:
|_+_|Resultado:
|_+_|
Resultado:
es) Escriba el comando SELECCIONAR para calcular la cantidad total de salario de cada empleado de la siguiente tabla Emp.
Tabla emp:
Consulta SQL:
|_+_|Resultado:
Conclusión
Este es el conjunto de preguntas y respuestas de la entrevista de la base de datos que se formulan principalmente en la entrevista.
La mayoría de los aspectos básicos de cada tema se cuestionan en las entrevistas. Es un hecho bien conocido por todos que, si sus conceptos básicos son claros, puede alcanzar alturas máximas.
Sin embargo, puede haber algunas preguntas más complicadas. Solo tenga confianza y enfrente cada pregunta con claridad en su conocimiento del tema.
Otras lecturas:
- Principales preguntas de la entrevista SQL
- Principales preguntas de la entrevista sobre pruebas de bases de datos
- Principales preguntas de la entrevista sobre modelado de datos
- Principales preguntas de la entrevista de SQL Server
Lectura recomendada
- Las 32 mejores preguntas y respuestas de las entrevistas de Datastage
- 31 preguntas y respuestas principales de la entrevista de pruebas de bases de datos
- Más de 40 mejores herramientas de prueba de bases de datos: soluciones de prueba de datos populares
- Guía completa de pruebas de bases de datos (por qué, qué y cómo probar datos)
- Los 30 software de administración de bases de datos más populares: lista completa
- Más de 50 preguntas y respuestas principales de entrevistas de base de datos