DICCIONARIO DE INFORMÁTICA Y TECNOLOGÍA
  ¿Qué significa sincronización de datos? - Información sobre sincronización de datos

Definición de sincronización de datos

Leandro Alegsa (Contacto) 2019-06-07

Envíanos un mensaje


Enviar
Anuncios

Tipo de sincronización empleado en la informática.

NOTA: Para entender primero qué significa sincronización, sugiero leer el artículo: sincronización.


Sincronización en informática

En informática, la sincronización se refiere a uno de dos conceptos distintos pero relacionados: la sincronización de procesos y la sincronización de datos.

La sincronización de procesos se refiere a la idea de que múltiples procesos deben unirse o darse la mano en un momento dado, con el fin de llegar a un acuerdo o comprometerse con una determinada secuencia de acción.

La sincronización de datos se refiere a la idea de mantener múltiples copias de un conjunto de datos en coherencia entre sí, o para mantener la integridad de los datos. Las primitivas de sincronización de procesos se utilizan comúnmente para implementar la sincronización de datos.

Esquema que representa la sincronización de datos en informática.
Esquema que representa la sincronización de datos en informática.


Sincronización de datos

La sincronización de datos se refiere a la necesidad de mantener múltiples copias de un conjunto de datos coherentes entre sí o de mantener la integridad de los datos. Por ejemplo, la replicación de bases de datos se utiliza para mantener múltiples copias de datos sincronizadas con servidores de bases de datos que almacenan datos en diferentes ubicaciones.

Ejemplos de sincronización de datos:

- Sincronización de archivos, como la sincronización de un reproductor MP3 de mano con un ordenador de escritorio.

- Sistemas de archivos en clúster, que son sistemas de archivos que mantienen los datos o índices de forma coherente en todo un clúster informático.

- Coherencia de caché, manteniendo varias copias de datos sincronizadas entre varias memorias cachés.

- RAID, en el que los datos se escriben de forma redundante en varios discos, de modo que la pérdida de un disco no suponga una pérdida de datos.

- Replicación de la base de datos, donde las copias de datos en una base de datos se mantienen sincronizadas, a pesar de la posible gran separación geográfica.

- Journaling, una técnica utilizada por muchos sistemas de archivos modernos para asegurarse de que los metadatos de los archivos se actualizan en un disco de forma coherente y consistente.


Sincronización de archivos

En informática, la sincronización de archivos es el proceso de asegurarse de que dos o más ubicaciones contengan las mismas versiones de los archivos. Si se agrega, modifica o elimina un archivo de una ubicación, el proceso de sincronización agregará, modificará o eliminará el mismo archivo en las otras ubicaciones.

Leer el artículo completo: sincronizar archivos.


Desafíos en la sincronización de datos

Algunos de los desafíos que el usuario puede enfrentar en la sincronización de datos:

- complejidad de los formatos de datos
- hacerlo en tiempo real
- seguridad de datos
- calidad de los datos
- el rendimiento


Complejidad de los formatos de datos

Los formatos de datos tienden a volverse más complejos con el tiempo a medida que la organización crece y evoluciona. Esto resulta no sólo en la construcción de interfaces simples entre las dos aplicaciones (fuente y destino), sino también en la necesidad de transformar los datos mientras se transmiten a la aplicación de destino. Las herramientas ETL (extraction transformation loading) pueden ser útiles en esta fase para gestionar las complejidades del formato de los datos.


Rapidez en tiempo real

En los sistemas de tiempo real, los clientes quieren ver el estado actual de su pedido en e-shop, el estado actual de una entrega de paquetes -un seguimiento de paquetes en tiempo real-, el saldo actual de su cuenta, etc. Esto muestra la necesidad de un sistema en tiempo real, que también se está actualizando para permitir un proceso de fabricación sin problemas en tiempo real, por ejemplo, pedir material cuando la empresa se está quedando sin existencias, sincronizar los pedidos de los clientes con el proceso de fabricación, etc. De la vida real, existen muchos ejemplos en los que el procesamiento en tiempo real proporciona una ventaja competitiva y de éxito.


Seguridad de los datos

No existen reglas y políticas fijas para hacer cumplir la seguridad de los datos. Puede variar dependiendo del sistema que esté utilizando. Aunque la seguridad se mantiene correctamente en el sistema fuente que captura los datos, los privilegios de seguridad y de acceso a la información deben aplicarse también en los sistemas de destino para evitar cualquier posible uso indebido de la información. Es un problema grave, especialmente cuando se trata del manejo de información secreta, confidencial y personal. Por lo tanto, debido a la sensibilidad y confidencialidad, la transferencia de datos y toda la información intermedia debe ser encriptada.


Calidad de los datos

La calidad de los datos es otra limitación grave. Para una mejor gestión y para mantener una buena calidad de los datos, la práctica común es almacenar los datos en una ubicación y compartirlos con diferentes personas y diferentes sistemas y/o aplicaciones de diferentes ubicaciones. Ayuda a prevenir inconsistencias en los datos.


Desempeño o rendimiento

Hay cinco fases diferentes involucradas en el proceso de sincronización de datos:

1) extracción de datos del sistema fuente (o maestro, o principal);
2) transferencia de datos;
3) transformación de datos;
4) carga de datos en el sistema destino.
5) actualización de datos

Cada uno de estos pasos es crítico. En caso de grandes cantidades de datos, el proceso de sincronización debe planificarse y ejecutarse cuidadosamente para evitar cualquier impacto negativo en el rendimiento.


Soluciones basadas en archivos

Hay herramientas disponibles para la sincronización de archivos, control de versiones (CVS, Subversion, etc.), sistemas de archivos distribuidos (Coda, etc.), y réplicas (rsync, etc.), en el sentido de que todas ellas intentan mantener sincronizados conjuntos de archivos. Sin embargo, sólo el control de versiones y las herramientas de sincronización de archivos pueden tratar modificaciones en más de una copia de los archivos.

La sincronización de archivos se utiliza habitualmente para copias de seguridad domésticas en discos duros externos o para actualizaciones para el transporte en unidades flash USB. El proceso automático evita la copia de archivos ya idénticos, por lo que puede ahorrar un tiempo considerable en comparación con una copia manual, además de ser más rápido y menos propenso a errores. Para más información leer: sincronizar archivos.

Las herramientas de control de versiones están pensadas para tratar situaciones en las que más de un usuario intenta modificar simultáneamente el mismo archivo, mientras que los sincronizadores de archivos están optimizados para situaciones en las que sólo se edita una copia del archivo a la vez. Por esta razón, aunque las herramientas de control de versiones se pueden utilizar para la sincronización de archivos, los programas dedicados requieren menos gastos generales.

Los sistemas de archivos distribuidos (o de red) también pueden ser vistos aseguradores de que que múltiples versiones de un archivo estén sincronizadas. Esto normalmente requiere que los dispositivos que almacenan los archivos estén siempre conectados, pero algunos sistemas de archivos distribuidos como Coda permiten una operación desconectada seguida luego de una reconciliación. Las facilidades de fusión de un sistema de ficheros distribuido son típicamente más limitadas que las de un sistema de control de versiones porque la mayoría de los sistemas de ficheros no mantienen un gráfico de versión. Para más información leer: sistema de archivos de red.

Espejo o mirror (computación): Una réplica es una copia exacta de un conjunto de datos. En Internet, un sitio espejo es una copia exacta de otro sitio de Internet. Los sitios espejo son los más utilizados para proporcionar múltiples fuentes de la misma información, y son de particular valor como una forma de proporcionar un acceso fiable a grandes descargas.


Gestión de errores

En los sistemas con tolerancia a fallos, las bases de datos distribuidas deben ser capaces de hacer frente a la pérdida o corrupción de (parte de) sus datos. El primer paso suele ser la replicación, que implica hacer múltiples copias de los datos y mantenerlos actualizados a medida que se realizan los cambios. Sin embargo, es necesario decidir en qué copia confiar cuando se produce la pérdida o la corrupción de una instancia.

El enfoque más simple es tener una sola instancia maestra que sea la única fuente de verdad. Los cambios se replican en otras instancias, y una de ellas se convierte en el nuevo maestro cuando el viejo falla.

Paxos y Raft son protocolos más complejos que existen para resolver problemas con efectos transitorios durante la conmutación por error, como por ejemplo dos casos en los que se piensa que son el maestro al mismo tiempo.

Compartir en secreto es útil si las fallas de nodos enteros son muy comunes. Esto hace que la sincronización pase de un proceso de recuperación explícito a formar parte de cada lectura, donde la lectura de algunos datos requiere la recuperación de datos codificados de varios nodos diferentes. Si los datos corruptos o desactualizados pueden estar presentes en algunos nodos, este enfoque también puede beneficiarse del uso de un código de corrección de errores.

DHTs y Blockchains intentan resolver el problema de la sincronización entre muchos nodos (cientos a miles de millones).





¿Mejoramos la definición?
Puntos: 0 (0 votos)







Respondemos tus consultas o comentarios a continuación:


¿Dudas? ¿necesita más información? Escriba y responderemos a tu email: clic aquí



 




  Diccionario de informática
  Búsqueda por letras:

A - B - C - D - E - F - G - H - I - J - K - L - M - N - O - P - Q - R - S - T - U - V - W - X - Y - Z - 0,9
 
Búsqueda por categorías
:

Almacenamiento - Aplicaciones - Audio - Compresión - Desarrollo web - Discos ópticos - Inteligencia Artificial - Memorias - Microprocesadores - Seguridad informática - Sistemas de archivos - Terminología de programación - UNIX - Windows - ver categorías

 
Búsqueda por palabras:






Preguntas

No hay ningún comentario todavía

Todos los derechos reservados © 1998 - 2018 - ALEGSA - Santa Fe, Argentina.
Políticas del sitio web - Contacto - Publicidad