Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Aquí hay una pregunta: ¿qué hacen los Teslas autoconductores, los cálculos de intercambio de dinero de autogestión, los hogares entusiastas, los arreglos de transporte que satisfacen los transportes extremadamente rápidos en el mismo día, y una información abierta que distribuye las acciones de la policía de Nueva York a todos los efectos?

Por un lado, son señales de que nuestra realidad está cambiando a velocidad de giro, debido a nuestra capacidad de captar y examinar un número cada vez mayor de información de manera cada vez más rápida que antes.

En cualquier caso, por si acaso, si miras con atención, verás que cada una de estas aplicaciones requiere un tipo de información excepcional:

Los vehículos que se conducen por sí mismos reúnen constantemente información sobre cómo la condición de su vecindario está cambiando a su alrededor.

El autogobierno intercambiando cálculos no deja de reunir información sobre la evolución de los sectores comerciales.

Nuestras astutas casas filtran lo que pasa en ellas para controlar la temperatura, distinguir los que cruzan las puertas y reaccionar a nuestro llamado (“Alexa, toca algo de música relajante”).

Nuestra industria de venta al por menor muestra cómo sus ventajas se mueven con tal exactitud y productividad que un modesto transporte en el mismo día es una extravagancia que un gran número de nosotros subestima.

La policía de Nueva York rastrea sus vehículos para poder considerarlos cada vez más responsables (por ejemplo, para examinar los tiempos de reacción del 911).

Estas aplicaciones dependen de un tipo de información que estima cómo cambian las cosas después de algún tiempo. Donde el tiempo no es sólo una medida, sino un pivote esencial. Esta es una información de orden temporal y está comenzando a asumir un trabajo más grande en nuestra realidad.

Los ingenieros de programación usan diseños que a partir de ahora reflejan esto. A decir verdad, en el curso de los últimos meses las bases de datos de ordenación temporal (TSDB) han seguido siendo consistentemente la clasificación de bases de datos de más rápido desarrollo:

¿Qué son los datos de ordenación del tiempo?

Algunos consideran que los “datos de ordenación temporal” son una agrupación de focos de información, que estiman algo muy similar después de algún tiempo, guardado en la solicitud de tiempo. Eso es válido, sin embargo, sólo comienza a exponer lo que hay debajo.

Otros pueden pensar en una progresión de cualidades numéricas, cada una de las cuales coincide con una marca de tiempo, caracterizada por un nombre y un montón de medidas con nombre (o “etiquetas”). Este es tal vez un enfoque para mostrar la información de la ordenación del tiempo, pero no un significado de la información en sí.

Aquí hay una delineación fundamental. Los sensores de visión recogen información de tres entornos: una ciudad, un rancho y una planta. En este modelo, cada una de estas fuentes envía intermitentemente nuevas lecturas, haciendo una progresión de las estimaciones recogidas después de algún tiempo.

Aquí hay otro modelo, con información genuina de la ciudad de Nueva York, que muestra los viajes en taxi para los primeros momentos del 2018. Como debería ser obvio, cada línea es una “estimación” recogida en un momento determinado:

Hay numerosos tipos diferentes de información sobre la ordenación del tiempo. Para dar algunos ejemplos: DevOps observando la información, flujos de ocasión de aplicaciones versátiles/web, información de máquinas modernas, estimaciones lógicas.

Estos conjuntos de datos comparten esencialmente 3 cosas a todos los efectos:

La información que aparece se registra con bastante frecuencia como otra sección

La información llega regularmente a tiempo solicitud

El tiempo es un pivote esencial (los intervalos de tiempo pueden ser ordinarios o impredecibles)

Al final del día, la información sobre el tiempo que queda es en su mayor parte “pegada como si fuera”. Si bien es posible que tengan que abordar la información incorrecta más adelante, o manejar información diferida o no solicitada, se trata de casos especiales, no de la norma.

Se preguntarán: ¿Cómo es esto único en relación con el simple hecho de tener un campo de período en un conjunto de datos? Considerando todas las cosas, depende: ¿cómo rastrea tu conjunto de datos los cambios? ¿Refrescando el pasaje actual, o incorporando otro?

Cuando reúnes otra revisión para sensor_x, ¿sobreescribes tu revisión anterior, o haces una nueva revisión en una columna diferente? Mientras que las dos estrategias le darán la condición actual del marco, con sólo componer la nueva lectura en una columna diferente tendrá la opción de seguir todas las condiciones del marco después de algún tiempo.

Básicamente: los conjuntos de datos de ordenación del tiempo siguen los cambios en el marco general como suplementos, no como actualizaciones.

Este acto de registrar cada cambio en el marco como otra línea distintiva es lo que hace que la información sobre el tiempo sea tan increíble. Nos permite medir el cambio: desglosar cómo algo cambió antes, visualizar cómo algo está cambiando en el presente, prever cómo podría cambiar más adelante.

En pocas palabras, esta es la manera en que me gusta caracterizar la información de la ordenación del tiempo: información que, de manera agregada, habla de cómo un marco/proceso/conducta cambia después de un tiempo.

Esto es algo más que una calificación académica. Basando nuestra definición en “transformar”, podemos empezar a distinguir conjuntos de datos de orden temporal que no estamos reuniendo hoy, pero que deberíamos reunir más adelante. La verdad es que a menudo los individuos tienen información sobre el orden temporal, pero no la entienden.

Imagina que mantienes una aplicación web. Cada vez que un cliente se registra, puedes simplemente refrescar una marca de tiempo de “último_login” para ese cliente en un solo empujón en tu tabla de “clientes”. Sea como fuere, imagina un escenario en el que tratas cada inicio de sesión como una ocasión diferente, y los reúnes después de un tiempo. En ese punto podrías: rastrear el movimiento de los auténticos login, percibir cómo el uso se (in-/de-)arruga después de algún tiempo, lavar los clientes por la frecuencia con la que llegan a la aplicación, y eso es sólo la punta del iceberg.

Este modelo representa un punto clave: al salvaguardar la naturaleza característica de ordenación temporal de nuestra información, podemos proteger datos significativos sobre cómo cambia esa información después de algún tiempo. Otro punto: la información ocasional es también información de orden temporal.

Obviamente, guardar la información en este objetivo acompaña a una cuestión innegable: se termina con una tonelada de información, bastante rápida. Con el objetivo de que ese es el truco: la información de los arreglos de tiempo se acumula rápidamente.

El hecho de disponer de una gran cantidad de información plantea problemas cuando se la cronifica y se la cuestiona de manera eficaz, razón por la cual las personas se dirigen actualmente a las bases de datos de orden cronológico.