28 de octubre de 2023
¿Qué son los datos?
Actualmente vivimos un boom por los datos, pero ¿Qué son?
Según la RAE :
dato
Del lat. datum 'lo que se da'.
-
m. Información sobre algo concreto que permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho. A este problema le faltan datos numéricos.
-
m. Documento, testimonio, fundamento.
-
m. Inform. Información dispuesta de manera adecuada para su tratamiento por una computadora.
Para obtener valor de los datos, lo primero es recopilarlos, en DTools entendemos que existen dos formas:
- Mediante nuestros sentidos: Absolutamente todo lo que captan nuestros sentidos son datos que convertimos en información sea consciente o inconscientemente lo cual deriva en nuestra intuición.
- Mediante las computadoras: Absolutamente todo lo que podemos recopilar mediante una computadora, acá entran los datos estructurados, que son aquellos que queremos obtener y están preformateados, sabemos qué, porqué y para qué, existen otros no estructurados que se recopilan en los artículos, videos, música, etc, que tienen que ver básicamente con la expresión humana y existen otros un poco mas escondidos que son los metadatos que es información de la información, en que formato esta almacenado, cuando se almaceno, que tamaño tiene etc, otro tipo de información pertenece al IOT o Internet de las cosas que es básicamente la información que podemos recoger de cualquier aparato conectado a internet, por ejemplo podemos saber el estado de nuestra lavadora desde nuestro celular.
Usar los datos
Como define la RAE, para utilizar los datos en nuestra computadora debemos disponerlos de forma adecuada, esto es extraerlos de nuestras fuentes, que pueden ser los sistemas de la compañía, hojas de cálculo, texto, etc.; una vez obtenidos los datos toca organizarlos para que tengan sentido.
La forma mas básica y popular de hacerlo es recopilarlos en una hoja de datos de Excel o Google Sheets, y para que tengan sentido y podamos sacarles provecho debemos seguir las siguientes pautas:
1. Siempre en formato de columna
2. Cada columna debe tener un tipo de datos, debemos definir si será de texto, fecha o numérico
3. La primera fila debe contener el título de nuestro dato
4. No debemos tener filas vacías