Para entender qué significa realmente "Big Data", resulta útil conocer ciertos antecedentes históricos. Estos antecedentes datan algunos años atrás aproximadamente en los años setenta y principios de los ochenta el funcionamiento de los negocios era con base en el uso de informes de mercado quincenales de ACNielsen. En donde se podía observar datos de la competencia y mercado por ejemplo: promociones, publicidad, gastos, estrategias, planes y gastos. Tiempo después, Information Inc. (IRI) ofreció instalar escáneres gratuitos en puntos de ventas (POS) en ubicaciones minoristas a cambio de datos residuales del escáner. Este intercambio favoreció en gran mayoría a los minoristas debido a que la mano de obra tiene un mayor coste a diferencia del coste del valor de los datos de escáneres de POS. Los cuales se consideraban Big Data en ese momento, provocando un gran cambio en el mundo tecnológico.
Estos datos se fueron incrementando, pasando de megabytes a terabytes, por lo que se surgió la necesidad de plataformas de almacenamiento y servidores. Estos equipos se trataran a detalle más adelante, así como las aplicaciones que tiene hoy en día.
Figura 1. Imagen ilustrativa de conceptualización del Big Data.
En cuanto a la definición del Big Data no existe un estándar sin embrago se puede hacer referencia como una colección de datos grande, complejos, muy difícil de procesar a través de herramientas de Gestión y procesamiento de datos tradicionales. Otra definición provisional es el Big Data como datos cuyo volumen, diversidad y complejidad requieren nueva arquitectura, técnicas, algoritmos y análisis para gestionar y extraer valor y conocimiento oculto en ellos. También en el 2011 Manyika J. junto con otros investigadores definen Big Data como el conjunto de datos cuyo tamaño va más allá de la capacidad de captura, almacenado, gestión y análisis de las herramientas de base de datos.
Figura 2. Características de importancia del Big Data
Una base de datos es un conjunto de datos interrelacionados. Cuando se habla de base de datos relacional se hace referencia a la teoría del modelo de datos relacional obra del investigador de IBM Edgar Codd en 1970 y que goza de una fuerte base matemática. El modelo relacional se caracteriza a muy grandes rasgos por disponer que toda la información que debe de estar contenida en tablas, y las relaciones entre datos deben ser representadas explícitamente de ese mismo modo. Lo que se consigue con este modelo es trabajar siempre sobre tablas relacionadas entre sí. Evitando duplicidad de registros y garantizando la integridad referencial, es decir, que si se elimina un registro, se eliminan todos los relacionados. El gran inconveniente que presenta es el tiempo necesario para manejar grandes cantidades de datos, pero esto se logra gracias al Big Data.
Por otro lado lo que se consigue al trabajar con bases de datos es combinar diferentes tipos de datos y de una manera formalizada. Por lo tanto las ventajas de una base de datos relacional se podrían definir en:
Como se ha venido comentando, el tratamiento de Big Data ha exigido el desarrollo de soluciones computacionales que permitan afrontar las necesidades y retos que traen consigo los grandes volúmenes de datos, su variedad de fuentes y la velocidad con que se generan. A continuación, se da una breve descripción de algunas tecnologías y técnicas de Big Data, los artículos referenciados en esta sección comprenden algunos de los documentos “ramas” encontrados en la exploración con la herramienta ToS, otros hacen parte de la búsqueda inicial en Scopus y otros son fuentes adicionales consultadas por los autores para ampliar el tema y cubrir el objetivo de brindar una visión del estado del arte referente a la temática abordada
Gestión del cambio:
Figura 3. Gráfica de medición de beneficios del Big Data
Figura 4. Aplicaciones del Big Data
A continuación se hará mención de algunas de las tendencias que se implementaron o se pretenden implementaran en este 2018.
Otra vertiente que se tienen en el mundo de los negocios, es la generación de las bases de datos a analizar. En este caso, expondremos equipos de uso general que ayudan a obtener información para posteriormente ser analizadas.
La marca MCC de Logicbus ofrece los siguientes productos los cuales ofrecen tratamiento de gran cantidad de datos y adquisición de datos, los cuales son los siguientes:
Tarjeta DAQ HAT para Raspberry Pi. 8 Entradas Analogas de terminal comun, 12 bit, 100KS/s. Rango + -10VDC. Alimentacion: 333 V proporcionada por la Raspberry pi. Se pueden apilar hasta ocho dispositivos MCC 118. Raspberry Pi no incluida
Tarjeta DAQ HAT para Raspberry Pi. 8 Entradas Analogas de terminal comun, 12 bit, 100KS/s. Rango + -10VDC. Alimentacion: 333 V proporcionada por la Raspberry pi. Se pueden apilar hasta ocho dispositivos MCC 118. Raspberry Pi no incluida
El DT9834 es una serie de módulos de adquisición de datos USB (DAQ) de alta velocidad y alto rendimiento. Estos módulos DAQ USB están disponibles en una variedad de configuraciones, lo que le permite elegir la cantidad de canales de E / S analógicos y el empaque que se adapte a su aplicación.
La combinación de la USB-TC con el Software DAQ totalmente gratuito te brinda una solución completa de adquisición de datos que te ayudan a realizar mediciones de temperatura en minutos. El dispositivo es completamente "plug and play" y fácil de utilizar. Obtiene todos sus requerimientos de energía del puerto USB, por lo tanto no requiere conexión de energía adicional.
Ademas de existir software como IoTstar desarrollado por ICP DAS para su uso en la supervisión y gestión remota de los controladores PMC / WISE en una variedad de aplicaciones industriales. IoTstar ofrece una interfaz web fácil de usar e intuitiva que permite a los usuarios implementar la configuración del sistema y la supervisión en los controladores remotos con unos pocos clics; no se requiere programación.
Después de que la conexión de red se genera entre los controladores remotos PMC / WISE y el IoTstar a través de la red Ethernet / 3G, el IoTstar puede comunicarse con los controladores remotos para implementar la configuración del sistema, monitoreo de estado y actualización de firmware (funciona incluso si el controlador en un entorno de configuración de Dominio de IP Privado, por ejemplo: Localizar detrás del Cortafuegos o usar una IP virtual dinámica).
Con la tarjeta microSD, el controlador puede proporcionar la función del registrador de datos a los datos de registro en tiempo real de los sensores y módulos de E / S y enviar los archivos de registro de datos a la IoTstar a través del protocolo FTP. Cuando IoTstar recibe los archivos de registro de datos de los controladores remotos PMC / WISE, importará el contenido de estos archivos en la base de datos. Y luego, estos datos grabados se pueden recuperar directamente de la base de datos para el análisis futuro de la información mediante el software SCADA, la herramienta de análisis de datos (por ejemplo: Microsoft Power BI, Google Data Studio) o el servicio en la nube.
IoTstar se puede instalar en una plataforma general de PC y funciona como un sistema de nube privada. También se puede instalar en Microsoft Azure, IBM Bluemix o Amazon AWS, etc. y funciona como un sistema de nube pública. Al usar IoTstar, es fácil construir un sistema de monitoreo remoto y administración de la nube IoT, y durante todo el proceso de desarrollo del sistema; no se requiere programación; solo realiza algunas configuraciones en el controlador PMC / WISE y en IoTstar; luego, los usuarios podrían integrar rápidamente el sensor y los datos del módulo de E / S con el sistema IoT Cloud. Es una solución IoT Cloud fácil de usar y fácil de construir para las aplicaciones IoT y Big Data.
Cloud Service
Los sevicios de almacenamiento en la nube son de gran ayuda para mantener el control de los registros. Los beneficios que ofrece son contar con los productos necesarios de manera inmediata para la implementacion de sus proyectos, reduciendo drasticamente el tiempo de salida al mercado.
InduSoft Web
Es un entorno de desarrollo integrado, la cual le permite diseñar, desarrollar, buscar soluciones, y hacer mantenimiento de sus aplicaciones HMI/SCADA, además implementarlos en diferentes plataformas (Sistemas Operativos). A pesar de que el entorno de desarrollo (y su proyecto) es el mismo para cualquier plataforma, Indusoft ofrece diferentes ediciones de runtime adecuadas para limitaciones técnicas y comerciales en cada plataforma, por ejemplo runtime versión full InduSoft Web Studio, runtime en EmbeddedView y runtime en CEView.
Gracias a las aplicaciones que ha ido teniendo el Big Data hoy en día el proceso de buscar posicionamiento y gusto hacia los mercados de negocios, es práctico y más aún por los equipos que existen hoy en día para la adquisición y procesamiento de datos que ayudan a llevar a cabo estos cálculos estadísticos tediosos y en ocasiones complejos, dependiendo del tamaño de los datos.
Al mismo tiempo en los estudios de mercado actuales se pueden tener en forma rápida retroalimentación del mismo, incluso a nivel mundial sin tener que esperar mucho tiempo, que era lo que se hacía antes con un “focus group” o encuesta.
Figura 5. Arquitectura IoTstar