lunes, 20 de julio de 2015

tecnologia emergentes

EXPOSICIÓN DEL EQUIPO N°8


TEMA:
Uso de las Tecnológia Emergente en la Administración del Ciclo de Vida de la Información.
 






















                                                                                                                                                                                   




USOS DE LAS TECNOLOGÍAS EMERGENTES EN LA ADMINISTRACIÓN DEL CICLO DE VIDA DE LA INFORMACIÓN:
EMC2 es una compañía que se dedica única y exclusivamente al almacenamiento. Es una empresa que tiene 25 años en el mercado, 20 dedicados al almacenamiento. En Venezuela ya tiene 10 años, inicialmente representada por distintos canales, y desde hace 6 años existe presencia directa en el país. Nuestro primer mercado es el servicio en soluciones de almacenamiento.
Ésta es una problemática que en general enfrentamos todos, corporaciones, empresas y pequeñas empresas o entes gubernamentales, ya que siempre estamos luchando con una gran cantidad de factores.
Los principales factores que estamos viendo desde el punto de vista de almacenamiento suelen repetirse, y además están los costos. Se tiene que pelear con presupuestos cada vez más recortados, posiblemente se mantengan en algunos casos, depende del negocio, pero se tiene un crecimiento de la información que según fuentes son de alrededor del 60% de crecimiento en promedio en el mundo. Y eso no sólo no para sino que se esta arrastrando la cantidad de datos que se han generado anteriormente. Todos esos datos hay que almacenarlos, hacerlos disponible y protegerlos. Éste el otro punto que nos lleva a estar viendo, cada vez más, nuevas tecnologías para tener mejor manejo de información, que también debe ser recuperable en caso de cualquier problema.
 Pueden presentarse diversos problemas operativos, entre otros. Muchas de estas situaciones han obligado a que los gobiernos generen reglamentaciones.
         Existen 16.000 nuevas reglamentaciones a nivel mundial, que todas las compañías tienen que estar manejando y tomando en cuenta para la preservación de la información que se maneja. Adicional a eso se debe mantener la justicia, se tiene mayor cantidad de información que manejar, hay que disminuir costos y hay que protegerlas. Existe un crecimiento que no para y a la vez hay que mantener simplicidad.
         Realmente es un problema que hay que ver con otra visión y por eso esta Administración del Ciclo de Vida de la Información.
         Entonces, como concepto, básicamente es una estrategia para alinear el negocio o el IT al negocio y eso se viene haciendo de muchas maneras, no es nada nuevo. El detalle es que ahora se tiene que adaptar precisamente independencia en base al valor de la información, asumiendo que el valor de la información es diferente y que la información tiene un ciclo en donde es creada, donde llega a un valor máximo, en algún momento llega a un valor mínimo y ese valor mínimo puede ser momentáneo, pero aún así hay reglamentaciones que llevan a guardarla.
         Siempre hay que guardarlo porque puede ser momentáneo, en otro momento para la misma organización puede ser muy importante.
         Básicamente, para tratar de dejar claro el concepto, es tener la información en los equipos de almacenamiento necesarios o en la infraestructura necesaria, en el momento necesario y siempre tomando en cuenta que debe tener un costo adecuado. Tomemos como ejemplo los cheques. El cheque tiene mucho valor cuando es creado y mientras está en todo el proceso en el que se hace efectivo, y para el banco tiene un valor posterior. Llega un momento de un valor máximo pero que posteriormente para el banco ya no es importante. Ahora, no es importante como transacción pero tiene una importancia histórica tanto para el banco como para el cliente. Eso se está viendo muchísimo en bancos a nivel mundial que tienen imágenes de cheques y estamos hablando nada más que de imagen, no como datos- imágenes archivadas y son accesibles a los clientes a través de Internet.
         Esto también se puede aterrizar o adaptar a un modelo como por ejemplo el de PDVSA. Los datos de sísmica de PDVSA tiene vida hasta por 30 o 40 años. Son creados, son procesados, se estudian, se explotan, luego de hacer toda la exploración los proyectos son cerrados, pero son cerrados porque ya Usos de las tecnologías emergentes en la administración del ciclo de vida de la información.  
         No generan un petróleo de inmediato, pero esos procesos se cierran y esa data debe ser archivada. En años posteriores, cinco, seis, diez años, es posible que esos proyectos de pozos se reactiven para hacer nuevos estudios y para poder buscar otras fuentes de petróleo o derivados del petróleo.
         Cómo lo ve EMC2, básicamente son cinco componentes, siendo el primero el almacenamiento. Pero no con el concepto habitual, sino con un almacenamiento pensado en niveles, ya que como cada dato tiene un valor diferente, no tiene que estar siempre almacenado con el mismo tipo de almacenamiento.
         En la actualidad se puede estar viendo almacenamiento on-line y el almacenamiento en tape, pero resulta que no todos aplican para el tipo de manejo que se le tiene que dar a esta información. Entonces ya han salido al mercado muchísimas otras tecnologías. Cada uno de estos bloques tienen muchas tecnologías internas, con diferentes niveles en donde cada uno tiene, evidentemente, diferentes costos, diferente funcionalidad y que va a permitir que el dato sea accesado dependiendo de la importancia que tenga para el cliente.
Ahora, todos esos datos, no importa en qué nivel están, deben ser protegidos y deben permitir su rápida recuperación en base a su valor.
Hay muchos de ellos que no tienen mucho valor y que se puede tener en tape, guardado en una cinta a cierta cantidad de distancia del site principal por razones de seguridad y que cuando sea requerida su recuperación, se pueda traer en dos días. Pero hay data que se necesita ya. Entonces cada nivel debe tener una estrategia de protección y recuperación.
Ya se tiene la parte básica, la parte dura, se tienen los datos protegidos, pero se necesita también moverlos, porque si se tienen en diferentes niveles de almacenamiento, son equipos de almacenamiento diferentes. Utilizándolos de esa manera, tengo que tener la manera de moverlos automáticamente basado en políticas, que inicialmente pueden ser válidas para IT, pero que a la vez posteriormente pueden ser atadas a políticas del negocio o de la institución, o del ente gubernamental, políticas que evidentemente van atadas a unos objetivos.
 Entonces esa es la parte de movimiento de datos. Aún más arriba está  administración de la información y el contenido, que es la parte ya inteligente, es realmente ésta la que a través de las herramientas que existen en la capa de movimiento de datos, nos permite atar esas estrategias o esas políticas del negocio al movimiento de los datos. Y por último cada una de ellas genera una complejidad adicional y esa complejidad se tiene que enmascarar porque si no nunca se va a llegar a poder manejar tanta cantidad de información. Entonces hay que tener herramientas de administración de toda la infraestructura que está incluida en todas las tecnologías. Como componente de información, se debe tener una manera de verlas como un todo y tener las maneras centralizadas de manejarlas.
Por ejemplo, hablando del primer bloque, consiste específicamente en los equipos de almacenamiento o la oferta de almacenamiento en cuanto a hardware de EMC2, empezando desde distintos niveles, digamos que enter level en cuanto a industrias hasta llegar a equipos muy grandes de centenares de terabytes.
Existe una cantidad de tecnologías adicionales a la cantidad de datos, duros en cuanto a infraestructura o a hardware. Ahora, todo esto tiene que estar atado a niveles de servicio, básicamente cada nivel de servicio va a tener un costo, y para hacer el match cada equipo direcciona en cada uno de esos mercados. Éstas son las cosas que se deben estar buscando para tener conectados tantos equipos, soportar tantos sistemas operativos. A nivel macro hay que estar pensando que no siempre vamos a tener un solo vendedor, esto es heterogéneo, que vamos a necesitar mantener los datos en diferentes equipos y que tenemos que asociarlos a nuestros propios niveles de servicio.
También hay que protegerlos. Existe una protección local y una protección remota que es Disaster Recovery y da protección en caso de desastres en el sitio principal. Pero entonces necesitamos la plataforma, a la vez se necesita hacerle backup operativo y se va a estar siempre pendientes de que ese backup operativo permita preservar los datos del negocio. Pero no es solamente que simplemente se respalda sino que también estar seguro de la recuperación; entonces debo que tener seguridad de que la protección de los datos está cubierta tanto local como remotamente.
Usos de las tecnologías emergentes en la administración del ciclo de vida de la información.
Tres criterios o variables muy importantes: tiempo, disponibilidad y distancia. El tercer layer es el de los movimientos de los datos. Se puede tener en base a tecnologías que ya están en el mercado, necesidades de performance, necesidades como mucha capacidad pero poco performance, contenido fijo, data histórica que ya no se necesita, y los medios cuando se requiere guardar una bóveda o algo por el estilo. Todo eso existe pero son equipos diferentes. Necesito equipos que me permitan el movimiento automático basado en política, que nadie se de cuenta desde el punto de vista de aplicación.
Es fundamental que se mantenga la integridad de la información y, adicionalmente, que se pueda aprovechar la infraestructura que ya existe. Ahora, al nivel de inteligencia, tengo diferentes tipos de datos.
Tengo una cantidad de archivos planos regados en todas mis organizaciones, que son los datos no estructurados. Esos datos en algunos casos son archivos Office, en otros casos son imágenes y documentos muy importantes para una organización. Tengo a la vez datos semi estructurados, que son base de datos propietarias, donde no hay una estructura formal, pero son muy importantes, manejan aplicaciones muy importantes, almacenan datos muy importantes para la corporación. Y tenemos los estructurados, que son básicamente las bases de datos. Cada uno de ellos debe ser tratado de manera diferente. Debería estar visualizado en mi estrategia tener herramientas para cada uno de ellos, que a futuro sean integrables.
    Al final veamos el quinto bloque. Cada uno de ellos es una cantidad de componentes tecnológicos que me van a crear una complejidad mayor. Debo buscar una apariencia, digamos estándar, hablando de Windows, que todos conocemos y que es fácil manejar para nosotros, uso de las comunicaciones, metodologías estándares y administración de eventos como un todo. Tienen que ser centralizados, que me permitan enmascarar toda la complejidad que esto trae.
Esto no va solo, para una cantidad de metodologías necesitamos implementar servicios y eso precisamente por involucrar y estar hablando de tecnologías heterogéneas, necesitamos trabajar con socios, no solamente uno solo.
Pero lo más importante de cómo encarar esto es ver el proceso, la estrategia como un proceso continuo, porque definitivamente son muchas tecnologías, son muchos los problemas que vamos a estar tratando de solucionar, entonces no vamos a verlo como una sola implementación, es algo que lleva pasos, son pasos que se planifican, se miden, y se ve que se estén ejecutando como debe ser y se puede hacer por aplicaciones. Esto es algo que debe empezar de esa manera porque sino puede generar problemas graves.
Solamente un ejemplo. Podemos tener un primer paso de infraestructura en niveles, asegurarnos que tenemos buenos respaldos y recuperación, establecemos cuáles son los niveles y la importancia de cada uno de ellos, implementamos cierto nivel de automatización en la administración, nos interesa, estamos centralizando, debemos administrar.
Un siguiente paso es ir por aplicación. Cada una de éstas son diferentes tipos de datos. Hay en el mercado muchísimas soluciones diferentes muy puntuales, pero lo único que tenemos que estar viendo al visualizar todo esto como estrategia es que debemos poder integrarlas acá.
Otra cosa que es muy importante, sobre todo para el tema gubernamental, es la certificación. Tenemos esquemas de certificación, que la gente conozca esto, porque manejar el dato, que es lo más importante en toda nuestra infraestructura de tecnología, es preservar ese dato. Necesitamos gente que conozca y tenga certificaciones para el manejo de todo este tipo de tecnología con la que vamos a estar trabajando.
Para resumir: Administración del Ciclo de la Información, es una estrategia para la administración proactiva de la información.
 Incluye cinco elementos muy importantes:
 1) Tiene que estar centrada en el negocio.
 2) Unificada para todos los datos, no importa el tipo de dato,si es estructurado, no es estructurado, semi estructurado, debemos incluirlo.
3) Está basada en políticas porque tenemos que ligarla con el negocio definitivamente, tenemos que tener la manera de ligarla con el negocio y de hacerla automática, no podemos estar administrando esto nosotros.
4) Es heterogénea, tenemos muchísimos componentes, no necesariamente siempre estamos pensando que es un solo proveedor.
5) debe estar alineada al valor de la información, cada uno de esos niveles debe ser el adecuado para esa información en ese momento dado.


No hay comentarios:

Publicar un comentario