EXPOSICIÓN DEL EQUIPO N°8
|
TEMA:
Uso de las Tecnológia
Emergente en la Administración del Ciclo de Vida de la Información.
|
USOS DE LAS TECNOLOGÍAS EMERGENTES EN LA
ADMINISTRACIÓN DEL CICLO DE VIDA DE LA INFORMACIÓN:
EMC2
es una compañía que se dedica única y exclusivamente al almacenamiento. Es una
empresa que tiene 25 años en el mercado, 20 dedicados al almacenamiento. En
Venezuela ya tiene 10 años, inicialmente representada por distintos canales, y
desde hace 6 años existe presencia directa en el país. Nuestro primer mercado
es el servicio en soluciones de almacenamiento.
Ésta
es una problemática que en general enfrentamos todos, corporaciones, empresas y
pequeñas empresas o entes gubernamentales, ya que siempre estamos luchando con
una gran cantidad de factores.
Los
principales factores que estamos viendo desde el punto de vista de almacenamiento
suelen repetirse, y además están los costos. Se tiene que pelear con
presupuestos cada vez más recortados, posiblemente se mantengan en algunos
casos, depende del negocio, pero se tiene un crecimiento de la información que
según fuentes son de alrededor del 60% de crecimiento en promedio en el mundo.
Y eso no sólo no para sino que se esta arrastrando la cantidad de datos que se
han generado anteriormente. Todos esos datos hay que almacenarlos, hacerlos
disponible y protegerlos. Éste el otro punto que nos lleva a estar viendo, cada
vez más, nuevas tecnologías para tener mejor manejo de información, que también
debe ser recuperable en caso de cualquier problema.
Pueden presentarse diversos problemas
operativos, entre otros. Muchas de estas situaciones han obligado a que los
gobiernos generen reglamentaciones.
Existen 16.000 nuevas reglamentaciones
a nivel mundial, que todas las compañías tienen que estar manejando y tomando
en cuenta para la preservación de la información que se maneja. Adicional a eso
se debe mantener la justicia, se tiene mayor cantidad de información que manejar,
hay que disminuir costos y hay que protegerlas. Existe un crecimiento que no
para y a la vez hay que mantener simplicidad.
Realmente es un problema que hay que
ver con otra visión y por eso esta Administración del Ciclo de Vida de la
Información.
Entonces, como concepto, básicamente
es una estrategia para alinear el negocio o el IT al negocio y eso se viene
haciendo de muchas maneras, no es nada nuevo. El detalle es que ahora se tiene
que adaptar precisamente independencia en base al valor de la información,
asumiendo que el valor de la información es diferente y que la información tiene
un ciclo en donde es creada, donde llega a un valor máximo, en algún momento
llega a un valor mínimo y ese valor mínimo puede ser momentáneo, pero aún así
hay reglamentaciones que llevan a guardarla.
Siempre hay que guardarlo porque puede
ser momentáneo, en otro momento para la misma organización puede ser muy
importante.
Básicamente, para tratar de dejar
claro el concepto, es tener la información en los equipos de almacenamiento
necesarios o en la infraestructura necesaria, en el momento necesario y siempre
tomando en cuenta que debe tener un costo adecuado. Tomemos como ejemplo los
cheques. El cheque tiene mucho valor cuando es creado y mientras está en todo
el proceso en el que se hace efectivo, y para el banco tiene un valor
posterior. Llega un momento de un valor máximo pero que posteriormente para el
banco ya no es importante. Ahora, no es importante como transacción pero tiene una
importancia histórica tanto para el banco como para el cliente. Eso se está
viendo muchísimo en bancos a nivel mundial que tienen imágenes de cheques y
estamos hablando nada más que de imagen, no como datos- imágenes archivadas y
son accesibles a los clientes a través de Internet.
Esto también se puede aterrizar o
adaptar a un modelo como por ejemplo el de PDVSA. Los datos de sísmica de PDVSA
tiene vida hasta por 30 o 40 años. Son creados, son procesados, se estudian, se
explotan, luego de hacer toda la exploración los proyectos son cerrados, pero
son cerrados porque ya Usos de las tecnologías emergentes en la administración
del ciclo de vida de la información.
No generan un petróleo de inmediato,
pero esos procesos se cierran y esa data debe ser archivada. En años posteriores,
cinco, seis, diez años, es posible que esos proyectos de pozos se reactiven
para hacer nuevos estudios y para poder buscar otras fuentes de petróleo o
derivados del petróleo.
Cómo lo ve EMC2, básicamente son cinco
componentes, siendo el primero el almacenamiento. Pero no con el concepto
habitual, sino con un almacenamiento pensado en niveles, ya que como cada dato tiene
un valor diferente, no tiene que estar siempre almacenado con el mismo tipo de
almacenamiento.
En la actualidad se puede estar viendo
almacenamiento on-line y el almacenamiento en tape, pero resulta que no todos
aplican para el tipo de manejo que se le tiene que dar a esta información.
Entonces ya han salido al mercado muchísimas otras tecnologías. Cada uno de
estos bloques tienen muchas tecnologías internas, con diferentes niveles en donde
cada uno tiene, evidentemente, diferentes costos, diferente funcionalidad y que
va a permitir que el dato sea accesado dependiendo de la importancia que tenga
para el cliente.
Ahora,
todos esos datos, no importa en qué nivel están, deben ser protegidos y deben
permitir su rápida recuperación en base a su valor.
Hay
muchos de ellos que no tienen mucho valor y que se puede tener en tape,
guardado en una cinta a cierta cantidad de distancia del site principal por
razones de seguridad y que cuando sea requerida su recuperación, se pueda traer
en dos días. Pero hay data que se necesita ya. Entonces cada nivel debe tener
una estrategia de protección y recuperación.
Ya
se tiene la parte básica, la parte dura, se tienen los datos protegidos, pero
se necesita también moverlos, porque si se tienen en diferentes niveles de
almacenamiento, son equipos de almacenamiento diferentes. Utilizándolos de esa
manera, tengo que tener la manera de moverlos automáticamente basado en políticas,
que inicialmente pueden ser válidas para IT, pero que a la vez posteriormente
pueden ser atadas a políticas del negocio o de la institución, o del ente
gubernamental, políticas que evidentemente van atadas a unos objetivos.
Entonces esa es la parte de movimiento de
datos. Aún más arriba está administración
de la información y el contenido, que es la parte ya inteligente, es realmente
ésta la que a través de las herramientas que existen en la capa de movimiento de
datos, nos permite atar esas estrategias o esas políticas del negocio al
movimiento de los datos. Y por último cada una de ellas genera una complejidad
adicional y esa complejidad se tiene que enmascarar porque si no nunca se va a
llegar a poder manejar tanta cantidad de información. Entonces hay que tener herramientas
de administración de toda la infraestructura que está incluida en todas las
tecnologías. Como componente de información, se debe tener una manera de verlas
como un todo y tener las maneras centralizadas de manejarlas.
Por
ejemplo, hablando del primer bloque, consiste específicamente en los equipos de
almacenamiento o la oferta de almacenamiento en cuanto a hardware de EMC2, empezando
desde distintos niveles, digamos que enter level en cuanto a industrias hasta
llegar a equipos muy grandes de centenares de terabytes.
Existe
una cantidad de tecnologías adicionales a la cantidad de datos, duros en cuanto
a infraestructura o a hardware. Ahora, todo esto tiene que estar atado a
niveles de servicio, básicamente cada nivel de servicio va a tener un costo, y
para hacer el match cada equipo direcciona en cada uno de esos mercados. Éstas
son las cosas que se deben estar buscando para tener conectados tantos equipos,
soportar tantos sistemas operativos. A nivel macro hay que estar pensando que
no siempre vamos a tener un solo vendedor, esto es heterogéneo, que vamos a necesitar
mantener los datos en diferentes equipos y que tenemos que asociarlos a
nuestros propios niveles de servicio.
También
hay que protegerlos. Existe una protección local y una protección remota que es
Disaster Recovery y da protección en caso de desastres en el sitio principal.
Pero entonces necesitamos la plataforma, a la vez se necesita hacerle backup operativo
y se va a estar siempre pendientes de que ese backup operativo permita preservar
los datos del negocio. Pero no es solamente que simplemente se respalda sino
que también estar seguro de la recuperación; entonces debo que tener seguridad
de que la protección de los datos está cubierta tanto local como remotamente.
Usos
de las tecnologías emergentes en la administración del ciclo de vida de la
información.
Tres
criterios o variables muy importantes: tiempo, disponibilidad y distancia. El
tercer layer es el de los movimientos de los datos. Se puede tener en base a
tecnologías que ya están en el mercado, necesidades de performance, necesidades
como mucha capacidad pero poco performance, contenido fijo, data histórica que ya
no se necesita, y los medios cuando se requiere guardar una bóveda o algo por
el estilo. Todo eso existe pero son equipos diferentes. Necesito equipos que me
permitan el movimiento automático basado en política, que nadie se de cuenta desde
el punto de vista de aplicación.
Es
fundamental que se mantenga la integridad de la información y, adicionalmente,
que se pueda aprovechar la infraestructura que ya existe. Ahora, al nivel de
inteligencia, tengo diferentes tipos de datos.
Tengo
una cantidad de archivos planos regados en todas mis organizaciones, que son
los datos no estructurados. Esos datos en algunos casos son archivos Office, en
otros casos son imágenes y documentos muy importantes para una organización.
Tengo a la vez datos semi estructurados, que son base de datos propietarias,
donde no hay una estructura formal, pero son muy importantes, manejan
aplicaciones muy importantes, almacenan datos muy importantes para la
corporación. Y tenemos los estructurados, que son básicamente las bases de
datos. Cada uno de ellos debe ser tratado de manera diferente. Debería estar
visualizado en mi estrategia tener herramientas para cada uno de ellos, que a
futuro sean integrables.
Al final veamos el quinto bloque. Cada uno
de ellos es una cantidad de componentes tecnológicos que me van a crear una
complejidad mayor. Debo buscar una apariencia, digamos estándar, hablando de
Windows, que todos conocemos y que es fácil manejar para nosotros, uso de las
comunicaciones, metodologías estándares y administración de eventos como un
todo. Tienen que ser centralizados, que me permitan enmascarar toda la
complejidad que esto trae.
Esto
no va solo, para una cantidad de metodologías necesitamos implementar servicios
y eso precisamente por involucrar y estar hablando de tecnologías heterogéneas,
necesitamos trabajar con socios, no solamente uno solo.
Pero
lo más importante de cómo encarar esto es ver el proceso, la estrategia como un
proceso continuo, porque definitivamente son muchas tecnologías, son muchos los
problemas que vamos a estar tratando de solucionar, entonces no vamos a verlo
como una sola implementación, es algo que lleva pasos, son pasos que se
planifican, se miden, y se ve que se estén ejecutando como debe ser y se puede
hacer por aplicaciones. Esto es algo que debe empezar de esa manera porque sino
puede generar problemas graves.
Solamente
un ejemplo. Podemos tener un primer paso de infraestructura en niveles,
asegurarnos que tenemos buenos respaldos y recuperación, establecemos cuáles
son los niveles y la importancia de cada uno de ellos, implementamos cierto
nivel de automatización en la administración, nos interesa, estamos
centralizando, debemos administrar.
Un
siguiente paso es ir por aplicación. Cada una de éstas son diferentes tipos de
datos. Hay en el mercado muchísimas soluciones diferentes muy puntuales, pero
lo único que tenemos que estar viendo al visualizar todo esto como estrategia
es que debemos poder integrarlas acá.
Otra
cosa que es muy importante, sobre todo para el tema gubernamental, es la
certificación. Tenemos esquemas de certificación, que la gente conozca esto,
porque manejar el dato, que es lo más importante en toda nuestra
infraestructura de tecnología, es preservar ese dato. Necesitamos gente que
conozca y tenga certificaciones para el manejo de todo este tipo de tecnología
con la que vamos a estar trabajando.
Para
resumir: Administración del Ciclo de la Información, es una estrategia para la
administración proactiva de la información.
Incluye cinco elementos muy importantes:
1) Tiene que estar centrada en el negocio.
2) Unificada para todos los datos, no importa
el tipo de dato,si es estructurado, no es estructurado, semi estructurado,
debemos incluirlo.
3)
Está basada en políticas porque tenemos que ligarla con el negocio
definitivamente, tenemos que tener la manera de ligarla con el negocio y de
hacerla automática, no podemos estar administrando esto nosotros.
4)
Es heterogénea, tenemos muchísimos componentes, no necesariamente siempre
estamos pensando que es un solo proveedor.
5)
debe estar alineada al valor de la información, cada uno de esos niveles debe
ser el adecuado para esa información en ese momento dado.