Conmutación a la nube

En la entrada previa comenté un par de informaciones periodísticas sobre dos materias técnicas que creo que van a representar un papel muy relevante en el futuro de internet: la banda ancha sin cables (Wi-Fi 2.0, ya sea TV white space o WiMAX) y la computación distribuida (grid computing). En ésta trato de aclarar los distingos entre las informáticas de la "cuadrícula" y de la "nube", además de referirme a algunas desventajas y ventajas de la segunda.

grid-supercollider-diagram
«The Grid» en el 'Supercollider' del CERN (Computerworld 051010)

El reportaje de El Periódico vinculado el miércoles equiparaba los conceptos de grid y cloud computing al decir: 

«El grid es un software que permite no solo acceder a páginas web, como ahora cuando se navega por internet, sino también registrar datos en una nube de ordenadores dispersos por todo el mundo e incluso utilizarlos para hacer cálculos (de ahí lo de computación por nubes, otra denominación de la tecnología grid). «En el futuro, las memorias USB serán superfluas porque se podrá enviar toda la información a miles de máquinas remotas», explica Diego Mariño, cofundador de Abiquo.»

Evidentemente, un artículo de divulgación para directivos o gran público no suele entrar en detalles o distingos técnicos. No obstante, creo que tenemos que diferenciar la semántica o la tecnología subyacentes para poder comprender en qué consisten ciertos conceptos y, especialmente, para reconocer sus potenciales aplicaciones e implicaciones. No son muchos los redactores científicos o técnicos que escriben entendiendo bien lo que hay detrás de lo que leen o escuchan, y ello puede transmitir ideas mal extractadas o formadas. Considero que ello puede conducir a repetir afirmaciones propias de un tiempo pasado que ya no se sustentan en las nuevas evidencias.

En este cuaderno de apuntes he tratado de buscar anteriormente los orígenes históricos de esos dos conceptos, muy vinculados a internet. Hasta donde he sabido investigar, «The Grid» es como se conoce en los EE. UU. a la red de generación y distribución de electricidad. En informática se ha utilizado cuando se ha aplicado a internet el modelo de  computación distribuida entre varias máquinas procesando información en paralelo que se usa desde la segunda mitad de los 60. Paralell y distributed computing fueron las expresiones que se emplearon inicialmente para este enfoque, mientras que grid computing comienza a emplearse en 1997 para referirse al proceso en clusters heterogéneos y dispersos en la WAN.

cern-datagrid
The DataGrid Project 'OSI certified' (CERN project funded by EU)

Es la misma época en que se prueba el acceso a internet a través de la red eléctricaLa información llega al punto de consumo de forma instantánea procediendo de fuentes cambiantes en un proceso que resulta transparente para el usuario. En 2000, tras percatarse de que el supercomputador basado en MPP no iba a resolver su problema, el CERN decidió explorar el enfoque grid para poder procesar las ingentes cantidades de datos que planeaba obtener al explotar su futuro «Large Hadron Collider». El proyecto del LHC fue aprobado en 1994 y el del DataGrid a final de 2000. La nueva instalación arrancó en septiembre. En abril habían presentado en sociedad su nueva «the grid« para poder almacenar y tratar los datos de los experimentos (Worldwide LHC Computing Grid – WLCG).

Por otra parte, «The Cloud» se ha convertido en una referencia común a internet al ser una de sus formas más usuales de representación gráfica en los esquemas de sistemas de información. La expresión cloud computing ha venido empleándose desde hace poco más de dos años y parece gustar mucho a los especialistas de marketing, por lo que su empleo va en aumento y se ha puesto de moda, como refleja The Guardian. Suele aplicarse cuando los recursos de proceso, los de almacenamiento o las aplicaciones están en un sistema informático al que puede accederse a través de una simple URI de internet, que abstrae a la persona o máquina que los usan de toda la complejidad que suele haber detrás. En ciertos casos se emplea como sinónimo de utility o de on-demand computing, que no tienen por qué ofrecerse desde internet, como tampoco el grid, aunque hoy sea ya lo más frecuente.

Por consiguiente, entiendo que la redactora de El Periódico asocia indebidamente las expresiones «tecnología grid» y «computación por nubes» que, dicho sea de paso, no sería la traducción más adecuada al español. El enfoque grid ha existido desde hace décadas dentro de las organizaciones, aunque haya sido con otros nombres y sin tanta heterogeneidad de máquinas. Su extensión afronta dificultades cuando se quieren combinar recursos dentro y fuera de los límites o cortafuegos de las estructuras organizativas tradicionales.

cern-globe-palais
CERN Globe Communication building (© Thomas Janster, Expo 2002)

Como dice Diego:

«»Las grandes empresas se montarán sus grid internas para no compartir datos», dice Mariño. La privacidad y la confiden cialidad son cuestiones cruciales en la nueva tecnología. «Sin embargo –concluye–, todo el mundo es consciente de que para explotar al máximo su potencial es necesario converger en una única red. Un poco como cuando, en los años 80, las redes de distintas universidades y empresas se coordinaron y dieron vida a internet».»

El empleo o combinación de servicios informáticos localizados «en la nube» ha planteado muchas objeciones de los directivos de las grandes empresas relacionadas con la disponibilidad (robustez, fiabilidad), seguridad (confidencialidad, privacidad), integración (conectividad, interoperabilidad) e independencia (control, regulación, portabilidad). Considero que un buen software o middleware para grid puede resolver satisfactoriamente todas y cada una de estas cuestiones relevantes. A esto me refería cuando escribía más arriba que no se debe argumentar con premisas basadas en ideas mal formadas, o en simples creencias anticuadas que no resisten una mínima comparación de datos. Considero que hay bastantes mitos, paraguas de cobertura, comportamientos gregarios y problemas de agencia en este terreno.

cern-datacenter-storage
Almacenamiento de datos en un supercomputador (© CERN, 1999)

De momento sólo añadiré que aprecio contradicciones en la postura conservadora, como el propio reportaje creo que pone de manifiesto. Considerando las dos citas previas podríamos concluir que «las memorias USB serán superfluas» en las grandes empresas porque «se montarán sus grid internas para no compartir datos» «en la nube». Una cuestión que me surge es ¿por qué el usuario de una empresa va a confiar más en su director de informática que en los de Google, Microsoft, IBM o Amazon, por nombrar algunas grandes empresas de tecnología que no emplean el modelo de CPD central? ¿Lo seguirá haciendo porque lo impone el consejero delegado o el «manual de políticas y procedimientos» de la compañía? ¿Acaso las empresas desconfían de los bancos que procesan sus datos económicos? Hmmm…

Espero poder tocar esos puntos en futuras anotaciones. Evidentemente, la nueva teoría y la vieja práctica necesitan convivir un tiempo para ir convergiendo al resolver los «problemas» apuntados en muchos lugares, como en el vinculado de Jack Schofield (The Guardian). Hay otros muchos que se han hecho eco de unas recientes declaraciones negativas de Richard Stallman que, a veces, parece vivir confinado en un «stall«. Voy a referirme otro artículo ligero sobre tendencias tecnológicas titulado «promesas y riesgos del Cloud Computing» de una reciente newsletter del e-business Center PwC&IESE. Comparto plenamente la conclusión que obtienen tras revisar los riesgos: «La informática puede estar en las nubes. El profesional no.»

Por ahora me limitaré a subrayar las ventajas de innovar dando un salto hacia delante y pasar a compartir recursos en la nube, capacidades que suelen presentarse como servicios. Si el proceso de datos se conmutara a la nube, si se hiciera este click en el switch de las organizaciones, se mejoraría la situación actual de su informática en los cuatro aspectos citados. También se reducirían mucho los costes, las rigideces y los riesgos. ¿Los CIOs quieren números?, pues los tendrán.

Sin embargo, quizá lo más importante a largo plazo derive de lo apuntado en la cita de Mariño sobre «explotar al máximo su potencial». Continuará…

Entradas relacionadas: Confianza en la nube, El software de la nube, La nube de Amazon

12 comentarios en “Conmutación a la nube

  1. Que el término Cloud Computing se asocie al Grid Computing es algo que tiene su sentido… ¡pero es que todo el mundo está metiendo dentro del Cloud Computing de todo y sin distinción!
    La ventaja del término Cloud Computing es que al ser tan vago puede aplicarse como ‘comodín’: te puedes referir a on-demand computing, virtualized computing, Platform as a Service, Hardware/Infrastructure as a Service, Software as a Service como La Nube. Mi visión de la nube es de integración y conectividad a nivel de capas más cercano a ‘los hierros’. Sin embargo, hay mucha gente que se refiere al Cloud Computing como la integración en las capas superiores, cercana al usuario y por supuesto a sus datos. Veo que se mete dentro del Cloud Computing otro término inventado recientemente: las Aplicaciones Mashup. Creo que una aplicación Mashup puede hacer uso de La Nube si pensamos en La Nube como la combinación de todos esos servicios más cercanos al hierro, pero eso no es Cloud Computing, es otra cosa.
    Supongo que tendré que pensar sobre ello.

  2. James, creo que lo de la nube se está empleando como sinónimo de internet. Da igual si usas «la red» sólo para procesar (GAE), almacenar (S3, box.net) o trabajar con una aplicación que has montado en Force.com combinando su CRM con GDocs. Me parece bien.

    Más que clasificar los servicios en categorías «regladas» me interesa entender lo que hacen. No podremos evitar que los de marketing pongan las etiquetas que más les convenga en vez de las que encajen mejor con una «ortodoxia» definida por ¿las escuelas de informática? 😉 .

    ¿Será la futura web una «amplísima máquina, en las nubes (reconstrucción tridimensional), que incluye todos los datos disponibles»?

  3. A mi entender… y eso es lo que buscamos en abiquo, Grid Computing y Cloud computing son complementarias. O así lo estamos entendiendo.

    Cloud ofrece la capacidad de «conseguir los recursos que buscas» en la red. Grid es una de las aplicaciones.

    Que una empresa necesita calcular un proceso que dura 2 dias en 1 hora? Busca los recursos en amazon, en tu ISP, donde sea y consíguelo. Muchas veces lo que passa en el grid, es que las empresas acaban comprando nuevas máquinas para montarse un grid. Que está bien… pero no debería ser esa la filosofía :). Lo ideal es que usaran los recursos que ya tienen desaprovechados o si no… hacia la nube :).

    Estoy de acuerdo en lo de «confiar en IBM, amazon, Google». Pero creo que es más fácil justificar una caida del sistema porque me he quedado sin luz en el CDP que decir «Amazon dejó de funcionar» (Que alguna vez lo ha hecho). A parte, la ley de protección de datos no está preparada para el cloud :).

    Por eso en abiquo (Cuando digo abiquo no es que haga publicidad 🙂 es que no quiero cargar con toda la idea… es de todos) estamos trabajando y ofreciendo soluciones de elastic computing (Cloud, la nube, on-demand, lo que sea) para ISP, CPD’s de grandes empresas, etc. Que creo que serán unos actores que tendrán mucho que decir en este juego.

  4. Hola a todos,
    A mi modo de ver, el día que las empresas conservadoras, aquellas que tienen su CPD, aquellas que están ancladas en el software tradicional hagan el switch a la nube, será porque alguien habrá acertado en la comunicación de su procedimientos operativos o existan un organismo independiente que audite a estas empresas para asegurar la privacidad,seguridad e incluso la disponibilidad. Quiero decir, si supiéramos clara y exactamente los procedimientos operativos de por ejemplo y la cantidad de recursos (eléctricos,electrónicos, personal,etc) destinados a nuestra solución, posiblemente tendríamos la suficiente confianza para dejar nuestros datos core de nuestro negocio en manos de ellos. El ejemplo de Jose sobre los bancos es claro, ¿¿porque dejamos nuestros datos y nuestro dinero en el banco??
    Por eso, estoy de acuerdo con XFernandez que se vende mal en el comité de dirección que Amazón nos ha dejado de dar servicio durante 7h.
    Un saludo, como siempre un buen post que te obliga a pensar.

  5. Lo de que la LOPD española no está preparada para el cloud computing no lo entiendo. Al final se refiere sólo a una de sus posibles aplicaciones: el almacenamiento de datos en ficheros electrónicos.

    Si los bancos españoles de primera línea mundial son capaces de cumplirla (además de las regulaciones de los demás países en que operan), ¿por qué no iban a saber cumplirla los IBM, Amazon, Google, Microsoft…? (aunque tengan sus ficheros de datos distribuidos por los muchos ordenadores que conformen su «cuadrícula nebulosa»).

    Respecto de los «outages» de proveedores externos habría que analizar datos comparables. Si sólo fueran 7 horas en un año de pruebas, no creo que los grandes bancos estén en condiciones de ofrecer ratios de disponibilidad superiores al 99,92%, y mucho menos a un coste comparable.

  6. Ya, pero los bancos ya tienen todo hecho y todo el cloud-computing tiene un largo camino que recorre de concienciación y entrega de confianza.
    Un saludo.

  7. ¿Qué impide a los promotores de La Nube aprovechar el camino abierto por la banca? ¿Por qué habría que avanzar despejando otra trocha en la selva de la desconfianza a golpe de machete? ¿Acaso no nos gusta el punto de destino donde hoy acampa la informática de los bancos on-line?

  8. Hola,
    Haciendo de abogado del diablo porque por delante estuvo la confianza en el banco que por cierto en cuestión de dinero y en nuestro país están auditados por el Banco de España.
    Por otro lado tus datos siempre los tuvo el banco lo que pasa es que ahora son accesibles por internet y que el banco tenga tus datos es algo que está mas que aceptado teniendo como premisa el primer parrafo.
    Un saludo

  9. Reblogueó esto en cl0udswxsequrey comentado:
    Conmutación en las alturas…

Replica a jcmmartin Cancelar la respuesta