Por: Abel Araujo | Business Consultant Hitachi Data Systems

ALMACENAMIENTO IDEAL

Hoy en día elegir la solución de almacenamiento adecuado no es una tarea sencilla, una mala decisión puede resultar en un desperdicio de recursos, dinero y lo que es peor que no resuelva el objetivo que estamos buscando.

Hay varios elementos a considerar cuando vamos a elegir una solución de almacenamiento como son:

Aplicación y el problema que queremos resolver, estos nos van a determinar la tecnología de discos que vamos a utilizar, el software que será necesario, la funcionalidad que deberá tener la solución de almacenamiento la conectividad que va a requerir, el entrenamiento mínimo necesario y las características de monitoreo y administración de la solución.

Aplicación

Para la aplicación se debe tener en cuenta que cada una de ellas tiene características que hacen que el almacenamiento debe ajustarse a estas características, por ejemplo una base de datos o un ERP son aplicaciones muy transaccionales que usualmente manejan un tamaño de bloque pequeño pero es accesada por muchos usuarios en forma simultanea, este tipo de aplicaciones requieren que la conectividad sea a través de una SAN1 o bloques con el mejor tiempo de respuesta posible medido inclusive en milisegundos; que el almacenamiento tenga una solución de disco basada en capas con discos rápidos como primera capa (Puede ser inclusive discos de estado solido “SSD”), y luego discos tradicionales con densidad de discos pequeña (hoy los discos son mínimo de 300GB a 15 Krpm2 ) para obtener el máximo rendimiento de ellos con un nivel de protección en RAID adecuado que puede ser RAID3 10, 5 o 6, con la suficiente memoria cache, esta solución usualmente requiere de copias locales o remotas de la información para actividades de respaldo, como medida de copia segura en caso de corrupción, o refrescamiento de ambientes de prueba, calidad o entrenamiento.

  • 1SAN : Storage Area Network
  • 2Krpm: mil revoluciones por minuto
  • 3RAID: Redundant Array of Independent Disks

El almacenamiento en capas utiliza el principio de Pareto como base para construir los diferentes tipos de discos necesarios en cada capa, este principio en forma simple dice que es 80-20, donde el 80% de la demanda de información del día a día se concentra solo en el 20% de discos y el 80% restante de disco atiende el 20% de la demanda de información. Con esta base entonces de ese 20% de discos se puede aun segmentar en capas de disco de alto tiempo de respuesta como puede ser discos de estado solido o Flash Memory Drive (FMD) un 5% y el 15% restante puede ser discos tradicionales de densidad de 300Gb a 15 Krpm y el 80% restante en discos de 600GB a 10Krpm por ejemplo donde estamos armando una solución de tres capas, cuales son los beneficios y consideraciones de esta solución:

  1. La administración de las capas la debe hacer el almacenamiento, en forma dinámica y aplicando algoritmos de acceso al disco, la caja debe mover los bloques de información mas accesados a los discos mas rápidos y los menos accesados a los discos mas lentos, dejando al administrador la tarea de verificar que esta actividad se este ejecutando.
  2. Va a tener ahorros en espacio y consumo energético dentro del centro de datos pues al tener discos mas densos para almacenar el 80% de la información se requieren menos discos y menos espacio

Si lo que se busca es una solución para respaldo o archivado en disco no necesitamos discos de alto rendimiento usualmente son discos de mayor densidad, hay discos de 3 TB a 7.2 Krpm en RAID 6 que guardan una gran cantidad de información, con una doble protección en caso de falla por el tipo de RAID usualmente conectados por SAN a un servidor que administra los respaldos y que tiene conexión con la librería para hacer el movimiento de la información de acuerdo al ciclo de respaldos

Si lo que buscamos es una solución de almacenamiento para video estos manejan un tipo de bloque grande comparado con una base de datos, una solución de almacenamiento en capas NO es apropiada ya que lo que se busca es la transferencia de grandes bloques, pero si debe tener la protección necesaria de RAID 5 o 6 y la conectividad suele ser vía NAS4 o archivos utilizando el protocolo TCP/IP como base de comunicación entre el almacenamiento y los servidores, usualmente accesada por un numero limitado de usuarios pero que requieren un tiempo de respuesta excepcional donde lo que hay que cuidar es la conectividad con una red dedicada entre servidores y almacenamiento para evita que compita con las otras actividades de los usuarios y no se llegue a la saturación de la red. Redes basadas en 10GbE son las ideales para este tipo de solución pero hay que tener en cuenta que es toda la cadena; servidores, switches de comunicación y almacenamiento

Si es una solución de almacenamiento para una nube la conectividad será a través de NAS vía Internet, con unos tiempos de respuesta que no solo depende del almacenamiento sino del lugar desde donde el usuario se este conectando, adicionalmente estas soluciones buscan tener un control del consumo que hace cada usuario para hacer un cargo por el uso, usualmente el nivel de Protección a disco que se pone es RAID 5 o 6 dependiendo de la densidad del disco utilizado, el compromiso de tiempo de respuesta es mínimo ya que hay factores ajenos al almacenamiento y la garantía de la información suele ser mas responsabilidad del usuario sobre todo si es una nube publica

  • 4NAS: Network Attach Storage

Si la solución que se busca es para cómputo de alto rendimiento (HPC)5 , sea a través de NAS, con una red interna usualmente de alta velocidad como puede ser infiniband o Ethernet a 10Gb con el nivel de protección RAID 5 o 6, con software de administración adicional al almacenamiento y que esta ligado a la solución de HPC donde el tiempo de respuesta es importante

Una solución para proveer almacenamiento de oficinas remotas conocida como ROBO6 , esta funciona de la siguiente manera; en aquellas sitios donde exista una buena cantidad de usuarios que generan archivos de oficina como puede ser hojas de calculo, procesadores de palabras, archivos escaneados video o música, que tienen conectividad con un sitio central a través del protocolo TCP/IP y que no justifica el tener un administrador de TI local pero que tiene requerimientos de almacenamiento y respaldo se le puede proveer de un almacenamiento a través NAS que replique a un sitio central donde se llevara a cabo los respaldos y consolidación de la información dejando solo en el sitio local una liga al archivo donde centralmente esta almacenado, el enlace debe ser muy confiable pues si tiene interrupciones puede convertirse en un dolor de cabeza ya que los usuarios no podrían accesar su información.

Otra consideración importante es las características del almacenamiento que vamos a adquirir para no desperdiciar recursos y dinero, por ejemplo si es un almacenamiento empresarial seguramente contiene una serie de bondades que podemos no necesitar, puede tener HW y SW de conectividad a mainframe y en nuestro ambiente no hay este, hay que asegurarnos que no las incluya.

Puede tener SW de administración que nos simplifique la vida pero que requiera de una consola para poder explotar al máximo todas las bondades estas pueden ser reporteo de capacidad usada y disponible, estatus de copias locales y remotas, monitoreo de rendimiento de la caja en lo general, de un puerto en particular o de un grupo de puertos asociados a un servidor, de conexiones múltiples a un disco para mantener la alta disponibilidad en ambientes de cluster

Puede tener otro SW para integrarse en ambientes virtuales donde el administrador de almacenamiento provee el almacenamiento y desde la consola de ambiente virtual se hace la asignación de espacio a cada ambiente virtual, pero además si tiene el plug in instalado las actividades propias de almacenamiento las ejecuta la caja y libera a la consola de ambientes virtuales de esta actividad dejando solo el monitoreo de que se ejecute.

Otra consideración importante es que hoy el almacenamiento viene con controladoras redundantes en configuraciones de activa / activa o activa / pasiva, esto significa que si es activa / activa el almacenamiento se encarga de balancear la carga y mantener un equilibrio para mantener el rendimiento en forma transparente además de que en caso de que un controlador falle el otro por estar activo tome la operación sin interrupción. Si la solución es activa / pasiva el principal elemento a considerar es el balanceo pues al tener un controlador pasivo en espera de que falle hay que estar monitoreado como esta el rendimiento y hacer los ajustes que se requieran.

  • 5HPC: High Performance Computing
  • 6ROBO: Remote Office Branch Office

Estas soluciones de almacenamiento no importando si es empresarial o de rango medio todas cuentas con una solución de monitoreo predictivo desde un centro de monitoreo que se encarga de ver por la salud de la caja, ve el estatus del HW como puede ser fallas de discos, estatus de componentes como tarjetas de conectividad a discos, tarjetas de conectividad a servidores, memoria cache, fuentes de poder, actualizaciones de firmware, tengan en cuenta que son unidireccionales es decir que la caja reporta y no puede haber intervención del centro de monitoreo por lo que no pone en riesgo la información de la empresa, el beneficio es que como es predictivo la caja periódicamente esta llevando diagnósticos de cada componente y tan pronto como se detecta que algún componente esta fuera de un estándar se genera un reporte al centro avisando para que se presente un ingeniero de soporte con la refacción del componente este fallando, pero también puede reportar una condición anormal como puede ser una temperatura elevada en el centro de datos, para que esto suceda se requiere de una salida a internet

En cuanto a tecnología de discos hoy los discos basados en FC7 ya esta en desuso los fabricantes ya dejaron de producir discos basados en FC y la tecnología SAS8 la esta remplazando pues entre otras cosas tiene una velocidad mayor y es bidireccional la comunicación, la recomendación es que si un proveedor llega con un arreglo de discos basado en discos de tecnología FC no los acepte pues corre el riesgo de que si en un futuro va a necesitar un crecimiento puedo que no lo puedan surtir o le entreguen discos re-manufacturados

Considere que además la caja sea capaz de soportar un crecimiento no disruptivo, esto significa que si adquiero un crecimiento este se pueda agregar al almacenamiento sin interrumpir la operación y que dependiendo del sistema operativo y la aplicación que este soportando este se pueda reconocer en forma automática o en su caso utilizar la funcionalidad de aprovisionamiento dinámico que lo que hace es mostrar al sistema operativo una capacidad mayor a la que originalmente tiene asignada y una vez que se da el crecimiento este se asigna sin impacto en la aplicacion

La conectividad hacia los servidores hoy puede ser a través de FC o ISCSI9 si es de bloques o Ethernet si es de NAS esto no va a cambiar pero hay que tener en cuenta las siguientes consideraciones cuando vamos a cambiar un almacenamiento que viene con conectividad FC a 8 Gbps y que va a estar conectado a un switch de SAN y a su vez a un servidor con HBA10 hay que asegurarnos que toda la ruta sea a 8Gbps si alguno de los otros elementos esta a una velocidad menor la solución se va a ajustar al de menor velocidad con un posible impacto en el rendimiento esperado, si por ejemplo el HBA es de 2 Gbps la solución va a trabajar a 2 Gbps pero algo que puede ser peor es que la aplicación este en un problema de rendimiento y el disco este subutilizado porque este ajustado a 2 Gbps. Para el caso de NAS es similar si tengo una interfaz de 10GbE conectado a un switch de 10GbE hay que evaluar si los usuarios requieren un interfaz a 10 GbE que para este caso puede ser de un precio mayor por ser poco demandadas, sin embargo una red interna de almacenamiento NAS es recomendable para que no entre en competencia con la red de usuarios

  • 7FC: Fiber Channel
  • 8SAS: Serial Attached SCSI
  • 9ISCSI: Internet SCSI (Small Computer System Interface)
  • 10HBA: Host Bus Adapter

Entrenamiento es otro elemento clave a considerar si vamos a adquirir una solución de almacenamiento donde usualmente los ciclos de remplazo van de 36 a 48 meses, el entrenamiento en promedio puede tomar dos o tres cursos de 5 o 3 días cada uno para aprovechar al máximo las características de la caja, bien vale la pena darse el tiempo para asistir al curso con la ventaja de que hasta se puede obtener una certificación, generar ahorros en futuros actividades asociadas al almacenamiento pues el personal interno lo puede llevar a cabo y se evita el pago de servicios profesionales.

Si se esta adquiriendo una solución que va a reemplazar a un almacenamiento existente asegúrese que los servicios de migración estén incluidos, que incluya todas las actividades asociadas con roles y responsabilidades, plan de emergencia en caso de que el plan original no se puede llevar a cabo inclusive el regreso, los escenarios de prueba, puntos de validación o verificación, así como la forma en la que se va a llevar la migración, hoy en día existe funcionalidad como la virtualización del almacenamiento que permite integrar el nuevo almacenamiento al ambiente actual y en horarios de oficina empezar la transferencia o migración de la información sin impacto a la producción, evitando las actividades en horarios tan difíciles como fines de semana o por la noche con los riesgos como cansancio o largas jornadas de trabajo que ponen en riesgo la actividad.

Hitachi Data Systems
Claudia Flores
(55) 5258-3977
claudia.flores@hds.com

Espacio en medio (relaciones públicas)
Sandra Luz Plata
(55) 5256.5790 I 5250.9801
splata@espacioenmedio.com

¡Está en el lugar indicado!

Hitachi Data Systems, Pentaho y Hitachi Insight Group son ahora una sola empresa: Hitachi Vantara.

Obtenga más soluciones basadas en datos e innovación por parte del socio en el que puede confiar.