COMPUTACIÓN: Trillium, el "Maestro Limpio" de las bases de datos

viernes, 29 de julio de 2005
México, D F, 28 de julio (apro)- El mundo del cómputo no es tan fácil ni automático como parece En muchas ocasiones los programadores tienen problemas realmente difíciles de resolver, pero curiosamente, para ayudarse, se auxilian escribiendo programas que solucionan ?al menos parcialmente? parte de estos mismos problemas Por ejemplo, si recordamos el famoso problema del año 2000, en donde se suponía que las bases de datos y programas que manejaran fechas en el formato MM/DD/AA, donde MM es mes, Dd es día y AA es año, tendrían problemas porque un programa no sabría que el año 00 se referiría a 1900 o al 2000 ¿Qué hacer? Había que revisar cientos de miles de líneas de código de cientos de programas que usaban fechas Evidentemente la solución no era poner a un "ejército" de programadores a revisar "a mano" esto, sino que se utilizó la misma computadora para que ésta hallara las líneas de código en donde se observara que se utilizaba el formato de la fecha La solución fue verdaderamente simple y las cifras exageradas de lo que costaría todo este esfuerzo de actualizar las bases de datos resultó tan falso como los temores de pasar de 1999 al 2000 Cada inicio de siglo siempre hay los "Nostradamus" modernos que claman por grandes catástrofes que nunca ocurren y como no pasa nada, nadie se acuerda de lo que predijeron Pero regresando al tema que nos ocupa, hay un asunto que compete a los programadores, particularmente a aquellos que manejan grandes volúmenes de bases de datos, de información, y es el mantener estos archivos actualizados y limpios de errores, muchos de ellos capturados a veces por personal poco capacitado o incluso en errores simples de dedo al escribir en la computadora cierta información específica Pensemos por ejemplo en el padrón electoral que el IFE mantiene Si nos ponemos a pensar en esta gigantesca cantidad de información, ¿cuántos errores contendrá? Posiblemente muchas credenciales no coincidan en su código postal y la dirección de quienes las portan Esto puede deberse simplemente a errores en la captura El problema particular del IFE es que el padrón no es estático, sino cambiante, amén de que se incorporan nuevos electores (los que cumplen 18 años) y desaparecen los que fallecen Llevar actualizada esta información no resulta fácil para nadie Sin embargo, Trillium es una solución para estas cuestiones (vea trilliumsoftwarecom) Este software permite "limpiar" de errores las bases de datos para mantenerlas actualizadas y utilizables Aunque el programa es originalmente extranjero, el sistema es lo suficientemente flexible para ser usado en una buena cantidad de bases de datos, con los formatos más populares Aparentemente el secreto de Trillium es que permite a los manejadores de dicho programa, definir las reglas para limpiar la información Por ejemplo, se puede definir una lista de nombres femeninos y checar que ninguno de ellos tiene marcada la casilla de sexo como hombre Y ya que hablamos de esto, ¿qué pasará si encontramos un nombre como "Guadalupe", que puede usarse muchas veces para hombres o mujeres? Pues bien, podemos especificar al programa para que nos avise si ocurre este caso o mejor aún, podemos definir una regla que nos permita ver si hay otro nombre de manera que podamos discernir si la persona señalada es hombre o mujer En fin, la idea de las reglas definidas por el usuario hacen de esta herramienta una de las mejores para la limpieza de información masiva Los representantes de Trillium Software hacen algo interesante: Si ud se interesa en sus servicios, puede pedir una demostración del valor de este software con una muestra sensible de sus datos Trillium le dirá qué tan "sucios" estaban los mismos y entonces podrá evaluar si esto es lo que usted necesita En mi opinión y por lo que llegué a observar, Trillium es el "Maestro Limpio" de las bases de datos

Comentarios