![]() |
Nociones fundamentales de la Teoría de la InformaciónFinalidad de esta notaLa finalidad de esta nota es dar a conocer a los lectores no iniciados en esta nueva rama de la matemática, las nociones findamentales de cálculo informativo, creación del matemático e ingeniro americano Claudio Shannon hace aún menos de veinticinco años. Las aplicaciones de esta teoría se han revelado diversísimas y fecundas en diferentes ramas de la actividad humana y no cabe duda de que un conocimiento básico de la misma deberá formar parte en adelante de la cultura general de los hombres de ciencia y, de modo muy particular, de los que trabajen en el campo de la organización. Sin embargo el cálculo informativo no ha pasado todavía a integrarse en los planes de estudio de las carreras y, por otra parte, resulta enteramente desconocido para la inmensa mayoría de los científicos que han adquirido su formación en los últimos años. Por ello, y sin otra pretensión que la de realizar una modesta tarea de divulgación, me ha parecido conveniente informar a los lectores de esta Revista sobre algunos elementos fundamentales de la nueva teoría. Dada la extensión y el carácter elemental de la presente nota debo limitarme a hacer en ella una introducción muy rudimentaria al tema, que algunos podrá servirles, quizás, como de cebo para interesarse más a fondo en tan curiosa y nueva rama del saber. Generalidades sobre política informativa Al plantearse una actividad se necesita disponer previamente de una "información" suficiente sobre la situación en que aquella haya de desenvolverse. El comerciante deberá estar informado sobre la situación y estructura del mercado, el estratega sobre la disposición y la cunatía de las fuerzas adversas, el organizador del trabajo sobre la eficacia de los medios de que dispone, etc. La clave del éxito en muchas empresas consiste, precisamente, en disponer de una información buena y abundante, o más exactamente, de la información adecuada a la actividad que se trata de desarrollar. Podemos, pues, suponer como modelo general, el caso de una persona A que se encuentra ante una situación de indeterminación o de incertidumbre dentro del cual, debe realizar determinados fines. Lo primero que hará A, es tratar de obtener la información precisa, es decir; el conocimiento de ciertos datos o elementos de la situación que necesita utilizar para actuar. A este fin se valdrá en general de estudios estadísticos, encuestas o sondeos. En la mayor parte de los casos no llegará a obtener una información completa, y siempre quedará sometido a un margen, más o menos importante, de incertidumbre o de indeterminación. Ahora bien, la información cuesta dinero. La realización de un sondeo, el análisis de unos datos estadísticos, son en general, operaciones costosas y que exigen además tiempo. De ahí la importancia que tiene el saber elegir entre el material informativo aquel que proporcione una mayor cantidad de información con el menor gasto posible o, más bien, el saber determinar en cada caso la información más adecuada, la que mejor se ajuste a las necesidades impuestas por la acción proyectada. En muchos casos será mejor dejar un margen de incertidumbre que tratar de obtener una información completa, es decir, la primera solución resultará más económica que la segunda. La pretensión de agotar las informaciones llegando a resultados exhaustivos no es siempre la más razonable. En cada caso será menester definir una "política de información", la ma´s conveniente en vista del conjunto de las circunstancias que concurren en el mismo. Así, por ejemplo, si una Empresa trata de establecer una política de producción deberá, en general, dar la prioridad a los artículos más solicitados por el público, y para ello deberá informarse previamente sobre las preferencias manifestadas por la clientela. A este efecto, podrá organizar por ejemplo, un sondeo. Pero difícilmente podrá llegar a un conocimiento completo y exhaustivo del campo de preferencias. Los gustos de público cambian constantemente y el servicio de información destinado a aconsejar a la dirección de la Empresa en ete aspecto deberá estar constantemente en funcionamiento. Para ello podrá contar con las estadísticas de ventas, la distribución de pedidos, etc., datos que se pueden conseguir fácilmente sin salir del ámbito de la empresa. Ahora bien, en medio de este mare magnum de cifras y de datos se precisa definir una "política" recogiendo los datos más fácilmente accesibles, los más económicos, los que en definitiva resulten más útiles para orientar la producción. Análogamente las señales que un automovilista encuentra a lo largo de una carretera le proporcionan informaciones más o menos importantes sobre la ruta que debe seguir. Es evidente que aumentando el número de señales se puede aumentar la información, pero esta política no será siempre la más acertada. La proliferación de señales puede servir más para confundir que para orientar al conductor. Por otra parte, la instalación de señales origina gastos de instalación y de conservación más o menos cuantiosos y la dirección de carreteras no puede permitirse el lujo de multiplicarlas hasta el infinito. ¿Cuántas señales y qué señales nos darán los resultados mejores y más económicos? Responder a esta pregunta es lo mismo que definir una política informativa de la ruta. De los ejemplos que hemos citado, se deduce la conveniencia de disponer de un instrumento sistemático para la medida y el cálculo de la información. Este instrumento matemático existe y ha recibido el nombre de "teoría matemática de la información". Su primer campo de acción son las técnicas de la comunicación, o de la transmisión por hilo o por ondas. La teoría metemática de la información es inicialmente creada por SHANNON con vistas a este dominio hoy tan importante de la actividad humana. Pero luego aparece su enorme utilidad en otros campos tales como la fisiología, la lingüística y la electrónica. En particular las máquinas de traducir, trabajan fundamentalmente en la transformación de material informativo y en su concepción tiene tanta importancia la medida de la información como pueda tenerla en electrotecnia la definición y medida de las magnitudes eléctricas. Por lo que hace a las técnicas empresariales no hay que hacerse demasiadas ilusiones sobre la utilidad de la aplicación del cálculo informativo a este dominio, pero en muchos casos puede ser útil para proporcionar al hombre de empresa, un esquema abstracto, y hasta cierto punto, seguro, de sus problemas informativos. La noción de entropia informativa La primera magnitud que debe definirse es la de la incertidumbre o indeterminación de una situación. Es evidente que dentro de la inertidumbre caben grados diversos. La incertidumbre del automovilista que se encuentra ante dos rutas posibles es menor que la del que se halla en un núcleo urbano del que parten cinco direcciones posibles. De la misma manera si entre un grupo de ocho candidatos a un concurso interesa saber cuál es el candidato más apto, la incertidumbre será menor que si lo que se trata de averiguar es el orden de preferencia entre los ocho candidatos. Esta segunda cuestión contiene una cantidad de indeterminación mucho mayor que la primera, y exigirá probablemente pruebas mucho más minuciosas. Sobre ese mismo grupo de ocho candidatos pueden plantearse otras cuestiones. Por ejemplo, puede tratarse de clasificarlos en dos grupos de cuatro candidatos cada uno, cuatro aceptados y cuatro rechazados. En tal caso el grado de incertidumbre será distinto que en los casos anteriores. Pero ¿sería mayor o menor que el de cada uno de los dos ejemplos anteriores? Para poder contestar a esta pregunta se precisa disponer de un sistema de medida y de cálculo de la incertidumbre o, para emplear el término actualmente consagrado, de la entropia de cada una de la situaciones planteadas. El caso más sencillo que puede presentarse es el de una situación que
tiene n "salidas" posibles a las que no se atribuye ninguna preferencia
relativa, es decir, que se las juzga todas igualmente probables. En tal
caso, la entropia de la situación viene expresada por el logaritmo del
número de salidas, es decir, que podrá escribirse:
Apliquemos esta definición a cada uno de los tres ejemplos recién propuestos sobre ocho candidatos a un concurso. Las preguntas formuladas son éstas:
Naturalmente habría que justificar el empleo de esta noción tal como ha quedado definida. Baste decir aquí que la definición de entropia adoptada satisface a todas las condiciones intuitivas que pueden exigirse y que en utilización práctica ha demostrado ser una noción extremadamente práctica y que proporciona resultados lógicos y coherentes. El objetivo que nos proponemos que es el de suministrar a nuestros lectores unas nociones elementales y sumamente sencillas del cálculo informativo no justificaría consideraciones más extensas sobre este punto. Veamos ahora cómo se mide la entropia de una situación con diversas
salidas desigualmente probables. En tal caso cada salida posible vendrá
caracterizada por una probabilidad. La fórmula adoptada para la entropia
es:
Situación A: E = 1__2 log2 + 1__2 log2 = 0,301 u.d. de entropia.
Resulta pues que la entropia es mayor en el nudo A que en el B. En general el hecho de que las salidas sean desigualmente probables hacen disminuir la incertidumbre, es decir, la entropia de una situación con dos salidas igualmente probables es mayor que la otra situación con dos salidas desigualmente probables. La entropia ligada Consideramos un procedimiento de fabricación en dos fases. La primera
fase está representada por el nudo A en el gráfico (Fig. 2).
Veamos cuál es la entropia del proceso total P. Este proceso tiene cinco
salidas posibles cuyas probablidades respectivas son: 1/6; 1/6; 2/9; 2/9
y 2/9 como se vé por un sencillo cálculo de probabilidades compuestas.
Por tanto la entropia del proceso P será aplicando la fórmula (2).
Esta propiedad tiene carácter general. Para demostrarla bastaría efectuar cálculos análogos a los que hemos realizado numéricamente sobre un caso particular, en un caso general con datos literales. Sin embargo, la fórmula (3) no tiene toda la generalidad deseable puesto qe ha sido obtenida a partir del gráfico de la Fig. 2 que tiene una particularidad y es que todas las salidas de situación A pertenecen al proceso total P. Puede ocurrir que no sea así y en tal caso debemos introducir una pequeña modificación en la fórmula (3) que la hace más general. Consideremos un proceso P de fabricación en el que partiendo de uan
situación A se trata de llegar a otra G. Esto puede lograrse por tres procedimientos,
dos de los cuales pasan por una fase intermedia B y el tercero por la fase
intermedia C. La sucesión de fases está representada por las aristas dobles
del gráfico de la Fig. 3.
La noción de información Supongamos que se trata de encontrar las fichas de las huellas dactilares
de dos personas en una colección de mil fichas desordenadas. Más en general,
se trata de localizar dos elementos en un conjunto formado por 1.000 elementos.
La entropia de esta situación de incertidumbre, o del proceso que debemos
realizar, se calculará inmediatamente teniendo en cuenta que la situación
correspondiente tiene C21000 salidas posibles, todas ellas igualmente probables.
Dicha entropia será pues igual a log C21000 = log 499500 = 5,698 u.d. Esta
es la cantidad total de incertidumbre contra la que tenemos que luchar
en este caso. Ahora bien, se nos ofrecen dos procedimientos igualmente
costosos. El primero de ellos nos ofrece la posibilidad de "detectar" en
un grupo de 100 fichas (o menos) la presencia de una de las fichas buscadas
o de las dos fichas. Se trata de la simpre presencia no de la localización
de las fichas citadas. Es decir, que una vez realizada la prueba sabremos
que el grupo o colección utilizada contiene las dos fichas buscadas, o
en el mismo está sólo una de ellas o no está ninguna de ellas, sin que
el procedimiento nos proporcione más resultado. En cambio, el segundo procedimiento
opera sobre colecciones de 50 fichas (o menores), pero no se limita a detectar
la presencia de las fichas buscadas, sino que las localiza. Es decir, las
salidas de este segundo procedimiento pueden ser éstas: las dos fichas
buscadas están aquí, son ésta y ésta (primera salidad); sólo una de las
fichas buscadas está aquí y es ésta (segunda salida) y, finalmente (tercera
salida) ninguna de las fichas buscadas está en esta colección. Como se
ha dicho, se supone que ambos procedimientos son igualmente costosos desde
el punto de vista económico. Elegiremos sin duda, salvo otras razones ajenas
a nuestra exposición, el procedimiento que nos suministre mayor cantidad
de información, es decir, aquel que, por término medio, nos conduzca a
situaciones de menor entropia. Recordando la relación (4) antes considerada:
Las probabilidades de las tres salidas mencionadas del primer procedimiento
son las siguientes:
Por consiguiente, para iniciar el proceso de investigación nos convendrá más elegir el primer procedimiento. Esto no significa ue una vez realizadas alguna o algunas experiencias, no nos interese cambiar de método ya que las condiciones del problema se van alterando. Pero el decidirnos sobre este punto requeriría prolongar el estudio matemático que acabamos de dejar iniciado. Resumen En la brevísima exposición que acabamos de hacer hemos presentado las tres nociones más importantes y fundamentales del cálculo informativo. La primera de ellas la entropia o cantidad de incertidumbre contenida en una situación o implicada en un proceso con diversas salidas posibles. En la segunda de estas nociones, la de entropia ligada a una prueba o experiencia, se considera la cantidad de incertidumbre restante después de la realización de dicha prueba. Es decir, que la realización de la prueba, proporcionándonos nuevos datos sobre la situación, reduce la entropia (aunque a veces ésta puede no variar siendo en este caso inútil la experiencia desde el punto de vista de la información). La tercera noción a la que nos conducen las dos anteriores es la de cantidad (media) de información que puede suministrarnos una prueba o experiencia. En ningún caso podrá darse por conocida una situación si las informaciones no cubren la entropia total de la misma. Con estos elementos, hábilmente utilizados, se pueden obtener resultados sorprendentes en relación con procesos de comunicación, tales como los que se realizan en los organismos vivos o en las máquinas electrónicas, y también en otros de carácter social, como son los idiomas y los códigos. Pero naturalmente no podemos en los estrechos límites de est nota iniciar al lector en estos dominios de aplicación. |
|
![]() |
![]() |