sábado, 5 de mayo de 2007

I: La axiomatización del conocimiento

Todos aquellos que hayan estudiado geometría elemental no memorizando fórmulas relacionadas con figuras geométricas para resolver problemas numéricos sino en la manera en que la geometría debe (o debería) ser enseñada, inspirada en la metodología de la obra Los Elementos de Euclides, recordarán que el estudio de la materia se lleva a cabo de una manera deductiva. La geometría no es una ciencia experimental cuyos teoremas (y fórmulas relacionadas con dichos teoremas) deban ser aceptados por parecer estar de acuerdo con lo que nos enseña la observación y la experiencia cotidiana. La idea de que una proposición pueda ser establecida como conclusión de una prueba lógica explícita se remonta a los griegos de la antigüedad, los cuales descubrieron lo que hoy se conoce con el nombre de método axiomático, utilizando dicho método para llevar a cabo un desarrollo sistemático de la geometría. El método axiomático consiste en aceptar sin prueba ciertas proposiciones, como la proposición de que entre dos puntos sólo puede trazarse una línea recta, y en derivar de tales proposiciones todas las demás proposiciones del sistema. Las proposiciones elementales usadas como punto de partida constituyen los “cimientos” del sistema, mientras que todas las demás proposiciones obtenidas mediante combinaciones diversas de las proposiciones elementales son la “superestructura”, y se obtienen partiendo de las proposiciones elementales usando exclusivamente de los principios de la lógica.

Del mismo modo en que no todas las palabras pueden ser definidas en términos de otras palabras (como las palabras olor, verde y espacio), tampoco es posible probar que todas las proposiciones sean verdaderas o falsas recurriendo a otras proposiciones. Un razonamiento “circular” es a fin de cuentas una falacia circular, (un ejemplo de ello sería definir un conjunto A como todo conjunto que posee elementos que pertenecen al conjunto B, y definir al conjunto B como todo conjunto que posee elementos que pertenecen al conjunto A) y no es mejor que una definición circular. Se vuelve por lo tanto inevitable el tener que aceptar ciertas proposiciones como verdaderas desde un principio sin cuestionarlas, y a partir de ello deducir la validez o la falsedad de otras proposiciones deducidas a partir de las proposiciones que suponemos incuestionablemente como verdaderas.

Una proposición que desde un principio se acepta incuestionablemente como cierta sin mayor discusión es llamada un axioma. Sin embargo, un axioma no puede ser considerado como una “verdad auto-evidente”, aunque una definición tal a veces sea encontrada en algunos diccionarios. Un axioma puede ser verdadero en el sentido en que es consistente con nuestras experiencias previas, pero en matemáticas es irrelevante si los axiomas son verdaderos en este sentido. El matemático está interesado únicamente en las consecuencias de la verdad supuesta del axioma. Naturalmente, las ramas de las matemáticas que son de mayor valía para nosotros en un sentido práctico son aquellas que sean más consistentes en describir nuestras experiencias. Así pues usamos ordinariamente axiomas que parecen ser consistentes con la experiencia, de modo tal que muchos axiomas que tomamos como verdaderos parecen ser “verdades auto-evidentes”. El punto importante es que los axiomas son proposiciones que se suponen ciertas desde un inicio.

Hay dos axiomas que son fundamentales para toda la estructura matemática. Pueden ser enunciados de la siguiente manera:
Axioma 1. Axioma de identidad: Para cualquier objeto, a = a.

Axioma 2. Axioma de substitución: Si a es igual a b, entonces a puede ser usada para reemplazar a b en cualquier proposición que contenga a b sin alterar la validez de la proposición.
Usando conceptos tales como palabras que se aceptan sin definición previa, definiciones, axiomas y ciertas reglas de lógica, podemos establecer la validez de ciertas implicaciones. Aquellas implicaciones que son consideradas como básicas para el desarrollo de las matemáticas son conocidas como teoremas. Puesto todo junto, se tiene entonces algo que se puede considerar como una estructura matemática.

Con los dos axiomas dados arriba, podemos demostrar el siguiente teorema que llamaremos la propiedad de simetría del signo de igualdad en donde introduciremos el símbolo de implicación  “⇒” que se  puede leer como “si la proposición antecedente es cierta, entonces se cumple la proposición que sigue”:

a = b ⇒  b = a

Esta expresión simbólica traducida al Castellano nos dice que:

“Si a = b, entonces b = a

Esto parecería tan “evidente” que aparentemente no necesitaría demostración alguna y debería aceptarse como axioma. Sin embargo, es algo que se puede obtener de los axiomas indicados. Para demostrarlo empezamos con el axioma de identidad nos asegura que lo siguiente es verdadero:

b = b

Por otro lado, si a = b (lo cual tomamos como hipótesis) entonces en el lado derecho de la igualdad que se tiene arriba podemos substituír b por a aplicando el axioma de substitución, con lo cual se obtiene:

b = a

Se concluye entonces que:

si a = b entonces b = a

lo cual podemos expresar simbólicamente como:

a = bb = a

Cualquier cosa, por sencilla que parezca, cuya veracidad pueda ser demostrada partiendo de axiomas más sencillos, evidentemente no es un axioma, es un teorema.

PROBLEMA: Demostrar la propiedad transitiva del signo de igualdad:

Si a = b y b = c entonces a = c

Tenemos dos proposiciones distintas:

a = b

b = c

que aceptamos como verdaderas, o sea las tomamos como hipótesis. Para poder llegar a la conclusión deseada, simplemente aplicamos el axioma de substitución obteniendo la consecuencia a.=.c. Así pues, en simbolismo lógico, se ha demostrado que:

a = b y b = ca = c

PROBLEMA: Sean α y β dos objetos (no necesariamente números, que hasta pueden representar algo intangible como traslaciones o rotaciones en el espacio de algún sistema de coordenadas) distintos para los cuales los siguientes axiomas son válidos:

Axioma I: αβ = α

Axioma II: αα = β

A partir de los dos axiomas proporcionados, demostrar los siguientes tres teoremas:

Teorema I: ββ = β

Teorema II: αβ = βα

Teorema III: (xy)z = x(yz) en donde x, y y z son separadamente αβ o β.

En la solución de este problema, en todo momento hay que obedecer “las reglas del juego”; nada que no pueda ser deducido de los axiomas se puede aceptar como cierto.

Para la demostración del Teorema I, partimos del Axioma II:

αα = β

Aplicando repetidamente el axioma I en el lado derecho de la igualdad anterior, se tiene:

α(αβ) = β

ααβ = β

(αα)β = β

(β)β = β

ββ = β

Para la demostración del Teorema II, partimos del Axioma III:

(αα)α = α(αα)

Aplicando el Axioma II en el lado izquierdo de la igualdad, se tiene:

(β)α = α(αα)

βα = α(αα)

Volviendo a aplicar el Axioma II, pero en esta ocasión en el lado derecho de la igualdad, se tiene:

βα = α(β)

βα = αβ

Obsérvese algo interesante. En el Teorema II hemos demostrado la propiedad de conmutatividad en el sistema axiomático proporcionado. Esta es una conclusión que se obtiene mediante una aplicación directa de los axiomas, no es algo que se haya postulado de antemano como siempre cierto. Se trata de una conclusión que se deriva, no de algo que se acepta sin cuestionamiento alguno como cierto. Cabe observar que la conmutatividad no es algo universal. En algunos sistemas matemáticos (como las matrices) no existe conmutatividad alguna, excepto en ciertos casos especiales.

Las matemáticas no son la única rama del vasto conocimiento científico que ha experimentado un proceso de axiomatización. Albert Einstein, por ejemplo, basó toda su Teoría Especial de la Relativdad en tan solo dos postulados:
1) El movimiento absoluto es indetectable.

2) La velocidad de la luz es la misma independientemente del movimiento relativo de los observadores.
Tal vez a muchos les cueste trabajo creer o inclusive aceptar que todas las fórmulas y teoremas que se desarrollan en libros y tratados acerca de la Teoría Especial de la Relatividad se puedan obtener partiendo de tan solo los dos postulados (axiomas) dados arriba, pero así es en efecto. Y antes que Einstein, Isaac Newton basó toda la compleja estructura de su mecánica Newtoniana en tan solo tres postulados (axiomas) hoy conocidos como las tres leyes de Newton (a saber, la ley de la inercia, la ley de la dinámica, y la ley de la acción y la reacción). De estos tres sencillos postulados nacieron los procedimientos científicos que le permiten a los astrónomoe y a las agencias espaciales el poder calcular la trayectoria y las órbitas de los planetas y satélites aún hasta nuestros días. Pero de hecho la metodología axiomática aplicada a la física empezó con Arquímedes, sin duda alguna el más grande de los matemáticos de la antigüedad, el cual entre muchas otras cosas demostró una variedad de teoremas en mecánica clásica basándose en un conjunto básico de axiomas que le fueron sugeridos por su experiencia propia con pesos, balanzas y palancas. Supóngase que dos pesos que simbolizaremos como W1 y W2 descansan sobre los dos extremos opuestos de una palanca a distancias respectivas d1 y d2 del punto de apoyo que está situado entre los dos extremos opuestos de la palanca (si las distancias fueran iguales, entonces estaríamos hablando más de una balanza que de una palanca). Se puede ilustrar la situación de la siguiente manera:


Los dos axiomas de Arquímedes relativos a la palanca se pueden enunciar del modo siguiente:
Axioma 1: Si W1.=.W2 y d1.=.d2, entonces el sistema estará equilibrado (“la palanca estará equilibrada si los dos pesos son iguales y están a la misma distancia del punto de apoyo”), pero si W1.=.W2 y d1..d2 (o sea las distancias son diferentes) el sistema no estará equilibrado y la balanza se inclinará hacia el lado que se encuentra a mayor distancia (“si los pesos son iguales pero se encuentran a distancias diferentes del punto de apoyo la palanca no estará equilibrada”).

Axioma 2: Si el sistema se encuentra equilibrado para cierto conjunto de pesos y distancias, y se le añade un peso adicional a  W1, entonces el equilibrio no se mantendrá y la palanca se inclinará hacia  W1. De modo semejante, si se quita peso de  W1, la palanca se inclinará hacia  W2.
Una situación en la que W1 y W2 son diferentes pero aún así la palanca se mantiene en equilibrio requiere necesariamente que d1 y d2 sean diferentes. Resulta tentador agregar este hecho como axioma a nuestro conjunto de axiomas, inflando el conjunto de axiomas a tres axiomas. Sin embargo, sería un error de nuestra parte, ya que se puede se puede deducir a partir de los dos axiomas anteriores con que se cuenta, y por lo tanto la proposición no sería un axioma sino un teorema.

PROBLEMA: Para la palanca de Arquímedes, demostrar que si el sistema se encuentra en equilibrio entonces:

W1 ≠ W2 ⇒ d1 ≠ d2

En Castellano ordinario leemos lo anterior como “si los pesos colocados en los extremos de una palanca son diferentes, entonces para que la palanca se encuentre en equilibrio las distancias de los pesos hacia el punto de apoyo de la palanca deben ser diferentes”.

La solución de este problema es un buen ejemplo de lo que se conoce como una prueba por contradicción. Para ello, suponemos la negación de la proposición a ser demostrada, o sea supondremos que un sistema equilibrado requiere que:

W1 ≠ W2 ⇒ d1 = d2

lo cual traducido al Castellano se lee como:
“Si los pesos colocados en los extremos de una palanca son diferentes, entonces para que la palanca se encuentre en equilibrio las distancias de los pesos hacia el punto de apoyo de la palanca deben ser iguales”.
Ahora bien, si los pesos son diferentes:

W1 ≠ W2

entonces necesariamente W1 es mayor que W2 o bien W1 es menor que W2. Supóngase primero que W1 es mayor que W2. Entonces la diferencia entre ambos pesos simbolizada como W3 será:

W1 - W2 = W3

Si restamos W3 de W1 tendremos un peso igual a W (que es igual a W2). El nuevo sistema, en el cual:

W = W2

d1 = d2

estará en equilibrio, basándonos eb lo que nos afirma el Axioma 1.

Ahora agréguese un peso W3 a W para obtener nuevamente W1. Aplicando ahora el Axioma 2, el sistema no permanecerá en equilibrio sino que se inclinará hacia W1. Pero al haber hecho estas operaciones con los pesos vemos que tenemos nuevamente el sistema original con el que habíamos comenzado, con lo cual tenemos una contradicción a la hipótesis de que el mismo sistema que se encontraba en equilibrio no se encuentra en equilibrio. Por lo tanto, no puede ser cierto que W1 sea mayor que W2 y d1.=.d2 para una condición de equilibrio. (El lector puede construír por sí mismo de modo semejante la prueba de que W1 debe ser menor que W2 cuando d1.=.d2 para una condición de equilibrio). Consecuentemente, se ha demostrado que:

d1 = d2 ⇒ W1 = W2

lo cual es contrario a la suposición original de que W1..W2. Se concluye entonces que:

W1 ≠ W2 ⇒ d1 ≠ d2

que podemos expresar en las siguiente palabras como un teorema: En una palanca en equilibrio, si los pesos en los extremos de la palanca son diferentes entonces las distancias de los pesos hacia el punto de apoyo también serán diferentes.

El ejercicio anterior demuestra que, incluso en los casos más sencillos, se requiere algo de maña para descubrir que algo que creemos que tiene que ser añadido a nuestro conjunto básico de axiomas como un axioma adicional en realidad se trata de un teorema que puede ser deducido de los axiomas que ya se tienen.

Pero, ¿cómo podemos estar realmente seguros de que lo que creemos que tal vez sea un axioma pueda ser obtenido de los axiomas que ya se tienen? ¿Y qué hacer si, por más que le busquemos por todos lados, encontramos que es imposible deducir cierta proposición de los axiomas que ya se tienen? ¿Lo aceptamos como un nuevo axioma, incuestionablemente cierto e imposible de demostrar a partir de otros axiomas? Este es el meollo del asunto.

Considérese el Teorema de Pitágoras: “En todo triángulo rectángulo, el cuadrado de la hipotenusa es igual a la suma de los cuadrados de los catetos”. Esto ni remotamente es una “verdad auto-evidente”, y como su nombre lo indica, se trata de un teorema que ultimadamente puede ser deducido de un conjunto reducido de axiomas. No podemos aceptarlo como incuestionablemente cierto solo porque algún maestro en la escuela nos pidió alguna vez que nos aprendiéramos la fórmula de memoria. Tampoco nos satisface el saber que la fórmula vino de algún “iluminado” que por tener fama de “iluminado” dice cosas que siempre se deben aceptar como ciertas sin ponerlas jamás en tela de duda; al menos no es así como se desenvuelven las matemáticas. Considérese también otra expresión que diga: “La fórmula P(n) siempre generará un número primo para cualquier entero positivo n”, tras lo cual se nos presenta una fórmula P(n) extremadamente complicada. Podemos en un primer intento recurrir a la Teoría de Números para tratar de demostrar la falsedad o veracidad de la propuesta. Pero la búsqueda de una demostración que compruebe o desmienta la hipótesis puede ser un asunto que tal vez lleve años o siglos si no milenios dilucidar. En este caso, sabemos de antemano que la propuesta tiene que ser necesariamente cierta o falsa, y si es falsa entonces debe existir por lo menos algún número n que produzca un entero P(n) que no es un número primo, en cuyo caso la expresión quedaría demostrada como falsa. En la búsqueda de tal número n, podríamos tratar de recurrir al uso de una supercomputadora. ¿Pero qué sucede si el número n es tan grande que supere incluso la magnitud de un Gúgolplex? En tal caso, no habrá ninguna computadora por “super” que sea capaz de encontrar dicho número.

Podemos sucumbir a la tentación de elevar a la categoría de axioma algo que parece ser indudablemente e incuestionablemente cierto, usando expresiones tales como “es obvio” o “aceptamos como verdadero”. Pero el incurrir en tales suposiciones ha terminado siendo la fuente de innumerables pifias en la historia de las matemáticas. En la actualidad, ninguna publicación científica seria acepta trabajos en los cuales hay expresiones tales como “resulta obvio” y “resulta evidente”, al menos no sin someterlas a cientos de revisiones bajo un microscopio. Esto es precisamente lo que dió pie al rigorismo extremo pregonado por el grupo Nicolás Bourbaki, convirtiendo a la matemática formal en algo mucho más incomprensible y mucho menos entendible de lo que ya era, removiendo todo rastro de “intuición” en los textos matemáticos serios.

Regresando de nuevo a la palanca de Arquímedes, la siguiente ilustración nos muestra una relación matemática que es necesaria y suficiente para que la palanca se encuentre en equilibrio balanceado:




La relación matemática se basa en un concepto en el cual multiplicamos el peso W puesto en un extremo de la palanca por la distancia del peso hacia el punto de apoyo de la palanca, es lo que en la física se define como el momento mecánico o torque. La pregunta inmediata es: ¿se puede deducir la relación matemática dada arriba a partir de los dos axiomas de Arquímedes, al incluír la definición del momento mecánico? Obsérvese otra cosa importante: la relación matemática, por sí sola, parece resumir los dos axiomas de Arquímedes, ya que implica que si a un sistema que se encuentra en equilibrio se le quita o se le agrega peso en uno de los extremos de la palanca, el sistema dejará de estar en equilibrio al no cumplirse la igualdad; y también implica que manteniendo los pesos iguales si la distancia de uno de ellos hacia el punto de apoyo de la palanca cambia entonces la palanca también dejará de estar en equilibrio. Parece que los dos axiomas de Arquímedes se pueden deducir de la relación matemática dada si tal relación se toma como un axioma aún más básico, en cuyo caso los dos axiomas de Arquímedes dejarían de serlo para pasar a ser teoremas. Sin embargo, la relación matemática para un sistema en equilibrio basada en el concepto del momento mecánico ya no parece ser una “verdad auto-evidente”, y ciertamente va en contra de la idea de que el procedimiento de axiomatización se basa en ir progresivamente de lo más sencillo hacia lo más complejo. Este ejemplo sencillo ilustra las enormes dificultades que suelen encontrarse al momento de tener que decidir si se se adopta cierta proposición como un axioma, o se le interpreta como un teorema deducible de otras proposiciones aún más elementales.

Son raros los sistemas axiomáticos en los cuales se acepta como “verdad auto-evidente” e incuestionable una fórmula matemática aparentemente sacada de la nada, cualesquiera que ésta sea y por sencilla que sea. Sin embargo, es posible tratar de formalizar lo anterior asentando como definición preliminar lo que entendemos por el momento mecánico, de modo tal que tendríamos el siguiente sistema:

Definición: El momento mecánico simbolizado como τ se define como una cantidad igual al peso W en un lado de una palanca multiplicado por la distancia de dicho peso al punto de apoyo de la palanca.

Axioma A: Para que una palanca se encuentre en equilibrio, es necesario que los momentos mecánicos en cada lado de la palanca sean iguales.

Axioma B: Si los momentos mecánicos en ambos lados de la palanca son desiguales, entonces la palanca se inclinará hacia el lado en donde el momento mecánico sea mayor.

La fórmula dada arriba se puede deducir del Axioma A y de la definición del momento mecánico, ya que para que la palanca se encuentre en equilibrio se requiere que los momentos mecánicos en cada lado de la palanca sean iguales, y si el momento mecánico τ1 en un lado de la palanca es igual por definición a W1d1, y el momento mecánico τ2 en el otro lado de la palanca es igual por definición a W2d2, entonces en virtud del Axioma A se tiene que, para que la palanca esté en equilibrio se debe cumplir la siguiente condición:

τ1 = τ2

W1d1 = W2d2

De este modo, la fórmula se deduce como un teorema directamente de la definición dada y los dos axiomas A y B. Y del teorema que se acaba de probar, se deduce que si los pesos son iguales, entonces para que la igualdad se mantenga en pie las distancias también deben ser iguales.

El desarrollo axiomático de la geometría produjo un efecto poderoso en las mentes de pensadores de todos los tiempos, impresionados al ver que un relativamente pequeño número de axiomas podía soportar el peso de las infinitamente numerosas proposiciones que de ellos podían derivarse. Además, si puede demostrarse de alguna manera la “verdad absoluta” de los axiomas que aceptamos incuestionablemente como verdaderos (y en efecto, por más de dos mil años la mayoría de los estudiosos han creído sin discusión que en áreas de estudio como la geometría los axiomas son absolutamente ciertos) quedan automáticamente garantizados tanto la verdad como la consistencia mutua de todos los teoremas. Por esas razones la forma axiomática de la geometría se presentó a muchas generaciones de destacados pensadores como el modelo más excelente de conocimiento científico. Era natural preguntar, por tanto, si era posible asentar sobre un sólido cimiento axiomático otras ramas del pensamiento además de la geometría. No obstante, aunque desde la antigüedad se dió una formulación axiomática a ciertas partes de la física como lo hemos visto arriba, hasta los tiempos modernos la geometría era considerada la única rama de las matemáticas dotada de lo que la mayoría de los estudiosos consideraban una adecuada base axiomática, “a prueba de toda duda”.

Durante los últimos dos siglos el método axiomático fue adquiriendo fuerza y vigor crecientes. Nuevas y viejas ramas de las matemáticas, incluyendo la aritmética de los números cardinales (enteros con los que se pueden efectuar operaciones propias de la aritmética) fueron provistas de lo que parecían ser conjuntos adecuados de axiomas. nació así un estado de opinión en el que se admitía tácitamente que todos los sectores del pensamiento matemático podían ser dotados de unos conjuntos de axiomas susceptibles de desarrollar sistemáticamente la infinita totalidad de proposiciones verdaderas suscitadas en el campo sujeto a investigación. Pero fue en 1931 cuando apareció un trabajo que demostró que esta suposición era insostenible, poniendo frente a los matemáticos la asombrosa y melancólica conclusión de que el método axiomático posee ciertas limitaciones intrínsecas que excluyen la posibilidad de que ni siquiera la aritmética ordinaria de los números enteros pueda llegar a ser plenamente axiomatizada. Y más aún, el mismo trabajo demostró que es imposible establecer la consistencia lógica interna de una amplia clase de sistemas deductivos (la aritmética elemental, por ejemplo) a menos de que se adopten principios tan complejos de razonamiento que su consistencia interna quede tan sujeta a la duda como la de los propios sistemas. A la luz de estas conclusiones, resulta inalcanzable una completa sistematización final de muchas y muy importantes zonas de las matemáticas y no puede darse ninguna garantía absolutamente impecable de que muchas de las más significativas ramas del pensamiento matemático se hallen enteramente libres de toda contradicción interna.

Los descubrimientos presentados en 1931 en aquél trabajo elaborado por Kurt Gödel terminaron socavando prejuicios profundamente arraigados y demolieron las antiguas esperanzas que estaban siendo alimentadas por la investigación en torno a los fundamentos de las matemáticas. Pero el impacto del trabajo no fue totalmente negativo, ya que introdujo en el examen de las cuestiones planteadas en torno al fundamento de las matemáticas una nueva técnica de análisis, comparable por su naturaleza y su fecundidad al método algebraico que René Descartes introdujo en la geometría creando Descartes la rama de estudio que hoy se conoce como la Geometría Analítica que permite darle a las funciones algebraicas una representación visual pictórica. La técnica desarrollada por Gödel sugirió y planteó nuevos problemas para la investigación lógica y matemática, provocando una nueva valoración, todavía en trance de desarrollo, de una extendida filosofía de las matemáticas y de la filosofía del conocimiento en general.

Es demasiado difícil seguir paso a paso todos los detalles de las demostraciones dadas por Gödel en su ya histórico trabajo sin contar previamente con una formación matemática considerable; pero la estructura básica de sus razonamientos y el aspecto esencial de sus conclusiones pueden ser accesibles a lectores que se hallen dotados de una limitada preparación lógica y matemática sin ser especialistas en dichas materias. Para lograr este nivel de comprensión, se hará previamente dentro de esta obra una exposición de ciertos conceptos que son comunes a las matemáticas y la lógica formal moderna.