¿Cuánto da 0 elevado a la 0?
Esta pregunta surgió de un discusión en las redes sociales. Y creo que es interesante para reflexionar sobre qué es una definición matemática, y porqué las definiciones matemáticas son como son.
Para responder esta pregunta, debemos reconocer en primer lugar que existen diferentes tipos de números, y que las definiciones de las operaciones son diferentes para ellos.
La primera definición de potencia, que aprendemos en la escuela primaria, nos dice que una potencia donde y son dos números naturales (1,2,3…) debe interpretarse como un producto , donde se repite veces.
Como sabemos, en la historia, la primera generalización del concepto de número fue la la introducción del cero. Entonces ¿cómo generalizamos esta definición cuando a o b pueden ser cero? Cuando a es cero, pero b no lo es, no tenemos muchas dudas
porque multiplicar cero por si mismo cero veces da cero.
¿Pero qué pasa si es cero? ¡Ahora esa definición de potencia ya no nos sirve! Porque… ¿qué significa multiplicar a por sí mismo cero veces?. Así que pues necesitaremos una nueva definición. Las definiciones en matemática hasta cierto punto son arbitrarias: hay un elemento creador allí. Pero no son del todo arbitrarias. En general,al generalizar un concepto, el matemático intenta preservar las propiedades formales que tenía el concepto que estamos generalizando. Esto se conoce como el principio de permanencia de las leyes formales. Es que en general queremos tener el menor número de excepciones posibles en nuestros teoremas, como para evitar tener que andar separando en casos en nuestros cálculos.
¿Y en nuestro caso cómo se aplicaría? Bueno, una propiedad muy importante de la potencia es la propiedad que nos dice que podemos repartir una suma en el exponente como un producto de dos potencias de igual base:
En particular, esto permite definir recursivamente las potencias por:
a partir de saber que
Pero si no es cero y queremos que esta propiedad también se cumpla cuando b es cero tendremos que pedir que:
Lo que nos lleva a definir
para cualquier que no sea cero.
Si quieren otro ejemplo de cómo funciona el principio de permanencia de las leyes formales: ¿Alguna vez se preguntaron el porqué de la regla “menos por menos da más”?
¿Parece rara no? ¿Porqué definirlo así? ¡Es para que siga valiendo la propiedad distributiva
cuando , y !. ¡Se los dejo para que lo piensen!.
Pero volviendo a la pregunta inicial ¿Qué pasa con cero elevado a la cero? Ahí tenemos un problema, pues querríamos que fuera cero para ser consistente con la primer propiedad que observamos, pero que fuera consistente con la definición que acabamos de hacer. ¡Las dos cosas no se puede! Sería contradictorio.
Ante esta situación, en muchos libros elementales se considera cero elevado a la cero como indefinido. Sin embargo, como mencionan en el excelente artículo de wikipedia en inglés sobre esta cuestión (que me recomendó un usuario en twitter) Donald Knuth propuso definirlo como uno. Personalmente creo que esto suele ser lo más útil e introduce menos excepciones en los teoremas.
Consideremos por ejemplo un polinomio escrito como una sumatoria,
donde son sus coeficientes. Si queremos que como debe ser, debemos definir cero elevado a la cero como . Esto mismo sucede en muchos otros teoremas (como el binomio de Newton, la fórmula de Taylor, etc.).
Esta definición está también de acuerdo con la siguiente manera conjuntista de expresar la definición combinatoria de la potencia: es la cantidad de funciones de un conjunto de b elementos en uno de a elementos. Entonces cero elevado a la cero cuenta cuántas funciones hay del conjunto vacío en sí mismo, y resulta que hay exactamente una . ¡La función vacía!
Bueno, espero que ahora las reglas de la matemática que aprendieron en la escuela ya no les resulten tan arbitrarias.
Un último comentario: La pregunta de este artículo no es la misma que preguntarse cuál es el límite
cuando y tienden a cero, que como sabemos es un límite indefinido, significando que en distintos ejemplos puede dar cualquier cosa, por lo que cada caso debe analizarse por separado.
De hecho, lo anterior muestra que no hay forma de definir la función de modo que sea continua en como función de ambas variables simultáneamente.