Aplicaciones del Axioma de Elección Itlacuatl.mx/docencia/tc/tc23.pdf · 2 days ago ·...

24
Aplicaciones del Axioma de Elección I Esta vez nos interesa desarrollar varias aplicaciones del axioma de elección en diversas áreas de las matemáticas. 43.1 Continuidad Recuerde la definición de continuidad de una función de R a R. (a) La función f es continua en a R si para todo ε> 0 existe δ> 0 tal que | f (x )− f (a )| para cualquier x tal que | x a | . (b) La función f es continua en a R si para toda sucesión (x n : n N) que converge a a , la sucesión ( f (x n ) : n N) converge a f (a ). Probemos que estas definiciones son equivalentes. (a)(b) Si (x n : n N) converge a a y ε> 0, primero encontramos δ> 0 como en (a). Dado que (x n : n N) converge, existe n δ tal que | x n a | siempre que n n δ . Es claro que | f (x n )− f (a )| para toda n n δ . (b)(a) Aquí requerimos el AE. Suponga que (a) es falsa. Entonces, existe ε> 0 tal que para cada δ> 0 existe x con | x a | para | f (x )− f (a )| ≥ ε. En particular, para cada k = 1, 2, 3, ... podemos elegir un x k tal que | x k a | < 1/k y | f (x k )− f (a )| ≥ ε. La sucesión (x k : k N) converge a a , pero la sucesión ( f (x k ) : k N) no converge a f (a ), por lo que (b) es falso. La siguiente aplicación concierne a espacios vectoriales. Teorema 43.1.1. Sea W un espacio vectorial sobre un campo K . Entonces, exste una base B para W . Demostración. En realidad este teorema es un «si y sólo si» pero ahora mismo sólo nos interesa una implicación, la otra fue demostrada enla lectura 42. Sea B la familia de subconjuntos de W que son linealmente independientes. Note que B pues {x }∈ B , para cualquier x W , x 0; si W = {0}, no hay nada que 453 Universidad Autónoma Metropolitana Iztapalapa Prohibida su reproducción parcial o total con fines de lucro

Transcript of Aplicaciones del Axioma de Elección Itlacuatl.mx/docencia/tc/tc23.pdf · 2 days ago ·...

Aplicaciones del Axioma de Elección I

Esta vez nos interesa desarrollar varias aplicaciones del axioma de elección en diversasáreas de las matemáticas.

43.1 Continuidad

Recuerde la definición de continuidad de una función de R a R.

(a) La función f es continua en a ∈ R si para todo ε > 0 existe δ > 0 tal que| f (x) − f (a)| < ε para cualquier x tal que |x − a | < δ.

(b) La función f es continua en a ∈ R si para toda sucesión (xn : n ∈ N) queconverge a a, la sucesión (f (xn) : n ∈ N) converge a f (a).

Probemos que estas definiciones son equivalentes.(a)⇒(b) Si (xn : n ∈ N) converge a a y ε > 0, primero encontramos δ > 0 como en

(a). Dado que (xn : n ∈ N) converge, existe nδ tal que |xn − a | < δ siempre que n ≥ nδ.Es claro que | f (xn) − f (a)| < ε para toda n ≥ nδ.

(b)⇒(a) Aquí requerimos el AE. Suponga que (a) es falsa. Entonces, existe ε > 0 talque para cada δ > 0 existe x con |x − a | < δ para | f (x) − f (a)| ≥ ε. En particular, paracada k = 1, 2, 3, . . . podemos elegir un xk tal que |xk − a | < 1/k y | f (xk ) − f (a)| ≥ ε. Lasucesión (xk : k ∈ N) converge a a, pero la sucesión (f (xk ) : k ∈ N) no converge af (a), por lo que (b) es falso. �

La siguiente aplicación concierne a espacios vectoriales.

Teorema 43.1.1. SeaW un espacio vectorial sobre un campo K . Entonces, exste una baseB paraW .

Demostración. En realidad este teorema es un «si y sólo si» pero ahora mismo sólo nosinteresa una implicación, la otra fue demostrada enla lectura 42.

Sea B la familia de subconjuntos deW que son linealmente independientes. Noteque B , � pues {x} ∈ B , para cualquier x ∈W , x , 0; si W = {0}, no hay nada que

453

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

454 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

probar. Ordenamos parcialmente B mediante ⊆. Nos proponemos aplicar el lema deZorn al cpo (B , ⊆). Con este fin, debemos cerciorarnos de que toda cadena en (B , ⊆)tiene cota superior. Sea C una cadena en B . Debemos exhibir una cota superior de Cen B . Si C es una cadena finita, tiene un elemento más grande respecto a ⊆, por loque éste es una cota superior de C . Si C es inifinita, sea Z =

⋃C .

Afirmación 1. Z ∈ B y Z es cota superior de C .Demostración de la afirmación 1. Que Z es cota superior de C es evidente pues

si A ∈ C , A ⊆ Z por definición de Z .Resta confimar que Z ∈ B , es decir, que Z es linealmente independiente. Suponga

que no es así, entonces existen z1, . . . , zn ∈ Z y r1, . . . , rn ∈ K , no todos cero, tales que

r1z1 + · · · + rnzn = 0.

Cada zi pertenece a algún Ai ∈ C y como C es una cadena infinita, podemos encontrarun A ∈ C tal que A ⊃ A1 ∪ · · · ∪ An , por lo que todos los zi pertenecen a A, lo queimplicaría que A no es linealmente independiente, un hecho contradictorio. X (1)

Entonces (B , ⊆) satisface las hipótesis del lema de Zorn y tiene un elemento máx-imo B∗ respecto a ⊆.

Afirmación 2. B∗ es una base deW .Demostración de la afirmación 2. Por construcción, B∗ es linealmente indepen-

diente. Resta verificar que B∗ genera a W . Dado que 〈B∗〉 ⊆ W , de no darse laigualdad 〈B∗〉 =W , existiría x ∈W − 〈B∗〉, lo que indicaría que B∗ ∪ {x} es linealmenteindependiente y B∗ $ B ∪ {x}, que se opone a que B∗ sea máximo. X (2) �

Para hacer más visibles los razonamientos recién expresados, consideremos unasituación particular.

Ejemplo 43.1.2. Tome al conjunto de los números reales R como un espacio vectorialsobre Q. Por el teorema 43.1.1, este espacio vectorial tiene una base. En el caso deeste espacio vectorial la base se conoce como una base de Hamel. En otras palabras,un conjunto X ⊆ R es una base de Hamel para R si cada x ∈ R se puede representaren forma única como

x = r1z1 + · · · + rnzn

donde los ri son racionales y los zi elementos de la base de Hamel X . Como dijimos,los siguientes razonamientos simplemente ilustran en detalle las ideas del la pruebadel teorema 43.1.1.

Un conjunto X de números reales es linealmente dependiente cuando existenx1, . . . , xn ∈ X diferentes y r1, . . . , rn ∈ Q distintos de cero tales que

r1x1 + · · · + rnxn = 0.

Un conjunto X ⊆ R que no es dependiente, se llama linealmente independiente.Sea A el conjunto de todos los subconjuntos de R que son linealmente independientes.Dotamos a A de un orden parcial mediante la contención ⊆ y verificamos que (A, ⊆)satisface las hipótesis del lema de Zorn. Sea A0 ⊆ A linealmente ordenado por ⊆, esdecir, A0 es una cadena, todos sus elementos son comparables entre sí. Sea X0 =

⋃A0.

Entonces, X0 será una cota superior de A0 en A si X0 es linealmente independiente,

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.1. CONTINUIDAD 455

pues claramente X0 es ⊆-mayor que cualquier elemento de A0. Supongamos queexisten distintos x1, . . . , xn ∈ X0 y r1, . . . , rn ∈ Q distintos de cero tales que

r1x1 + · · · + rnxn = 0

En tal caso, existirían X1, . . . ,Xn ∈ A tales que x1 ∈ X1, . . . , xn ∈ Xn . Como A0está linealmente ordenado por ⊆, el subconjunto finito {X1, . . . ,Xn} de A0 tiene mayorelemento respecto a ⊆, digamos Xi ∗ . En consecuencia, x1, . . . , xn ∈ Xi ∗, así que Xi ∗ nosería linealmente independiente, una contradicción.

Por el lema de Zorn, (A, ⊆) tiene un elemento máximo X . Resta probar que X esuna base de Hamel. Suponga que x ∈ R no se puede expresar como r1x1 + · · · + rnxncon xi ∈ X , ri ∈ Q. Entonces x < X (de lo contrario, x = 1 · x), así que X ⊂ X ∪ {x} yX ∪ {x} es linealmente dependiente, porque X es máximo linealmente independiente.Entonces, existen z1, . . . , zn ∈ X ∪ {x} y s1, . . . , sn ∈ Q, no todos cero, tales que s1z1 +

· · · + snzn = 0. Como X es linealmente independiente, x ∈ {z1, . . . , zn}, digamos x = z1y el coeficiente correspondiente s1 , 0. Se sigue que

x = z1

=

(−s1s1

)x1 + · · · +

(−sns1

)xn

esto contradice la hipótesis en x . De modo que todo real es representable como com-binación lineal de elementos en X . Ahora, suponga que algún real x ∈ R admite dosrepresentaciones en términos de elementos de X ,

x = r1x1 + · · · + rnxn

= s1y1 + · · · + sk yk

donde x1, . . . , xn , y1, . . . , yk ∈ X , r1, . . . , rn , s1, . . . , sk ∈ Q − {0}. En consecuencia

r1x1 + · · · + rnxn − s1y1 − · · · − sk yk = 0 (❇)

Si {x1, . . . , xn} , {y1, . . . , yk }, digamos x1 < {y1, . . . , yk }, (❇) se puede ver como unacombinación lineal de elementos distintos de X , lo cual no es posible. En consecuen-cia, n = k y x1 = yσ(i ), . . . , xn = yσ(n), para alguna aplicación biyectiva de {1, . . . , n} ensí mismo. Por tanto, podemos escribir (❇) en la forma

(r1 − sσ(1))x1 + · · · + (rn − sσ(n))xn = 0.

Ya que x1, . . . , xn son elementos distintos entre sí de X , ocurre ri − sσ(i ) = 0 para todai ≤ n, de donde se sigue que r1 = yσ(1),...,rn = sσ(n).

Por lo tanto, todo número real se puede representar en forma única como combi-nación lineal de elementos de X , de donde se deduce que X es una base de Hamel.

Ejemplo 43.1.3. Una función f : R → R es aditiva si f (x + y) = f (x) + f (y) paraculesquier x , y ∈ R. Un ejemplo de función aditiva es fa(x) = a · x para toda x ∈ R ya ∈ R está fijo. Es claro que,

fa(x + 1) = a(x + y) = ax + ay = fa(x) + fa(y).

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

456 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Suponga que f es una función aditiva y hacemos f (1) = a. En consecuencia,

f (2) = f (1) + f (1) = a · 2f (3) = f (2) + f (1) = a · 3

y por inducción f (b) = a · b para cada b ∈ N − {0}. Como f (0)+ f (0) = f (0+ 0) = f (0),deducimos f (0) = 0. Además, f (−b) + f (b) = f (0) = 0, por lo que f (−b) = −f (b) =a · (−b) para b ∈ N. Para calcular f ( 1

n ) note que

a = f (1) = f(

1n

)+ · · · + f

(1n

)︸ ︷︷ ︸

n veces

= n · f

(1n

).

En consecuencia, f ( 1n ) = a ·

1n . Siguiendo de este modo, podemos probar que f (x) =

a · x . Para toda x ∈ Q. Es natural conjeturar que f (x) = a · x se cumple para todonúmero real x ; en otras palabras, que toda función aditiva es de la forma fa paraalguna a ∈ R. Resulta que esta conjetura no se puede refutar en ZF, pero es falsa sisuponemos el axioma de elección, como lo ilustra el siguiente teorema.

Teorema 43.1.4 (ZFE). Existe una función aditiva f : R → R tal que f , fa para todaa ∈ R.

Demostración. Sea X una base de Hamel para R. Escogemos x ∈ X y definimos

f (x) =

{ri , si x = r1x1 + · · · + rnxn ∧ xi = x

0, en otro caso.

Afirmación 1. f es aditiva.Demostración de la afirmación 1. Sean x , y ∈ R

x = r1x1 + · · · + rnxn

y = s1y1 + · · · + smym

donde sin perder generalidad alguna, podemos suponer que m + n = l y

x = r1z1 + · · · + rl zl

y = s1z1 + · · · + sl zl

f (x + y) = (r1 + s1)z1 + · · · + (rl + sl )zl

Caso 1 zi = x . Aquí,

f (x + y) = ri + si

f (x) = ri si = f (y)

Caso 2. zi , x para toda i ≤ l . Entonces, f (x) = 0 = f (y) = f (x + y).Note que 0 < X , pues X es una base de Hamel y por cuestiones de cardinalidad,

|X | = 2ℵ0 . Además, f (x) = f (1x) = 1, mientras que f (z ) = 0 para cualquier z ∈ X ,z , x (pues x no aparece en la representación de elementos de la base que no sean élmismo). Si f = fa para alguna a ∈ R, tendríamos f (x) = 1 = a · x , por lo que a , 0;por otro lado, f (z ) = 0 = a · z , por lo que a = 0, un hecho absurdo. �

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.1. CONTINUIDAD 457

Ejemplo 43.1.5 (El teorema de Hahn-Banach). Una función f definida en un espaciovectorialW sobre el campo R y con valores en R se conoce como funcional lineal enW si

f (α · u + β · v) = α · f (u) + β · f (v).

Se cumple para cualesquier u , v ∈W y α, β ∈ R. Una función p definida enW y convalores en R se llama funcional sublineal enW si

p(u + v) ≤ p(u)+ p(v) ∀u , v ∈W

p(α · u) = α · p(u) ∀u ∈W , α ≥ 0

El siguiente teorema se debe a dos grandes matemáticos sobresalientes en análisis:Stefan Banach y Hans Hahn. El teorema mismo es una pieza fundamental en elanálisis funcional.

Teorema 43.1.6 (ZFE). Sean p una funcional sublineal en el espacio vectorialW y f0 unafuncional lineal definida en un subespacio V0 de W tal que f0(v) ≤ p(v) para cada v ∈ V0.Entonces, existe una funcional lineal f definida enW tal que f ⊇ f0 y f (v) ≤ p(v) para cadav ∈W .

Demostración. Lo que buscamos es extender una funcional lineal definida en un sube-spacio V0 deW a todoW . Además, exigimos que el funcional lineal a extender (y laextensión) esté «dominado» por una funcional sublineal. La idea de la prueba ase-meja un poco a como probamos que todo espacio vectorial tiene una base. Sea Fel conjunto de funconales lineales g definidos en un subespacio U deW y tales quef0 ⊆ g y g (v) ≤ p(v) para toda v ∈ U . Esto es, F consiste en funcionales lineales queextienden a f0 pero son dominadas por p . Ordenamos parcialmente a F mediantecontención ⊆. Para verificar las hipótesis del lema de Zorn en (F , ⊆), consideramosuna F0 ⊆ F linealmente ordenada, esto es, una cadena.

Los elementos de F0 son funcionales lineales, en particular, funciones y como F0es una cadena, F0 es un sistema de funciones compatibles, por lo que

⋃F0 es una

función, que llamamos g0. Por consiguiente, g0 es una ⊆-cota superior de F0 y faltagarantizar que g0 ∈ F . Es claro que g0 es una función con valores en R y g0 ⊇ f0.Ya que la unión de un conjunto de subespacios deW lienalmente ordenado por ⊆ esclaramente un subespacio deW ,

dom(g0) =⋃g ∈F0

dom(g ),

es un subespacio de W . Para confirmar que g es lineal tomamos u , v ∈ dom(g0) yα, β ∈ R. Entonces, existen g , g ′ ∈ F0 tales que u ∈ dom(g ) y v ∈ dom(g ′). Dado queF0 está linealmente ordenado por ⊆, tenemos g ⊆ g ′ o g ′ ⊆ g . Por simetría, elegimosg ⊆ g ′, así que u , v , αu + βv ∈ dom(g ′) y g0(αu + βv) = g

′(αu + βv) = αg ′(u) + β g ′(v)= αg0(u) + β g0(v). Finalmente, g0(u) = g (u) ≤ p(u) para cualquier u ∈ dom(g0), dedonde se deduce que g0 ∈ F .

Por el lema de Zorn (F , ⊆) tiene un elemento máximo f ⊇ f0. Resta probar quedom(f ) = W . Es claro que dom(f ) ⊆ W ; supongamos que existe u ∈ W − dom(f ) ysea U el subespacio deW generado por dom(f ) ∪ {u}. Ya que todo w ∈ U se puede

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

458 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

expresar en forma única como w = x + αu para alguna x ∈ dom(f ) y cierto α ∈ R, lafunción fc definida mediante

fc (w) = f (x) + α · c

es una funcional lineal en U y fc ⊇ f . Terminamos la prueba, si confirmamos quepodemos elegir c ∈ R tal que

fc (x + αu) = f (x) + αc ≤ p(x + αu) (✩)

para todo x ∈ dom(f ) y α ∈ R.Las propiedades de f garantizan (✩) para α = 0. Debemos elegir c que satisfaga

(a) Para todo α > 0 y cada x ∈ dom(f ),

f (x) + α · c ≤ p(x + αu).

(b) Para cada α > 0 y cualquier y ∈ dom(f ), f (y) + (−α)c ≤ p(y + (−α)u). En formaequivalente,

f (y) − p(y − αu) ≤ αc ≤ p(x + αu) − f (x)

así,

f

(1αy

)− p

(1αy − u

)≤ c ≤ p

(1αx + u

)− f

(1αx

)(✣)

se cumple para cualesquier x , y ∈ dom(f ) y α > 0. En tal caso, para cualesquierv , t ∈ dom(f )

f (ν) + f (t ) = f (v + t ) ≤ p(vt ) ≤ p(v − u) + p(t + u),

por lo que,f (v) − p(v − u) ≤ p(t + u) − f (t ).

Si A = sup{f (v) − p(v −u) : v ∈ dom(f )} y B = inf{p(t +u) − f (t ) : t ∈ dom(f )}. TenemosA ≤ B y por la elección de c , A ≤ c ≤ B , lo que certifica (✣). �

43.2 El problema de la medida

Un problema importante en análisis matemático es extender la noción de longitud deun intervalo a conjuntos más complejos de números reales. Idealmente, nos gustaríatener una función µ definida en Pot (R) con valores en [0,∞)∪ {∞} y con las siguientespropiedades.

(a) µ([a, b]) = b − a para cualesquier a, b ∈ R, a < b .

(b) µ(�) = 0, µ(R) = ∞.

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.2. EL PROBLEMA DE LA MEDIDA 459

(c) Si {An : n ∈ N} es una colección de subconjuntos de R ajenos entre sí, entonces

µ

(⋃n∈N

An

)=

∑n∈N

µ(An).

Esta propiedad se llama aditividad numerable o σ-aditividad de µ.

(d) Si a ∈ R, A ⊆ R y A + a = {x + a : x ∈ A}, entonces µ(A + a) = µ(A) (invarianciarespecto a translaciones).

No obstante, el AE implica que no existe una función µ con estas propiedades.

Teorema 43.2.1 (ZFE). No existe una función µ : Pot (R) → [0,∞) ∪ {∞} con laspropiedades (a)-(d).

Demostración. Definimos una relación ≈ en R mediante

x ≈ y ⇔ x − y ∈ Q

y usamos el AE para obtener un conjunto de represntantes X respecto a ≈. Es fácilverificar que

R =⋃

{X + r : r ∈ Q}.

Más aún, si q , r ∈ Q, q , r , entonces X + q y X + r son ajenos. Note que µ(X ) > 0,pues si µ(X ) = 0, ocurriría

µ(X + q ) = 0 ∀ q ∈ Q

µ(R) =∑q∈Q

µ(X + q ) = 0,

una contradicción. Por aditividad numerable, existe un intervalo [a, b] tal que µ(X ∩

[a, b]) > 0. SeaY = X ∩ [a, b], entonces⋃q∈Q∩[0,1]

(Y + q ) ⊆ [a, b + 1] (✷)

y el lado izquierdo es la unión de una cantidad infinita de conjuntos Y + q ajenosentre sí, cada uno de medida µ(Y + q ) = µ(Y ) > 0. Así, el lado izquierdo de (✷) tienemedida ∞, contrario a que µ([a, b + 1]) = b + 1 − a. �

En consecuencia, para aspirar a una función µ definida en Pot (R), debemos renun-ciar a alguna de las propiedades (a)-(d), o no requerir que µ esté definida en Pot (R),sino sólo en algun subconjunto de Pot (R), exigiendo que tal subconjunto sea cerradorespecto a ciertas operaciones.

Definición 43.2.2. Sea S un conjunto no vacío. Una coleción A ⊆ Pot (S ) es una σ-álgebra de subconjuntos de S si ocurre lo siguiente.

(a) � ∈ A, S ∈ A;

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

460 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

(b) Si X ∈ A, entonces S −X ∈ A;

(c) Si Xn ∈ Apara toda n < ω, entonces⋃n∈N Xn ∈ Ay

⋂n∈N Xn ∈ A.

Definición 43.2.3. Una medida σ-aditiva en una σ-álgebra Ade subconjuntos de S esuna función µ : A→ [0,∞) ∪ {∞} tal que

(i) µ(�) = 0, µ(S ) > 0;

(ii) Si {Xn : n ∈ N} es una familia de conjuntos ajenos entre sí, de elementos de A,entonces

µ

(⋃n∈N

Xn

)=

∑n∈N

µ(Xn)

Los elementos de A se llaman µ-medibles.

Corolario 43.2.4. Sea µ una medida σ-aditiva en una σ-álgebra Ade subconjuntos de R talque

(a) [a, b] ∈ A, µ([a, b]) = b − a para culaesquier a, b ∈ R, a < b .

(b) Si A ∈ A, entonces A + a ∈ Ay µ(A + a) = µ(A) para todo a ∈ R.

Entonces, existe un conjunto de reales que no es µ-medible.

Demostración. Se sigue del teorema previo que no puede existir una medida σ-aditivaen Pot (R). �

En R se construye una Σ-álgebra particular M de los conjuntos medibles segúnLebesgue que satisface (a), (b) del corolario. Así que, la existencia de conjuntos queno son Lebesgue medible es una consecuencia del axioma de elección.

En lo recién descrito hemos renunciado a tener una medida definida en Pot (R). Sepueden considerar otras formas de debilitar los requisitos. Por ejemplo, es posible noexigir que µ sea invariante respecto a traslaciones, y averiguar si existe una medidaσ-aditiva µ en R tal que µ([a, b]) = b − a para culaesquier a, b ∈ R, a < b . Estaconstrucción da lugar a una relación con la teoría de grandes cardinales.

En cuanto a la medida de Lebesgue podemos mencionar también la siguientesituación.

Teorema 43.2.5 (ZFE). Existe un subconjunto de R acotado que no es medible segúnLebesgue.

Demostración. Sea µ la medida de Lebesgue en R. En el intervalo [0, 1] definimos unarelación ∼ mediante

x ∼ y ⇔ x − y ∈ Q

Es fácil verificar que ∼ es una relación de equivalencia, por lo que sea [x] la clase deequivalencia respecto a ∼ de cada x ∈ [0, 1]. Mediante el axioma de elección escogemosun elemento de cada clase de equivalencia. Por lo tanto, existe un M ⊆ [0, 1] tal quepara cada x ∈ [0, 1], exiten un únicos y ∈ M y r ∈ Q tales que x = y + r . Esto es, M es

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.3. FUNCIONES CONVEXAS 461

un conjunto de representantes para ∼. Definimos Mr = {m + r : m ∈ M } de tal suerteque [0, 1] =

⋃{Mr : r ∈ Q} y {Mr : r ∈ Q} es una partición de [0, 1] en una cantidad

numerable de conjuntos. Supongamos que M es medible.Caso 1. µ(M ) = 0, entonces µ([0, 1]) = 0, lo cual es absurdo.Caso 2. µ(M ) > 0. Entonces,

µ([0, 1]) ≥ µ

(⋃{Mr : r ∈ Q ∧ 0 ≤ r ≤ 1}

)=

∑0≤r≤1r ∈Q

µ(Mr )

=

∑0≤r≤1

µ(M )

= ∞

que también es absurdo. Por consiguiente, M no puede ser medible según Lebesgue.�

43.3 Funciones convexas

Definición 43.3.1. Una función f : R → R es convexa débil cuando satisface la sigu-iente desigualdad

f(x1 + x2

2

)≤

12(f (x1) + f (x2)) (❂)

Definición 43.3.2. Definimos el cociente

ϕ(x1, x2) =f (x1) − f (x2)

x1 − x2;

La función f es convexa si ∀ x3, x1, x2 ∈ R con x1 , x3 , x2 y x1 > x2

ϕ(x2, x3) ≤ ϕ(x1, x3).

Lema 43.3.3. Toda función f : R → R convexa es continua.

Demostración. Considere una función convexa f . Para a < s < x < u < b y t suficien-temente cerca de x se cumple,

ϕ(x , s ) ≤ ϕ(x , t ) ≤ ϕ(x , u) ⇔

⇔f (x) − f (s )

x − s≤f (x) − f (t )

x − t≤f (x) − f (u)

x − u.

Tomamos,

f (x) − f (t ) =

(f (x) − f (t )

x − t

)(x − t ).

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

462 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Combinamos estas ecuaciones,(f (x) − f (s )

x − s

)(x − t ) ≤

(f (x) − f (t )

x − t

)(x − t )

(f (x) − f (u)

x − u

)(x − t )

⇒0 ≤ f (x) − f (t ) ≤ 0⇒f (x) − f (t ) = 0,

por lo que f es continua. �

La pregunta natural es si realmente es más débil la noción de convexa débil que lade convexa. En presencia del AE, en efecto, es más débil.

Teorema 43.3.4 (ZFE). Existe una función convexa débil que no es convexa.

Demostración. Sea B una base de Hamel (por el AE) del espacio vectorial R sobreQ. Un elemento de la base, digamos r1, debe ser racional. Sin perder generalidad,r1 = 1. Tomamos una función f que intercambia dos vectores de la base ri1 , ri2 , para

cualesquier i1 < i2, distintos de r1; así, f(pq

)=

pq para p , q ∈ Z, q , 0. En consecuencia,

para x1, x2 ∈ R, ri ∈ B y αi , βi ∈ Q,

f (x1) =∑i=1i,i1,i2

(αiri )+ αi1ri2 + αi2ri1 .

f (x2) =∑i=1i,i1,i2

(βiri ) + βi1ri2 + βi2ri1

f(x1 + x2

2

)=

∑i=1i,i1,i2

((αi + βi

2

)ri

)+

((αi + βi

2

)ri2

)

+

((αi2 + βi2

2

)ri1

)

=

12

©­­«

∑i=1i,i1,i2

(αiri ) + (αi1ri2)+ (αi2ri1)+

∑i=1i,i1,i2

(βiri ) + (βi1ri2)+ (βi2ri1)ª®®¬

=

12(f (x1) + f (x2)

así que se cumple (❂).Esta función es discontinua en una cantidad infinita de puntos, por lo que no

puede ser convexa. �

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 463

43.4 Aplicaciones a teoría de ideales

En esta sección trataremos varias aplicaciones del AE al álgebra, específicamente a lateoría de ideales, por lo que a continuación damos las definiciones pertinentes.

Definición 43.4.1. 1. Un anillo R es un conjunto con dos operaciones binarias +, ×(llamadas adición y multiplicación) que satisfacen los siguientes axiomas.

(a) (R,+) es un grupo abeliano.

(b) × es asociativa, es decir

(a × b) × c = a × (b × c )

para culesquier a, b , c ∈ R.

(c) Se cumple la ley distributiva en (R,+,×). A saber, para cualesquier a, b , c ∈R, ocurre

(a + b) × c = (a × c )+ (b × c )

a × (b + c ) = (a × b) + (a × c )

2. El anillo R es conmutativo si la multiplicación es conmutativa.

3. El anillo R tiene identidad (o tiene 1) si existe un elemento 1 ∈ R tal que

1 × a = a × 1 = a

para toda a ∈ R.

Se acostumbra, y así lo haremos, escribir ab en lugar de a × b . La identidad aditivase denota 0 y el inverso aditivo de cualquier elemento a ∈ R se escribe −a.

Definición 43.4.2. Un anillo R con 1, donde 1 , 0, es un anillo con división (o semicampo) cuando todo elemento distinto de cero a ∈ R tiene inverso multiplicativo, esdecir, existe b ∈ R tal que ab = ba = 1. Un anillo conmutativo con división es uncampo.

Definición 43.4.3. Sea R un anillo.

1. Un elemento a ∈ R distinto de cero es un divisor de cero si existe un elementob ∈ R, b , 0, tal que ab = 0 o ba = 0.

2. Suponga que R tiene identidad 1 , 0. Un elemento u de R es una unidad en Rcuando existe v ∈ R tal que uv = vu = 1. El conjunto de unidades en R se denotaR×.

Se comprueba con facilidad que las unidades en un anillo R conforman un gruporespecto a la multiplicación, por lo que R× se conoce como el grupo de unidades deR. Así, un campo es un anillo conmutativo F con identidad 1 , 0 en el que todoelemento distinto de cero es una unidad, es decir, F ×

= F − {0},

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

464 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Definición 43.4.4. Sean R un anillo, I un subconjunto de R, y r ∈ R.

1. r I = {r a : a ∈ I } e I r = {ar : a ∈ I }.

2. Un subconjunto I ⊆ R es un ideal izquierdo de R cuando,

(i) I es un subanillo de R;

(ii) I es cerrado respecto a multiplicación por la izquierda por elementos de R,es decir, r I ⊆ I para cada r ∈ R.

En forma similar, I es un ideal derecho si (i) se cumple y en lugar de (ii) ocurre

(ii)’ I es cerrado respecto a multiplicación a la derecha por elementos de R, esdecir, I r ⊆ I para cada r ∈ R.

3. Un subconjunto I que es ideal derecho e izquierdo se llama un ideal (o idealbilateral).

Si R es un anillo, los subanillos R y {0} son ideales. Un ideal I es propio si I , R.El ideal {0} es el ideal trivial y se denota 0. Si A ⊆ R, (A) es el menor ideal de Rque contiene a A, se llama el ideal generado por A. Un ideal generado por un sóloelemento se conoce como un ideal principal. Un ideal generado por un conjunto finitoes un ideal finito generado. Si A = {a} o {a1, a2, . . . , an} escribimos simplemente (a) o(a1, . . . , an) en lugar de (A).

Los ideales en un anillo conmutativo se pueden ordenar parcialmente por con-tención. El anillo R que es el ideal (1), es obviamente máximo en este orden. Losideales propios que son máximos respecto a contención de ideales propios se conocencomo ideales máximos en el anillo. Esto es, un ideal máximo es un ideal máximopropio.

Teorema 43.4.5. Cualquier anillo conmutativo distinto de cero contiene un ideal máximo.

Demostración. Sea S el conjunto de ideales propios en un anillo conmutativo R , 0.Dado que (0) es un ideal propio, S , 0. Ordenamos S parcialmente por inclusión.

Sea {Iα : α ∈ K } un conjunto totalmente ordenado de ideales propios en R. Paraencontrar una cota superior de esta familia es juicioso considerar la unión I =

⋃α∈K Iα.

Es claro que I es cota superior de la familia, pero no es tan evidente que I se un idealpropio de R. La unión de dos ideales no siempre es un ideal, por ejemplo 2Z ∪ 3Z noes un ideal en Z. Pero en nuestro caso, tratamos con una familia totalmente ordenadapor contención.

Sean x , y ∈ I , entonces x , y ∈ Iβ para alguna β ∈ I , porque la familia está lineal-mente ordenada. Se sigue que x ± y ∈ Iβ ⊆ I , por lo que I es un subgrupo aditivo.En forma similar se verifica que si r ∈ R y x ∈ I , entonces r x ∈ I . Resta corroborarqe I es propio. De no ser propio, tendríamos I = (1), lo que indica que 1 ∈ I y el1 debió aparecer en algún Iα, pues I es la unión, pero esto es imposible pues cadaIα es propio. De lo anterior se infiere que I es un ideal propio, por lo que I ∈ S , loqe certifica las hipótesis del lema de Zorn. Por el lema mencionado, S contiene unelemento máximo J , que es un ideal propio y no puede estar contenido en otro idealde R. Esto significa que R tiene un ideal máximo propio. �

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 465

Corolario 43.4.6. Culquier ideal propio en un anillo conmutativo está contenido en una idealmáximo.

Demostración. Sean R un anillo e I un ideal propio en R. El anillo cociente R/I no escero, así que contiene un ideal máximo según el teorema 43.4.5. La imagen inversade este ideal respecto al homorfismo cociente R → R/I es un ideal máximo de R quecontiene a I .

Podemos dar otra demostración. Sea I el idea propio en R. Considere la familiaS = { J : J es ideal e I ⊆ J }. Esta familia no es vacía, pues I ∈ S . Ordenamosparcialmente S por contención. Como en el teorema, se prueba que se cumplen lashipótesis del lema de Zorn, por lo que S tiene elemento máximo, es decir, un idealpropio máximo que contiene a I . �

Un hecho fundamental de la prueba del teorema 43.4.5 es que tenemos disponiblela identidad multiplicativa 1, que no puede estar en en ningún ideal propio. Por ejem-plo, el análogo del teorema 43.4.5 para grupos puede ser falso. En efecto, el grupoaditivo Q carece de subgrupos máximos propios, si H es un subgrupo propio de Q,entonces [Q,H ] = ∞ (si el índice fuese finito, digamos n, entonces H ⊃ nQ = Q, porlo que H = Q) y si elegimos r ∈ Q −H , entonces el subgrupo H +Zr contiene propi-amente a H con índice finito, así que H +Zr , Q. La importancia del teorema 43.4.5en los fundamentos del álgebra conmutativa arroja una razón de porque los anillosse piensan siempre con 1, al menos en áreas que dependen del álgebra conmutativa(como la teoría de números y la geometría algebraica).

La prueba del teorema 43.4.5 exhibe una falta de relación entre cotas superiores ensubconjuntos linealmente ordenados y elementos máximos en el conjunto. Considereun ideal propio de Z respecto a la inclusión. Los ideales máximos son pZ para pprimo. Los ideales {6Z, 12Z, 24Z} está totalmente ordenados por inclusión y en laprueba del teorema se crea una cota superior como 6Z ∪ 12Z ∪ 24Z = 6Z. Esta cotasuperior no es un ideal máximo en Z. Las cotas superiores no necesariamente sonelementos máximos.

En un anillo conmutativo, un elemento r es nilpotente si r n = 0 para algún n ≥ 1.Recuerde que un ideal P en un anillo R es primo cuando, para cualesquier x , y ∈ R, sixy ∈ P implica x ∈ P o y ∈ P .

Teorema 43.4.7. La intersección de los ideales primos en un anillo conmutativo es el con-junto de los elementos nilpotentes en el anillo.

Este teorema indica que si sabemos que un elemento en un anillo conmutativoesta en todo ideal primo, alguna de su potencias debe ser 0. Cuando R = Z, elresultado es obvio, pues los ideales primos son (0) y (p), p un primo, y la intersecciónes obviamente {0}, que es el único entero nilpotente. Considere otro ejemplo menostrivial: R = Z/(12). Sus ideales primos son (2)/(12) y (3)/(12) (no (0)/(12)), cuyaintersección es (6)/(12) = {0, 6 mod 12}, que son los elementos nilpotentes de Z/(12).

Demostración. Sea R un anillo, tome un elemento nilpotente r y un ideal primo P . Secumple r n = 0 para alguna n ≥ 1, por lo que r n ∈ P y como P es primo, r ∈ P . Sededuce que todo elemento nilpotente pertenece a cada ideal primo.

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

466 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Ahora tome r en la intersección de todo los ideals primos de R; debemos confirmarque existe n ≥ 1 tal que r n = 0. Probamos la contrapositiva: cualquier elemento nonilpotente está ausente en algún ideal primo (así, todo elemento nilpotente debe estaren todo ideal primo).

Tome un elemento r que no sea nilpotente, esto es, r n , 0 para toda n ≥ 1. Sea Sel conjunto de ideales I en R que no contienen a ninguna potencia de r ,

I ∈ S ⇔ {r n : n ≥ 1} ∩ I = �.

El ideal cero (0) no intersecta a {r n : n ≥ 1}, porque r no es nilpotente, así que S no esvacío. Ordenamos parcialmente a S por inclusión Si logramos certificar el cumplim-iento de las hipótesis del lema de Zorn, obtenemos un ideal que, como veremos, seráprimo y no contiene a r .

Sea {Iα : α ∈ A} un conjunto totalmente ordenado de ideales en I . Su unión I esun ideal (como antes vimos) y dado que ningún Iα contiene a alguna potencia de r ,su unión I tampoco lo hace. Por lo tanto, I ∈ S y dado que Iα ⊆ I para toda α ∈ A,I es cota superior en S del conjunto de ideales. Aplicamos el lema de Zorn paraobtener un ideal maximo P en S . Es obvio que P es propio y es máximo respecto a lapropiedad de no contener ninguna potencia positiva de r .

Afirmación 1. P es primo.Demostración de la afirmación 1. Suponga que x , y ∈ R y xy ∈ P . Debemos

confimar que x ∈ P o y ∈ P ; de no ser este el caso, los ideales (x) + P y (y) + P sonestrictamente más grandes que P , por lo que no pueden estar en S , lo que significaqe rm ∈ (x) + P y r n ∈ (y) + P para ciertos enteros positivos m, n. Escribimos,

rm = ax + p1 r n = by + p2,

donde p1, p2 pertenecen a P y a, b ∈ R. Multiplicamos,

rm+n = abxy + axp2 + byp1 + p1p2.

Ya que P es un ideal y xy ∈ P , el lado derecho está en P , en cuyo caso rm+n ∈ P , loque se opone a la propiedad inherente de P . En consecuencia, x ∈ P o y ∈ P , por loque P es primo. X (1)

Por construción ninguna potencia positiva de r está en P , en particular r < P . �

Aunque en la prueba P es máximo respecto a que es ajeno a {r , e 2, r 3, . . .} , no hayrazón para esperar que el ideal P es realmente un ideal máximo en R.

Corolario 43.4.8. Para cualquier ideal I en un anillo conmutativo R,⋂P ⊃I

P = {x ∈ R : ∃n ∈ ω(n ≥ 1 ∧ xn ∈ I )}

donde la intersección se efectúa sobre los ideales primos de R que contienen a I .

Demostración. Si xn ∈ I para alguna n ≥ 1, entonces para cualquier ideal primo P ⊃ Ise cumple xn ∈ P , x ∈ P . Para la conversa, suponga que x está en todo ideal primo deR que contiene a I . La aplicación canónica π : R → R/I identifica los ideales primos

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 467

en R que contienen a I con los ideales primos de R/I , por lo que π(x) = x está en todoideal primo de R/I . Según el teorema 43.4.8, x es nilpotente en R/I , lo que significaque xn = 0 para alguna n ≥ 1, por lo que xn ∈ I . �

Teorema 43.4.9 (Cohen). Si todo ideal primo en un anillo conmutativo es finito generado,entonces cada ideal en el anillo es finito generado.

Demostración. Probamos la contrapositiva, si existe un ideal en el anillo que no esfinito generado, entonces existe un ideal primo en el anillo que no es finito generado.Determinaremos este ideal como un ideal máximo respecto a la propiedad de no serfinito generado. Otra vez, tales ideales no son necesariamente máximos, en general,en R.

Sea S la familia de ideales que no son finito generados; por hipótesis S , �.Ordenamos parcialmente a S por contención y confirmemos que satisface las hipótesisdel lema de Zorn. Con este fin, considere una cadena C = {Iα : α ∈ A} en (S , ⊆).Sea I su unión; es claro que I es cota superior de C y como antes, I es un ideal;sólo resta verificar que I no es finito generado. Si I fuese finito generado, digamosI = (r1, . . . , rk ), cada generador está en algún Iα y dado que C es una cadena, todos losgeneradores deben aparecer en algún Iβ , en cuyo caso I ⊆ Iβ , por lo que I = Iβ e Iβresulta finito generado, una contradicción. Concluimos que I no es finito generado.

Ahora apelamos al lema de Zorn, existe un ideal P máximo respecto a no ser finitogenerado.

Afirmación 1. P es primo.Demostración de la afirmación 1. Claramente P es propio. Suponga que xy ∈ P ,

pero x < P , y < P . Entonces (x) + P es un ideal que contiene propiamente a P , por loque (x) + P < S , y debe ser un ideal finito generado,

(x) + P = (r1, . . . , rk ).

Escribimos ri = cix + pi para i = 1, 2, . . . , k , donde ci ∈ R y pi ∈ P . No estamossuponiendo que los pi generen a P , sólo que aparecen en la representacion de losri . En consecuencia, todo ri está en el ideal (x , p1, . . . , pk ), y cada pi está en el idealP ⊂ (x) + P = (r1m . . . , rk ). Se deduce que

(x) + P = (x , p1, . . . , pk ).

Dado cualquier p ∈ P , como P ⊂ (x) +P , escribimos

p = cx + a1p1 + · · · + akpk (❇)

con c y las ai en R. Entonces, cx = p −∑aipi ∈ P , por lo que c está en el ideal

J = {r ∈ R : r x ∈ P }. Es obvio que P ⊂ J y ya que xy ∈ P y y < P , J contienea y y por consiguiente J contiene a P propiamente. En virtud de que P es máximorespecto a ideales que no son finito generados, J debe ser finito generado. Por (❇),p ∈ x J +

∑ki=1Rpi , de donde se infiere P ⊂ x J +

∑ki=1Rpi . La contención inversa es

fácil (por la definición de J ), lo que da paso a

P = x J +

k∑i=1

Rpi .

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

468 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Ya que J es finito generado, esto muestra que P es finito generado, una contradicción.En consecuencia, x ∈ P o y ∈ P y P es primo. X (1)

Ahora, nos movemos hacia la teoría de módulos. Cuando M es un R-módulo y aes un ideal , aM es el conjunto de sumas finitas

∑ni=1 aimi con n ≥ 1, ai ∈ a y mi ∈ M .

Se verifica que aM es un submódulo de M .

Teorema 43.4.10. Sea M un R-módulo finito generado. Si todo submódulo de la formapM con p primo es finito generado, entonces todo submódulo de M es finito generado.

Cuado M = R, recuperamos el teorema de Cohen. Sin embargo, la prueba delteorema 43.4.10 tiene aspectos adicionales que no aparecen en la prueba del teoremade Cohen.

Si M es un R-módulo, el anulador en R de M es

p = AnnI (N ) = {a ∈ R : ∀ x ∈ M (xa = 0)}.

Demostración. Otra vez, probamos la contrapositiva. Si M tiene un submódulo queno es finito generado, entonces tiene un submódulo de la forma pM con p primo nofinito generado.

Sea S el conjunto de submódulos de M que no son finito generados; por hipótesisS , � y note que M < S . Como se ha hecho costumbre, ordenamos parcialmente aS por inclusión. Tomamos una cadena C en S y como antes, verificamos que ∪C esun R-módulo cota superior de los elementos de C y esta unión no es finito generada.Apelamos al lema de Zorn para obtener un R-módulo máximo N . Esto es, N es unsubmódulo de M que no es finito generado y (este el punto clave) cualquier submó-dulo de M que contienen propiamente a N es finito generado. Note que N , M .

No tenemos suficiente control sobre los elementos máximos dados por el lemade Zorn como para probar que N = pM para algún ideal primo p de R. Lo que siprobaremos es que

1. p = AnnR(M /N ) = {r ∈ R : rM ⊂ N } es un ideal primo de R.

2. pM no es finito generado.

Para confirmar que p es primo, notemos que p , R pues N $ M . Si p no es primo,existen x , y ∈ R con xy ∈ p pero x < p, y < p. Por la definición de p, estas condicionesen x , y significan

xyM ⊂ N , xM * N , yM * N .

Así, xM +N contiene propiamente a N , lo que da lugar a que xM +N es finito gen-erado. Sea {xmi + ni : i = 1, . . . , k} un conjunto de generadores de xM +N . Note quen1, . . . , nk no generan a N , pues N no es finito generado. Entonces,

xM +N =

k∑i=1

Rxmi +

k∑i=1

Rni .

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 469

(basta verificar que un conjunto generador del módulo en cada lado está del otrolado). Para cualquier n ∈ N ⊂ xM +N ,

n = r1xm1 + · · · + rkxmk + r′1n1 + · · · r

′knk

= x(r1m1 + · · · + rkmk ) + r′1n1 + · · · + r

′knk (★)

donde ri , r ′i ∈ R. En consecuencia, x(r1m1 + · · · + rkmk ) ∈ N , de modo que r1m1 + · · · +

rkmk está enL = {m ∈ M : xM ⊂ N },

que es un submódulo de M . Note que

N ⊂ L yM ⊂ L yM * N .

Por consiguiente, N es un subconjunto propio de L, por lo que L es finito generado.Por (★),

n ∈ xL +k∑i=1

Rni

así,

N ⊂ xL +k∑i=1

Rni .

La inclusión inversa es sencilla usando la definición de L. En consecuencia,

N = xL +k∑i=1

Rni .

El lado derecho es finito generado, lo cual es contradictorio porque N no es finitogenerado. Se sigue que p es un ideal primo en R.

En este punto, si tuviésemos M = R como en el teorema de Cohen, N sería un idealy AnnR(M /N ) = AnnR(R/N ) es igual a N , por lo que N = p es primo y concluiríamosla prueba del teorema de Cohen.

Resta verificar que pM no es finito generado; lo que probaremos es que N = pM +Qpara algún R-módulo Q finito generado. Por tanto, como N no es finito generado, pMtampoco puede ser finito generado.

Por hipótesis, M es finito generado, por lo que escribimos M = Re1 + · · · + Rel(no estamos suponiendo que los ei sean linealmente independientes, sólo que songeneradores). Entonces, M /N está generado sobre R por e 1, . . . , ek , de donde se sigueque

p = AnnR(M /N ) =

l⋂i=1

AnnR(Re i ).

El ideal p está en cada AnnR(Re i ), pero de hecho debe ser igual a uno de ellos,pues de no ser este el caso, cada AnnR(Re i ) contiene un elemento ri fuera de p, pero

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

470 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

entonces el producto de aquellos ri (sobre todos los i ) es un elemento fuera de p(porque p es primo), al mismo tiempo, el producto de los ri anula cada e i , por lo queeste producto está en cada anulador, por tanto en p. Esto es absurdo, así que p es elanulador de algún Re i . Sin perder generalidad, p = AnnR(Re 1) = {r ∈ R : r e1 ⊂ N }.

Dado que p , R, e 1 , 0 en M /N , así e1 < N , por lo que Re1 * N . De modo que,Re1 +N contiene propiamente a N , así que es finito generado, digamos por r j e1 + n j( j = 1, . . . , d ). Para n ∈ N ⊂ Re1 +N , escribimos

n =

d∑j=1

a j (r j e1 + n j ) =©­«d∑j=1

a j r jª®¬e1 +

d∑j=1

a jn j ,

con a j ∈ R. El coeficiete de e1 escala e1 a N por esta ecuación, lo que da lugar a que elcoeficiente de e1 está en p. De modo que,

N ⊂ pe1 +

d∑j=1

Rn j .

La otra inclusión es sencilla, así

N = pe1 +

d∑j=1

Rn j ⊂ pM +d∑j=1

Rn j ⊂ N +N = N .

En consecuencia, N = pM +∑dj=1Rn j , y como N no es finito generado, pM tampoco

lo es, lo que se quería demostrar. �

Nuestra siguiente aplicación del AE (en términos del lema de Zorn) consiste enextender homomorfismos entre ciertas clases de grupos.

Un grupo abeliano D es divisible si la función x 7→ nx es sobre para todo n ≥ 1(puesto que el grupo es abeliano, la operación se escribe como suma). Esto es, todoelemento deD es una n-ésima potencia para algún n ≥ 1. Por ejemplo, R/Z y Q/Z songrupos divisibles. Si trabajmos multiplicativamente, el gupo C × y sus subgrupos S 1 yµ∞ (las raíces complejas de la unidad) son grupos divisibles. La función x 7→ 22πix dalugar a isomorfismos R/Z � S 1 y Q/Z � µ∞. En lo sucesivo, homomorfismo significahomomorfismo de grupos.

Teorema 43.4.11. Sea D un grupo divisible. Si A es un grupo abeliano y B ⊂ A es unsubgrupo, cualquier homorfismo f : B → D se puede extender a un homomorfismo ˜f : A →

D .

Demostración. Tomamos a ∈ A con a < B . Entonces, el subgrupo 〈B , a〉 = B +Zagenerado por B y a contiene a B . Primero vemos como extender f a este subgrupode A.

Considere como puede intersectar 〈a〉 a B . El conjunto {k ∈ Z : ka ∈ B} es unsubgrupo de Z, por lo que es 0 o nZ para algún n ≥ 1. Si es 0, entonces cada elementode 〈B , a〉 tiene la forma b + kx para una úncia b ∈ B y cierto k ∈ Z. Definimosf ′ : 〈B , a〉 → D mediante f ′(b + kx) = f (b). Se verifica que esta definición es correcta

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 471

y que es un homomorfismo con f ′ ↾ B = f . En el caso en que {k ∈ Z : ka ∈ B} = nZ

para alguna n ≥ 1, entonces algún múltiplo positivo de a está en B , y na es unmúltiplo con el mínimo n posible. La función f tiene sentido en na, pero no en a.Si podemos extender f a un homomorfismo f ′ : 〈B , a〉 → D , entonces f ′(a) deberásatisfacer la relación n f ′(a) = f ′(na) = f (na). Aquí, f (na) ya está definida. Paradefinir f ′(a) requerimos una d ∈ D tal que nd = f (na), lo que se puede lograr porqueD es divisible.Ya que hayamo elegido d , definimos f ′(a) = d y en general

f ′(b + ka) = f (b) + kd .

Para confirmar que está bien la definición, si b + ka = b ′ + k ′a, entonces (k − k ′)a =b ′ − b ∈ B , así k − k ′ ∈ nZ por la definición de n. Escribimos k = k ′ + nl para agunal ∈ Z, de donde se sigue

f (b)+ kd = f (b) + (k ′ + nl )d

= f (b) + k ′d + l (nd )

= f (b) + k ′d + l f (na)

= f (b + lna) + k ′d .

Como

b + lna = b + (k − k ′)a

= b + ka − k ′a

= b ′ + k ′a − k ′a

= b ′

tenemos

f (b)+ kd = f (b ′) + k ′d .

En consecuencia, f ′ : 〈B , a〉 → D está bien definida. Queda como ejercicio con-statar que es un homomorfismo.

Sea S el conjunto de parejas (C , g ), donde C es un subgrupo entre B y A, y g : C →

D es un homomorfiso que extiende a f (es decir, g ↾ B = f ). El diagrama aparece enla siguiente figura.

El conjunto S no es vacío porque (B , f ) ∈ S . Ordenamos parcialmente S mediantela prescripción (C , g ) ≤ (C ′, g ′) si C ⊆ C ′ y g ′ ↾ C = g . Esto es, g ′ extiende a g a unsubgrupo intermedio C ′.

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

472 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Si {(Ci , gi ) : i ∈ I } es una cadena en S , debemos buscarle una cota superior en S .Usamos C =

⋃i∈I Ci como el subgrupo (lo que se verifica como lo hemos hecho antes

con anillos) y sea g : C → D mediante g (x) = gi (x) si x ∈ Ai . Para verificar que ladefinición es correcta, sea x ∈ Ci ∩C j , debemos constatar que gi (x) = g j (x).

Ocurre (Ci , gi ) ≤ (C j , g j ) o (C j , g j ) ≤ (Ci , gi ) pues las parejas (Ci , gi ) están totalmenteordenadas en S . Si (Ci , gi ) ≤ (C j , g j ), entonces Ci ⊆ C j y g j ↾ Ci = gi , por lo queg j (x) = gi (x). Que gi (x) = g j (x) si (C j , g j ) ≤ (Ci , gi ) se prueba en forma similar. Dadoque cualesquier dos elementos en C estan en un Ci común, g es un homomorfismoporque cada gi lo es y dado que gi ↾ B = f para toda i , deducimos g ↾ B = f . Enconsecuencia, (C , g ) ∈ S y (C , g ) es una cota superior de {(Ci , gi ) : i ∈ I }.

Una vez comprobadas las hipótesis del lema de Zorn, lo aplicamos a S para encon-trar un elemento máximo (M ,h). Esto es, M es un grupo entre B y A, h : M → D es unhomomorfismo y no existe extension alguna de h a un homorfismo de un subgrupode A que contenga propiamente a M .

Afirmación 1. M = A.Demostración de la afirmación 1. Supongamos que no es así; entonces, existe a ∈

A −M . Por el argumento que usamos al inicio de esta prueba, con B y f remplazadospor M y h, h se puede extender a un homomorfismo 〈M , a〉 → D .

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 473

lo que se opone a que (M ,h) sea máxima. En conclusión, M = A. �

Ejercicios1. Si G es un grupo no trivial finito generado, use el lema de Zorn para confirmar

que G contiene un subgrupo máximo propio. Más generalmente, si H es unsubgrupo propio de G , entonces existe un subgrupo máximo M de G tal queH ⊆ M ⊂ G . [Sugerencia: proceda como en la prueba de 43.4.5 para verificarque I es propio, use que G es finito generado.]

2. En la prueba del teorema 43.4.8 se demostró que si r ∈ R no es nilpotente, elideal máximo respecto a la propiedad de no intersectar a {r n : n ≥ 1} es primo.La propiedad algebraica relevante de {r n : n ≥ 1} es su cerradura respecto a lamultiplicación y que no contiene al cero. Use el lema de Zorn para mostrar quepara cualquier subconjunto de un anillo R cerrado respecto a multiplicación yque no contiene al 0, existe un ideal en R que es máximo respecto a ser ajeno alsubconjunto y este ideal máximo es primo.

3. Use el lema de Zorn para probar un análogo del teorema 43.4.9 para idealesprincipiales: si todo ideal primo en un anillo conmutativo es principal, entoncestodos los ideales son principales. Es falso que si todo ideal primo tiene a lo sumodos generadores, entonces todos los ideales tienen a lo sumo dos generadores.Por ejemplo, en C [X ,Y ] los ideales primos tienen 1 y 2 generadores pero el ideal(X 2,XY ,Y 2) no puede generarse por dos elementos.

4. Un R módulo M es inyectivo si cualquier

0 N1//0

M

N1 N2h

//N1

M

f

��

N2

M

g

��

digrama exacto por renglones deR-módulos yR-homomorfismos se puede com-pletar (en forma conmutativa) mediante un R-homomorfismo g : N2 → M .

(a) Compruebe que si M ,N son R-módulos isomorfos y M es inyectivo, Ntambién lo es.

(b) Corrobore que un R-módulo M es inyectivo si y sólo si para cada R-móduloN2 y todo submódulo N1 de N2, cualquier R-homomorfismo f : N1 → M sepuede extender a un R-homomorfismo g : N2 → M . Por consiguiente, enla definición de inyectivo se puede suponer que N1 es submódulo de N2 yh se remplaza por la inyección i : N1 → N2.

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

474 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

(c) Demuestre que si M es un submódulo inyectivo del R-módulo N , entoncesM es un sumando directo de N . [Sugerencia: Sea M un submódulo inyec-tivo de un R-módulo N y considere el diarama exacto por renglones

0 M//0

M

M Ni

//M

M

idM

��

N

M

g

��

de R-módulos, donde idM es la identidad en M e i es la inyección canónica.Si g : N → M completa el diagrama conmutativo, entonces g i = idM . Enconsecuencia, g escinde a i . Por supuesto, aquí se requieren conocimientosde sucesiones exactas.]

(d) Pruebe que las siguientes afirmaciones son equivalentes.

(i) M es inyectivo.(ii) Para cada ideal derecho A de R, todo R-homomorfismo f : A → M se

puede extender a un R-homomorfismo g : R → M .(iii) Para cada ideal derecho A de R y todo R-homomorfismo f : A → M

existe x ∈ M tal que f (a) = xa para cualquier a ∈ A.

[Sugerencia: (ii)⇒(iii) Si g extiende f a R, sea g (1) = x . Entonces, f (a) =g (a) = g (a)a = xa para cada a ∈ A.(iii)⇒(i) Si N1 es un submódulo de N2, i : N1 → N2 es la inyección canónicay f : N1 → M es un R-homomorfismo, necesita mostrar que el diagrama

0 N1//0

M

N1 N2i

//N1

M

f

��

N2

M

g

��

se puede completar a un diagrama conmutativo mediante un R-homomor-fismo g : N2 → M . Considere el conjunto S de parejas ordenadas (X , g ),donde X es un submódulo de N2 tal que N1 ⊆ X y g ↾ N1 = f . Ordeneparcialmente S mediante (X , g ) ≤ (X ′, g ′) si X ⊆ X ′ y g ′ ↾ X = g . Noteque S , � ya que (N1, f ) ∈ S , por lo que el lema de Zorn proporciona unelmento máximo en S , digamos (X ∗, g ∗). Si X ∗

= N2, la prueba termina, asíque suponga que existe y ∈ N2 −X

∗, entonces se tiene un R-homomorfimodel ideal derecho (X ∗ : y) a M dado por a 7→ g ∗(ya). Por hipótesis, estoimplica que existe z ∈ M tal que a 7→ za, para toda a ∈ (X ∗ : y). Sih : X ∗

+ yR → M está definida como h(x + ya) = g ∗(x) + za, h extiende ag ∗ a X ∗

+ yR, lo que se opone que (X ∗, g ∗) es máxima en S . En conclusión,X ∗= S .]

5. Sean K ,F campos. Suponga que algún subanillo de K admite un homomor-fismo de anillos a F (por ejemplo, si K tiene característica 0, Z ⊂ K y existe

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

43.4. APLICACIONES A TEORÍA DE IDEALES 475

un homorfismo de anillo Z → F , mientras que si K y F tienen característicap > 0, entonces Z/(p) es un subcampo de K y F , por lo que existe una inyecciónZ/(p) ֒→ F ).

(a) Sea S el conjunto de parejas (A, f ) donde A es un subanillo de K y f : A →

F es un homomorfismo de anillos, así que S , � por hipótesis. Ordeneparcialmente S mediante (A, f ) ≤ (B , g ) si A ⊆ B y g ↾ A = f . Apele allema de Zorn para garantizar que S contiene una pareja máxima, esto es,un subanillo A ⊆ K que admite un homomorfismo de anillos f : A → F yno se puede extender a un homomorfismo de anillos a un subanillo de Kmás grande.

(b) Si K = Q y F = Z/(2), corrobore que el anillo de fracciones {m/n : m ∈

Z, n ∈ Z − {0}, n es impar} admite un homomorfismo a Z/(2) y es la parteanillo de una pareja máxima (A, f ) en S . Note que Q mismo no es partede una pareja máxima ya que no existe un homomorfiso de anillo de Q aZ/(2). ¿Cuál es el núcleo de este homomorfismo?

(c) Si (A, f ) es una pareja máxima en S , constate que todo elemento de A queno pertenece al núcleo de f es una unidad en A, por lo que Ker (f ) es elúnico ideal máximo en A. Un anillo con sólo un ideal máximo se llama unanillo local. Si se trata de encontrar un subanillo máximo de un campo queadmite un homomorfismo a otro campo obtenemos, mediante el lema deZorn, anillos locales.

6. Pruebe que toda relación � en un conjunto X que sea un orden parcial en X sepuede extender a un orden lineal ≤ en X .

7. Se dice que un subconjunto A ⊆ R es algebraicamente independiente si paracualquier polinomio distinto de cero p(x1, . . . , xn) en n variables con coeficientesracionales y cualquier sucesión a1, . . . , an de elementos diferentes deA, p(a1, . . . , an) ,0. Confirme que existe un subconjunto algebraicamente independiente A deR tal que si Q(A) es un campo generado por Q y A, entonces para todo b ∈

R −Q(A), existe un polinomio distinto cero p(x) con coeficientes en Q(A) tal quep(b) = 0. Una familia A con esta propiedad se llama base de trascendencia de R

sobre Q.

8. Un grafo en un conjunto W es una pareja ordenada (V ,E) tal que E ⊆ [W ]2,donde [W ]2 es el conjunto de conjuntos con dos elementos deW . Para E0 ⊆ E ,un grafo (W ,E0) es una arboleda en un grafo (V ,E) cuando carece de cíclos, estoes, no existe una sucesión v0, v1, . . . , vn = v0 con n > 2 tal que {vi , vi+1} ∈ E0 parai ∈ n. Si E0 ⊆ E es un grafo, decimos que (W ,E0) genera (W ,E), cuando paracada v ∈W existe w ∈W tal que {v ,w} ∈ E0. Sea (W ,E) un grafo que se generaa sí mismo. Verifique que existe una arboleda (W ,E0) que genera a (W ,E).

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro

476 CAPÍTULO 43. APLICACIONES DEL AXIOMA DE ELECCIÓN I

Universidad Autónoma Metropolitana IztapalapaProhibida su reproducción parcial o total con fines de lucro