2.C. Concepts de vérité en mathématiques
Rappelons et développons les différents concepts de «vérité» que nous avons
vus pour les énoncés mathématiques, du plus simple au plus subtil.
Le plus simple était la vérité vérité relative (analysée plus en détail en 1.B), à savoir
la valeur booléenne de tout énoncé exprimé dans une théorie donnée, en
fonction du système (modèle de la théorie) où il est interprété; ce système est
supposé fixé comme une variable libre implicite. Plus généralement, toute
formule prend une valeur booléenne pour chaque donnée de valeurs fixes de ses variables
libres dans ce système.
Vient ensuite la prouvabilité dans chaque théorie axiomatique du premier ordre donnée;
cela coïncide avec la qualité d'être relativement vrai dans tous ses modèles.
Enfin, viennent les vérités dans deux théories réalistes: l'arithmétique et la
théorie des ensembles. Examinons-les plus en détails.
Vérités arithmétiques
Comme expliqué en
1.C, le concept de prouvabilité dans toute théorie explicite du
premier ordre, et plus généralement tout concept de «prouvabilité» (prédicat)
effectif sur la classe des énoncés de toute théorie concevable, doit
être un prédicat FOT-existentiel, équivalent (via un certain codage) avec un prédicat
existentiel de l'arithmétique. Mais il faut se référer au concept de vérité réaliste de
l'arithmétique pour les interpréter. C'est un concept idéal mais clair
(indépendant de toute hypothèse ontologique sur les infinis), désignant la classe des
propriétés du «modèle standard ℕ de l'arithmétique» («le vrai ensemble ℕ de tous, et
seulement tous, les entiers vraiment finis»; en bref, comme tous les modèles
standards de l'arithmétique sont des copies identiques les uns des autres).
En effet, tous les objets standard d'un FOT étant finis peuvent être acceptés comme réels
(quelle que soit leur taille), tandis que leur distinction avec les objets non-standard
(pseudo-finis) est également réelle bien que non formalisable.
La signification des énoncés peut se comprendre d'abord pour les formules bornées,
puis celles avec 1 quantificateur
ouvert, comme les énoncés de prouvabilité ou de cohérence, dont les objets sont de
simples systèmes finis (preuves). Et ainsi de suite pour chaque quantificateur ouvert
supplémentaire sur une formule précédemment acceptée, même si leur signification
devient de plus en plus subtile.
Or, le théorème d'incomplétude a montré que ce prédicat de vérité réaliste de
l'arithmétique n'est pas lui-même un prédicat existentiel. Plus précisément, même
la négation du prédicat de prouvabilité de toute théorie explicite capable d'exprimer
l'arithmétique, ne peut être elle-même un prédicat existentiel.
Mais nous avons encore besoin de solutions partielles: des
classes existentielles d'énoncés d'arithmétique avec les deux qualités:
- FOT-correcte (incluse dans la classe des vérités réaliste);
- Large (comparée par inclusion avec d'autres classes existentielles de ce type).
La manière naturelle de progresser dans la recherche, illimitée et non-algorithmique,
de telles classes de plus en plus larges tout en restant FOT-correctes, consiste à
rechercher des théories des ensembles axiomatiques de plus en plus fortes. Commentons
cela plus avant.
Autres concepts de force
Toute théorie axiomatique des ensembles (ou autre théorie fondamentale) T
est reflétée par 2 classes d'énoncés arithmétiques:
- La classe de ses théorèmes d'arithmétique;
- L'énoncé de sa cohérence.
Les deux ne doivent pas être confondues:
- 1. ne peut pas contenir 2. (sauf si 2. est faux), mais 2. doit être vrai si
1. est valide. En effet, 1. n'est constitué que des théorèmes de T avec
une preuve standard, tandis que 2. signifie interdire au présent univers courant
de contenir même une preuve non standard (pseudo-finie) de
T qui conduirait à une contradiction.
- Donc, 2. signifie l'existence, dans l'univers actuel, d'un modèle de T
sans exigence de standardité; tandis que 1. signifie que l'univers actuel est d'accord
avec T sur l'arithmétique, et ne peut donc être justifié philosophiquement que
par l'idée que T est valide dans le sens d'avoir un modèle FOT-standard.
Cela mène à deux autres conceptions (définitions) d'un préordre de "force" entre
théories fondatrices, généralement équivalentes à notre définition de 1.A
(les possibles cas de non-équivalence ne seront pas considérés ici):
- L'ordre d'inclusion entre leurs classes de théorèmes d'arithmétique ;
- La déductibilité (implication prouvable) entre les énoncés de cohérence:
T' est plus forte que T si la cohérence de T est déductible de la
cohérence de T'; alors T' est dit strictement plus fort que T si la
cohérence de T est un théorème de T'.
(1. serait lié à l'ordre d'implication entre énoncés de FOT-correction, sauf que l'expression
de tels énoncés nécessite un cadre assez fort pour exprimer la vérité arithmétique, tel que
MT).
Si T' peut prouver l'existence d'un modèle standard de T alors T' est
strictement plus fort que T dans les deux sens.
La théorie des ensembles du réalisme à l'axiomatisation
Pour qu'une théorie axiomatique des ensembles donne une classe de théorèmes
arithmétiques à la fois FOT-correcte et large, elle doit être "correcte et
pourtant très bonne":
- Correcte = acceptant encore certains univers standard (pour rester FOT-correcte);
- Forte = n'accepte que les "grands" univers (vraiment grands dans le cas standard,
sinon en tout cas apparaissant grands par la description de leur hiérarchie de sous-univers),
pour contribuer à une large classe de théorèmes.
Parmi les théories des ensembles correctes et explicites (ou d'autres théories fondatrices),
il ne peut y en avoir une plus forte que toutes: de l'une quelconque T, on peut obtenir
de plus fortes, au moins arithmétiquement, par les manières suivantes, grossièrement
ordonnées par puissance croissante (où T0 est théorie possiblement
plus faible mais qui satisfait la qualité «ouverte» ci-dessous):
- T + la cohérence de T;
- T0 + l'existence d'un univers standard de T ;
- T0 + l'existence d'une infinité d'univers standard de T
formant un multivers standard (en fait seulement assuré d'être quasi-standard).
Et ce ne sont que les premiers d'une liste ouverte de méthodes possibles d'efficacité
croissante pour leur effet de renforcement par rapport à la complexification de description.
Il s'avère en fait que le schéma de remplacement, utilisé dans la théorie des ensembles
ZF, revient à utiliser une méthode de
renforcement beaucoup plus puissante que celles-ci.
Les arguments pour justifier toute version ainsi forte de la théorie des ensembles
comme fondement valide des mathématiques doivent rester quelque peu
philosophiques et donc évalués de
manière intuitive, non complètement formalisable, précisément pour faire
mieux que toute preuve formelle ou autre algorithme prédéfini :
aucune méthode formelle fixe ne peut toujours vérifier pour une théorie forte quand
elle est cohérente, encore moins quand elle est FOT-corrente (par indéfinissabilité de la vérité),
ou correcte (l'idée que certains axiomes qui excluent une certaine taille d'univers standard
en acceptent encore de plus grands).
L'utilité de théories axiomatiques des ensembles fortes pour prouver de larges
classes de vérités arithmétiques (dans la mesure où les disputes philosophiques
sur le statut ontologique des idéaux motivant ces théories ne mettent pas en cause
le rôle de ces idéaux comme raisons de croire ces théories FOT-correctes), peut
alors être lu comme un argument d'indispensabilité pour la réalité des univers ainsi
décrits, au-delà de l'infini de ℕ.
En effet, elle «donne de l'importance» à ces théories, tandis que leur cohérence
avec la simple existence de ℕ, assure l'existence de modèles. Seuls des modèles
non standard sont ainsi assurés d'exister, mais leur fonctionnement est de toute façon
pratiquement semblable à celui des modèles standard qui étaient idéalement visés.
D'où notre dernier concept de vérité, qui est la vérité des énoncés de théorie des
ensembles.Condition de compatibilité des axiomes
Étant donné plusieurs théories axiomatiques des ensembles avec les deux qualités
(correcte et forte), considérons la théorie obtenue comme leur union (l'union
de leurs classes d'axiomes si elles ont les mêmes symboles, par exemple si
toutes n'utilisent que ∈, comme ZF). Elle sera plus forte que chacun, mais est-elle encore
correcte ? Qualifions une collection de théories des ensembles (ou leurs axiomes)
de compatibles si leur union (conjonction) reste correcte.
Ainsi, au-delà de la correction et de la force des théories axiomatiques des ensembles,
une exigence de qualité supplémentaire pour leurs axiomes est nécessaire pour que,
sans limiter la force des théories des ensembles correctes qui peuvent être ainsi écrites,
toutes ces théories soient compatibles. En fait, ce problème a une solution naturelle.
Cette qualité supplémentaire qui convient est un autre concept idéal, non complètement
formalisable, alors exprimons-le d'abord intuitivement :
- un axiome est ouvert s'il est satisfait par tout univers dans lequel
l'éternité est un temps très long surtout vers la fin (= univers ouvert).
Ceci vise à être plus spécifique que le simple "l'éternité est un temps
très long" qui reformule la qualité "grand" pour les univers, et comme
approfondissant notre précédent concept d'ouverture.
Expliquons-le en plusieurs étapes.
D'abord, aucun axiome ne doit limiter la taille de l'univers, pour compatibilité
avec des théories plus fortes que cette taille (par exemple, une théorie
correcte T n'acceptant qu'un seul univers standard serait
incompatible avec l'énoncé d'existence d'un univers standard de T).
Ensuite, le risque restant pour plusieurs énoncés d'être incompatibles,
est si les valeurs d'au moins 2 d'entre eux varient indéfiniment (alternant vérité
et fausseté) lorsque l'univers s'étend, de sorte qu'aucun univers
standard "au-delà d'une certaine taille" ne puisse tous les satisfaire
(leur conjonction limiterait la taille de l'univers). Ceci est résolu en n'acceptant
que les axiomes «ouverts», qui s'accorderont tous sur des univers standard
«ouverts». Expliquons comment.
Considérons un tel énoncé variable: écrit sous forme
prénexe, il doit utiliser les deux types de quantificateurs ouverts.
Analysons le cas des énoncés avec seulement 2 quantificateurs ouverts:
∃x, ∀y, A(x,y), parmi lesquels les énoncés
S(C)
selon lesquels une classe est un ensemble. (De là, le cas ∀x, ∃y se
déduit par négation, tandis que les cas d'un plus grand nombre de quantificateurs
ouverts seraient plus délicats et ne seront pas discutés ici).
Pour tout multivers standard où il varie indéfiniment ainsi, un tel énoncé s'avère être
faux dans son union. Donc, prendre un tel énoncé comme un axiome serait
inapproprié pour ce multivers. Or, ce qui compte vraiment, c'est le comportement
de la classe de tous les univers standard (il n'y a pas de moyen systématique de
le déterminer, mais c'est notre idéal visé). Alors, la qualité d'ouverture d'un énoncé
est celle de refléter la vérité dans l'union d'un multivers qui se comporte comme la
classe voulue de tous les univers standard.
De tels univers "ouverts", ayant les mêmes propriétés que l'union d'un
multivers standard ressemblant à la classe de "tous les univers standard",
peuvent être intuitivement décrits comme "beaucoup plus grands que
tout univers plus petit": il ne doit y avoir aucune limite à mesure dont l'univers
peut être plus grand que n'importe quel sous-univers (décrit par une théorie plus faible).
Cela évite également l'inefficacité qui pourrait survenir dans le cas contraire,
d'un système axiomatique significativement plus complexe mais seulement un peu
plus fort qu'un autre.
La quête de théories axiomatiques des ensembles approchant les 3 qualités
idéalement conçues (forte et ouverte mais encore correcte) pour sélectionner
des univers avec les 3 qualités correspondantes (grand et ouvert mais existant encore
parmi ceux standards), est sans fin. Heureusement, des théories assez simples
telles que ZF satisfont déjà ces qualités à un degré élevé, décrivant des réalités
bien plus vastes que ce qui est habituellement utile. C'est ainsi qu'une vision
platonicienne de la théorie des ensembles (voyant l'univers de tous les objets
mathématiques comme une réalité fixe et exhaustive) peut fonctionner comme
une bonne approximation, bien qu'elle ne puisse pas être un fait exact et absolu.
Cadres logiques alternatifs
La description faite ici des fondements des mathématiques (logique
du premier ordre et théorie des ensembles), n'est essentiellement
qu'une expression clarifiée équivalente de celles largement
acceptées (une introduction différente aux mêmes mathématiques).
D'autres cadres
logiques déjà mentionnés, à développer ultérieurement,
restent dans la «même famille» des «mathématiques classiques».
Mais d'autres cadres plus radicalement différents
(concepts de logique et/ou d'ensembles), appelés logiques
non classiques, pourraient être envisagés. Exemples:
- Certains logiciens ont développé la «logique intuitionniste»,
qui laisse aux formules une indétermination possible comme nous
avons mentionné pour les quantificateurs ouverts, mais traités
comme une modification de la logique booléenne pure (le rejet du
tiers exclu, où ¬(¬A) n'implique pas A), sans
mention particulière des quantificateurs comme source de cette
indétermination. On peut aussi voir cela comme une confusion
formelle entre vérité et prouvable. Dans ce cadre, {0}∪ ]0,1] ⊂
[0,1], sans égalité. Je n'ai pas personnellement vu d'intérêt à
ce formalisme, mais seulement entendu dire que les spécialistes
d'informatique théorique l'ont trouvé utilité.
- En étudiant la
théorie de la mesure (qui définit mathématiquement
probabilités dans les ensembles infinis), j'ai eu l'idée
d'interpréter ses résultats comme des énoncés plus simples sur
un autre concept d'ensemble, avec la propriété intuitive
suivante. Soit x une variable prise aléatoirement
dans [0,1], en tirant successivement à pile ou face chaque
chiffre de son développent binaire infini. Soit E le
domaine de x, ensemble de tous les nombres aléatoires
dans [0,1]. Il est non vide parce que des nombres aléatoires
peuvent être produits. Puis, un autre nombre aléatoire
semblable, de même domaine (y ∈ E), mais tiré
indépendamment de x, n'a aucune chance d'être égal à x.
Donc, ∀x∈E, ∀y∈E, x ≠ y
Ainsi x ∈ E n'est pas toujours équivalent à
∃y∈E, x = y.
Nous ignorerons de telles alternatives dans le reste de ce travail.
Other languages:
EN : 1. First foundations of
mathematics : Concepts of truth in mathematics