Aspects philosophiques des fondements des mathématiques
Complétons notre initiation
aux fondements des mathématiques, par des aspects plus philosophiques:
comment la réalité mathématique est structurée par un flux de son
propre "temps" de type "bloc
en croissance" indépendant de notre temps.
- D'abord, 1.A à 1.C montreront ce "temps" comme affectant
la théorie des modèles ;
- Puis son rôle en théorie des ensembles (clarifiant la différence entre ensembles et classes)
sera exploré en 1.D, 2.A, 2.B, 2.C ;
- finalement, une description plus détaillée
en termes d'analyse ordinale est présentée dans un article séparé, supposant
connaissance des ordinaux.
Ces compléments ne sont pas nécessaires pour continuer avec la partie 2 (2.1 à 2.10 sauf petites remarques
en 2.2, 2.7 et 2.10), partie 3 et plus, tandis que 2.A-2.C requiert à la fois
la partie 1 jusqu'à 1.D et la partie 2 jusqu'à 2.7.
1.A. Temps en théorie des modèles
L'ordre temporel de l'interprétation des expressions
Les interprétations des expressions d'une théorie T dans un modèle M
dépendent les unes des autres, donc viennent comme calculées les unes après
les autres. Cet ordre temporel suit l'ordre de construction des sous-expressions
vers les expressions qui les contiennent.
Par exemple, pour donner un sens à la
formule xy + x = 3, les variables libres x et y doivent prendre
une valeur en premier. Puis, xy prend une valeur, obtenue en les multipliant.
De là, xy+x prend une valeur, puis la formule entière (xy+x=3)
prend une valeur booléenne dépendant des valeurs de x et y.
Enfin, en prenant par exemple la formule close ∀x,
∃y, xy+x=3, sa valeur booléenne (qui est faux
dans le monde des nombres réels), «est calculée à partir de» celles
prises par la formule précédente pour toutes les valeurs possibles
de x and y, et vient donc après elles.
Les interprétations d'une liste finie d'expressions peuvent être rassemblées par une seule
autre expression, les prenant comme sous-expressions. Cette grande expression
est interprétée après elles toutes, mais appartient toujours à la même théorie.
Mais pour qu'une même expression invoque un ensemble infini d'expressions
(tel que l'ensemble de toutes les expressions de T, ou seulement tous les termes
ou tous les énoncés), ces expressions doivent être traitées comme objets (valeurs
d'une variable). Si T est une théorie fondatrice, elle peut définir (ou construire)
un système ressemblant à ceci, de sorte que, dans tout modèle standard de T
(en un sens qui sera précisé plus loin), cette définition désignera une copie exacte de
cet ensemble d'expressions.
Cependant, l'interprétation systématique de toutes les
expressions de T dans M ne peut correspondre à aucune définition
par une seule expression de T interprétée dans le même M. À savoir, cela
fait partie du système combiné [T,M] au-delà de M, décrit
par une théorie du modèle
(1MT) qui, même si elle peut être développée à partir de T, nécessite de toute
façon une autre interprétation, à un niveau méta au-dessus de M.
Le temps infini entre les modèles
Sans chercher à formaliser la théorie du modèle MT de la logique du premier ordre
(qui sera abordée dans les prochaines sections), esquissons une classification de
ses composants (mélangeant notions, structures et axiomes) en parties selon ce
qu'elles décrivent. La plupart des questions sont inchangées en restreignant la
considération à un 1MT, de modèle un seul système [T,M] fait
d'une théorie T avec un modèle M, lorsque ces T et M
(spécifiables par un choix de variante de 1MT) sont assez grands pour essentiellement
contenir toute théorie et tout système.
-
Une théorie des théories TT (et de même une théorie de la théorie 1TT),
elle-même formée de groupes successifs de composants, qui suivent en gros
les niveaux de la théorie décrite T :
- Une description des "types abstraits" et des "symboles" ;
- Une description des "expressions" et des "énoncés" ;
- 1TT peut être vu comme une extension de TT par des symboles de
prédicat unaires τ, L, X qui sélectionnent respectivement les classes de composants de
T (ses types, symboles et axiomes) dans les domaines donnés de
"tous ceux disponibles"; ou seulement X si les "types" et "symboles"
dans TT ne signifiaient que ceux de la théorie considérée;
-
La théorie des démonstrations prolonge 1TT par la notion de "preuve", et donc aussi celles de
"théorème" et "contradiction". Cela peut aussi simplement se construire à partir de la notion de
"preuve" des énoncés logiquement valides
dans TT, comme une preuve d'un théorème revient à celle de la validité logique de son implication
partant de certains axiomes.
- Une théorie des systèmes décrivant M en y interprétant les types et symboles de
structures de T donnés par 1TT (si la liste des types et le langage de T
sont finis et explicitement donnés, alors le rôle de sa théorie du système peut être
joué par T lui-même; sinon cela utilise les méta-notions
de "types" et "structures").
- La description des interprétations (attributions de valeurs) de toutes les expressions de
T dans M, pour toutes les valeurs de leurs variables libres; aussi donc, les
interprétations de tous les énoncés (requises pour exprimer l'axiome M⊨T de
véracité de tous les axiomes de T dans M si ces axiomes sont en nombre infini).
La dernière partie de [T,M] est une construction
mathématique déterminée par la combinaison des deux systèmes T
et M, mais n'est pas directement contenue dans ces données: elle
est construit après.
La métaphore du temps usuel
Je peux parler de «ce que dont j'ai parlé à tel instant»: cela a bien un sens si ce
propos passé en avait un, car j'en avais saisi le sens et je m'en souviens.
Mais parler de «ce dont je parle» tout court, n'informerait pas sur ce dont il s'agit:
cela pourrait être n'importe quoi, et devient absurde dans une phrase qui modifie
ou contredit ce sens («le contraire de ce que je dis»). Parler de «ce dont je parlerai
demain», même en sachant déjà ce que je dirai, ne suffirait pas non plus à en donner
déjà le sens: au cas où je parlerai de «ce dont j'ai parlé hier» (donc maintenant) cela
ferait un cercle vicieux; mais même si la forme de mon futur propos assurait que son
sens existera demain, cela ne le donnerait pas encore aujourd'hui. Quelles que soient
mes spéculations, le sens réel des expressions qui seront prononcées ne surviendra
qu'en leur temps, dans le contexte à venir.
Faute d'intérêt à décrire des expressions sans leur
signification, autant restreindre l'étude aux propos passés,
se contenter de "vivre" les propos présents et ignorer ceux à
venir.
Ainsi, mon actuel univers du passé que je peux décrire aujourd'hui,
inclut celui d'hier, mais aussi mes propos d'hier sur celui-ci et
leur signification. Je peux donc décrire aujourd'hui des choses
extérieures à l'univers que je pouvais décrire hier. Or, depuis
hier, je n'ai pas appris à parler le Martien ni n'ai acquis une
nouvelle intelligence transcendantale; mais le même langage
s'applique à un univers plus vaste, enrichi de nouveaux objets. Ces
nouveaux objets étant de mêmes types que les précédents, mon univers
d'aujourd'hui peut ressembler à celui d'hier; mais d'un
univers à l'autre, les mêmes expressions peuvent prendre des sens
différents.
Comme des historiens, chaque théorie mathématique ne peut «à chaque
instant donné» que décrire un système d'objets mathématiques passés. Son
interprétation dans ce système, «se produit» formant un présent
mathématique hors de ce domaine (au-delà de ce passé).
Puis décrire cet acte d'interprétation, c'est étendre la portée de nos descriptions:
le modèle [T,M] de 1MT, englobant les interprétations de toutes les
expressions de T dans le présent système M des objets passés, est
le prochain domaine du passé, venant lorsque la totalité infinie des interprétations
actuelles (dans M) des expressions de T devient passée.
La hiérarchie de force des théories
Ces modèles successifs, séparés par des temps infinis, forment une succession
illimitée, reflétée par une une hiérarchie illimitée de théories qui les décrivent
respectivement. Cette hiérarchie sera évoquée en termes d'une comparaison de
force entre les théories (ce qui forme un
préordre).
A savoir, une théorie A est dite plus forte qu'une théorie B
si (une copie de) B peut être trouvée
contenue dans A ou un développement possible de A; elles sont de
même force si cela vaut aussi vice-versa. En effet, les développements ne sont que
des "mouvements finis" négligés par le concept de force qui vise à ne retenir que
les "mouvements infinis". (Une autre définition de l'ordre de force, souvent mais
peut-être pas toujours équivalente, viendra en 1.C).
De nombreuses forces seront représentées par des versions de la théorie des
ensembles, nous permettant ainsi d'appeler des «univers» ces modèles successifs.
Ainsi, toute théorie des ensembles visant à décrire un univers de «tous les objets
mathématiques», ce n'est à chaque instant que le «tout» actuel, fait de notre passé;
tandis que cette description elle-même forme autre chose au-delà de ce «tout».
Axiomes renforçants de la théorie des ensembles
Alors que notre étude se concentrera sur les théories des ensembles acceptant
d'autres notions que les ensembles (comme annoncé en 1.4), la différence avec
les théories des ensembles traditionnelles (dont les seuls objets sont des ensembles)
peut être ignorée, car toute bonne théorie des ensembles formalisée à notre manière
est de même force qu'une avec seulement des ensembles, et de même vice versa.
Nos théories des ensembles, au-delà de leur liste commune de symboles et d'axiomes
de base "nécessaires" (2.1 et 2.2), différeront principalement par leur force, selon
leurs choix d'axiomes renforçants optionnels (parfois accompagnés de symboles
primitifs), dont le rôle sera encore commenté
en 1.D et 2.C. Les principaux axiomes renforçants sont:
- Infini (4.4) : il existe un ensemble infini, ou de façon équivalente
un ensemble ℕ des entiers naturels;
- Le schéma de compréhension revient à généraliser l'usage du
symbole de compréhension
à des prédicats unaires A définis à l'aide de quantificateurs ouverts.
Mais cela revient à reconnaître l'univers et les autres classes comme sortes
d'ensembles (bien que pas des objets d'un même type) et cache la dépendance
possible du résultat à l'égard de l'univers (domaine de tous les objets), qui sera
souvent conçu comme variable (2. A). Ces bizarreries sont généralement limitées
en rejetant la notation du symbole de compréhension comme inappropriée, laissant
cela comme un schéma d'axiomes
(∀A)∀SetE, ∃SetF, ∀x,
x ∈ F ⇔ (x∈E ∧ A(x))
- Hors de la portée de cette introduction, le schéma de Collection implique
le schéma de Remplacement, qui implique le schéma de Compréhension, avec
des réciproques possibles dépendant d'autres axiomes.
- L'ensemble des
parties (2.7)
Les principales théories fondatrices
En introduction simplifiée, voici quelques-unes des principales théories fondatrices
(toutes des théories du premier ordre, même "l'arithmétique du second ordre"), ordonnées par
force croissante (tandis que des infinités d'autres forces existent également entre elles et au-delà).
- Appelons théories d'objets finis (FOT = finite object theory)
les 3 théories suivantes de même force
- Arithmétique du premier ordre
(Z1), réduisant l'induction à un schéma d'axiomes par élimination universelle de second
ordre.
- Théorie des ensembles finis (FST = Finite Set Theory), avec schéma de
compréhension et négation de l'infini
- Théorie des théories (TT).
- Plusieurs sous-systèmes
de l'Arithmétique du second ordre, équivalents à des versions de la théorie des ensembles
permettant des résultats successivement plus élaborés des mathématiques ordinaires (analyse ...);
la Théorie des modèles (MT), qui peut interpréter toutes les expressions dans tous
les systèmes dénombrables (= formés de ℕ avec des structures quelconques données
comme ensembles), est une des plus faibles;
- Arithmétique du second ordre (Z2), formalisable en théorie des ensembles
avec Infini et Compréhension (le remplacement le rend-il plus fort?), ou (de manière presque
équivalente mais dans un formalisme différent) l'infini et l'ensemble des
parties de seulement ℕ;
- La théorie des ensembles de Mc Lane, avec l'infini et l'ensemble des
parties, est celle confortable pour la plupart des besoins;
- La théorie des ensembles de Zermelo est légèrement plus forte, avec
infini, ensemble des parties et compréhension.
- La théorie des ensembles de Zermelo-Fraenkel (ZF) est beaucoup plus forte,
avec infini, ensemble des parties et Remplacement; elle implique Collection.
La partie la plus difficile de la preuve de Gödel de ses fameux théorèmes d'incomplétude
était de développer TT à partir de Z1, de sorte que les résultats d'incomplétude
initialement prouvés pour TT affectent également Z1. Cette difficulté peut être
ignorée en se concentrant sur TT et FST, en ignorant Z1. Développer TT à
partir de FST est facile (une fois que TT est formalisé), mais les développer à
partir de Z1 est plus difficile. Une solution est de développer la version
"ensembles seuls" de FST à partir de Z1 en définissant le prédicat BIT (en guise de ∈)
et en prouvant ses propriétés de base; la difficulté de le faire peut être évitée
en les acceptant comme primitifs.
Other languages:
EN : 1. First foundations of
mathematics : Time
in model theory