28 novembre 2024 ⋅ Retour à l'accueil du blog
Dans ce troisième épisode de ma série sur la théorie des types (épisode précédent), je définis la notion de système de typage pur — en abrégé PTS, pour pure type system —, qui permet de présenter de manière unifiée un grand nombre de théories des types. Le but est de pouvoir ensuite parler du paradoxe de Girard dans le cadre des PTS.
À ce stade, j'invite fortement le lecteur non-averti, avant de prendre connaissance de la définition, à prendre une feuille de papier et à essayer d'écrire les règles d'un système de déduction plausible pour un λ-calcul typé avec des types dépendants.
Donnons quelques indications pour retomber sur quelque chose de proche des PTS. On va se donner un jeu de sortes (à penser comme Prop
, Set
et les univers Type
en Coq). Chaque sorte pourra avoir un nombre quelconque de types possibles (donc possiblement aucun, et possiblement plusieurs), qui seront d'autres sortes, et comme on cherche à donner une définition assez générale, on va prendre en paramètre du PTS un ensemble d'axiomes de sorte , dont les paires se comprennent comme « est de type ».
Il faudra aussi pouvoir former des produits dépendants. À nouveau, on ne va pas chercher à fixer les choses pour rester général, donc on va prendre un ensemble de règles , où la règle signifie que le type produit dépendant (ou, en notation Coq, forall x : T, U
) sera typé par la sorte lorsque et sont respectivement typés par les sortes et .
Avec ceci, vous devriez avoir tous les éléments. Vraiment, faites-le ! Il n'y a rien de plus instructif que de se forcer à se poser cette question pour se rendre compte des subtilités en jeu.
Une fois que vous avez fait cet exercice, vous pouvez comparer avec cette définition :
Définition. On fixe un ensemble de variables (infini dénombrable). On se donne :
On définit inductivement les termes du λΠ-calcul par la grammaire de termes :
Les jugements de typage seront de la forme , où et sont des termes, et le contexte de typage est une liste (ordonnée) d'hypothèses également de la forme .
La substitution de par dans est définie de la manière usuelle ( et lient une variable) et notée . La β-équivalence est aussi définie comme usuellement (les Π ne créent pas de nouveaux rédexs) et notée .
Le système de typage pur associé à est défini sur les termes par les règles de déduction suivantes, où implicitement désigne une variable, une sorte, et un terme. (Ces règles ignorent volontairement et allègrement tous les problèmes de variables libres et liées, qui sont très peu intéressants.)
Cette définition mérite quelques commentaires.
La règle d'application et la règle de produit dépendant ne devraient pas contenir de surprise majeure. La règle de λ-abstraction non plus, mais il faut tout de même faire attention à ne pas écrire
Cette règle n'est pas bonne parce que même si type dans la sorte , et type dans la sorte sous l'hypothèse supplémentaire , rien ne garantit que le produit dépendant soit bien typé, car il n'y a possiblement aucune règle dans de la forme pour une troisième sorte : on ne peut pas former de produits dépendants arbitraires, les règles peuvent imposer des restrictions sur la quantification.
Bien que cette présentation soit standard, l'algorithme de typage qu'on en extrait immédiatement est terriblement inefficace, à cause de la formulation des règles d'axiome, de variable et d'affaiblissement. Telles que je les ai écrites, tous les types dans le contexte n'arrêtent pas d'être revérifiés en permanence. Par exemple, prenons un terme tout simple :
où comme d'habitude dénote lorsque n'apparaît pas dans , et en supposant que les axiomes et règles permettent de typer ce terme (peu importe à ce stade). Donnons-nous un contexte de départ où est une sorte quelconque. Voici la manière dont il va être typé en (je n'ai même pas le courage de dessiner l'arbre de dérivation) :
La règle de λ-abstraction va vérifier que est bien typé dans (pas de problème), puis va vérifier que est bien typé dans le contexte (et enfin vérifier que les sortes permettent d'écrire le produit ),
On applique de nouveau la règle de λ-abstraction, deux fois, pour se retrouver à typer dans le contexte ,
On utilise deux fois la règle d'application pour se retrouver finalement avec trois sous-arbres à construire, pour vérifier , et où ,
Et ici, on comprend qu'il y a plus de travail que ce à quoi on s'attendrait. Pour dériver , on est obligé d'appliquer deux fois la règle affaiblissement, en vérifiant que et sont bien typés. On se ramène à dériver , mais pour cela, il faut vérifier que pour une certaine sorte , et ceci se fait par de nouvelles applications de la règle produit suivies d'affaiblissements, axiomes et variables. Et ce n'est pas fini ! Il reste encore et , où on doit refaire plus ou moins le même travail…
Bref : à chaque variable ou sorte, on revérifie que tout le contexte entier est bien typé (et ceci récursivement…), et c'est une (très) mauvaise idée du point de vue algorithmique. En plus, telles quelles, les règles ne sont même pas déterministes, parce que l'affaiblissement peut s'appliquer à divers endroits (si je veux typer dans un contexte dont la dernière variable n'apparaît pas dans , je peux soit typer et dans ce contexte, avec des affaiblissements dans chacune des deux dérivations, soit appliquer maintenant l'affaiblissement et ainsi économiser des affaiblissements plus tard).
Bien que la présentation précédente soit standard, il est donc sans doute préférable d'utiliser ce style de présentation :
Ici, il n'y a plus d'affaiblissement, la règle axiome accepte un contexte arbitraire à gauche, et la règle variable ne demande plus forcément que la variable soit la dernière dans le contexte mais accepte des hypothèses supplémentaires qui la suivent.
Il est facile de se convaincre que le jugement est dérivable dans ce nouveau système de règles si et seulement s'il était dérivable dans le précédent. Ceci est le cas parce que les règles qui introduisent de nouvelles variables dans le contexte, à savoir la λ-abstraction et le produit dépendant, ne le font qu'après avoir vérifié que leur type était lui-même bien typé. Néanmoins, il n'y a pas équivalence entre les deux, ceci parce que le nouveau système autorise, par exemple, les jugements , où est un terme quelconque possiblement intypable. Le précédent obligerait à typer dans l'application de la règle affaiblissement qui dérive ce jugement de . De même, serait rejeté, d'une manière légèrement différente : la règle variable demanderait de dériver (pour une sorte quelconque), et ceci ne pourrait se faire qu'à partir de la règle axiome, mais celle-ci ne dérive que , donc pour passer à , il faut appliquer l'affaiblissement, qui à nouveau rejette .
Bref : le but de ces restrictions sur les règles axiome et variable et de la règle affaiblissement est d'empêcher de dériver des jugements dans des contextes mal typés, mais ceci se fait au prix d'une revérification constante des contextes partout, donc il vaut sans doute mieux s'en passer, ou alors introduire les règles selon ma deuxième présentation, puis séparément introduire une notion de bien-formation d'un contexte.
Au passage, cette nouvelle présentation a le bon goût d'être beaucoup plus déterministe. La règle à appliquer sur un terme est entièrement déterminée par sa forme… sauf pour la règle de conversion, dont il faut justement que je discute.
Une discussion récente m'a fait prendre conscience du fait que le concept d'égalité définitionnelle, qui est absolument fondamental en théorie des types, n'est sans doute pas souvent expliqué dans les cours d'assistants de preuve ni de λ-calcul, donc il vaut sans doute la peine que j'en dise quelques mots.
Pour illustrer à quel point ce concept est essentiel, on va typiquement définir exists x : X, P x
comme un type inductif qui en Coq se note @ex X P
, donc par exemple exists x : nat, x = 0
est une notation pour @ex nat (fun x => x = 0)
, et si on veut prouver cette proposition, il faut donner un témoin et une preuve que le témoin satisfait la proposition, soit un x
et une preuve de P x
: en l'occurrence, un x : nat
et une preuve de (fun x => x = 0) x
, et on peut évidemment choisir 0 : nat
, mais encore faut-il prouver, non pas 0 = 0
, mais bien (fun x => x = 0) 0
. Encore faut-il pouvoir simplifier ce type (fun x => x = 0) 0
en 0 = 0
pour pouvoir en exhiber un habitant.
Fondamentalement, l'égalité « normale », celle qui est visible, celle dont on parle quand on écrit 0 = 0
, et qui s'appelle l'égalité propositionnelle, va être définie par un constructeur de type (en Coq, @eq_refl : forall (X : Type) (x : X), x = x
). Si on imagine une version de Coq qui ressemble à la définition des PTS ci-dessus mais sans la règle de conversion, le terme @eq_refl nat 0
va être de type 0 = 0
par deux utilisations de la règle application, mais d'aucun autre type.
On peut tout à fait imaginer un système de typage où ces égalités doivent être prouvées à la main (par exemple, on aurait une règle qui déduit sans hypothèse). D'ailleurs, c'est à peu près ce qui se passe, disons, en logique du premier ordre : on a des axiomes comme dans une théorie comme l'arithmétique de Peano, et à chaque fois qu'on veut prouver une égalité, il faut la déduire d'un axiome. Mais dans un vrai assistant de preuve, ce serait incroyablement fastidieux (encore plus que l'égalité ne l'est déjà en Coq…).
Il est donc très tentant, et on le fait toujours, d'ajouter une règle de conversion de la forme
où la notation signifie que et sont « définitionnellement égaux » dans le contexte .
On peut mettre plus ou moins de choses dans l'égalité définitionnelle. Dans les PTS, c'est simplement la β-équivalence, mais en général, elle peut dépendre du contexte .
En regardant cette règle avec les lunettes de Curry-Howard, on obtient « deux propositions définitionnellement égales sont équivalentes », ce qui n'est pas habituel dans les systèmes logiques les plus usuels pour les mathématiciens, essentiellement la logique du premier ordre et la logique d'ordre supérieur.0 Ce type de règle porte un nom, c'est la déduction modulo, et vu que je viens d'expliquer qu'il s'agit de rendre le système utilisable en pratique, il n'est sans doute pas si surprenant que la déduction modulo ait d'abord été étudiée dans le cadre de la démonstration automatique. C'est d'ailleurs l'origine du nom des solveurs SMT, acronyme de « satisfiabilité modulo théorie ». On peut faire de la déduction modulo en logique du premier ordre ou d'autres systèmes, par exemple en modifiant l'arithmétique de Peano pour changer les axiomes comme en règles d'égalité définitionnelle comme . Pour une introduction générale très lisible, cf. Deduction modulo theory de Gilles Dowek.
Pour qu'il soit décidable de vérifier si un terme est bien typé, il est essentiel que l'égalité définitionnelle soit décidable. Typiquement, on travaille avec un λ-calcul qui est fortement normalisant et confluent, donc tout terme a une unique forme normale, et deux termes sont β-équivalents si et seulement si leurs formes normales sont identiques. Si l'égalité définitionnelle est simplement la β-équivalence, il suffit donc de β-réduire jusqu'au bout les deux termes et de comparer les formes normales.
On peut ajouter des choses en plus dans cette égalité définitionnelle. Je peux mentionner trois extensions (dont j'espère reparler dans des billets futurs) :
Les let x := v in u
, qui peuvent différer de en ce que l'égalité définitionnelle entre et va être disponible pendant la vérification du typage de .
En Lean, la sorte Prop
possède l'indiscernabilité des preuves définitionnelle, c'est-à-dire que plutôt que d'ajouter un axiome comme on peut le faire en Coq (Axiom proof_irrelevance : forall (P : Prop) (p1 p2 : P), p1 = p2.
), deux termes du même type sont considérés comme définitionnellement égaux dès que leur type est une proposition. Malheureusement, comme expliqué dans la thèse de master de Mario Carneiro, la manière dont ceci est fait casse la normalisation forte et la décidabilité. En Coq, il existe depuis quelques années une sorte expérimentale SProp
parallèle à Prop
qui fait plus ou moins la même chose, mais avec des restrictions pour préserver normalisation et décidabilité.
Dans l'équipe Deducteam du LMF sont développés des outils comme Dedukti dont l'idée est de mettre énormément de choses dans l'égalité définitionnelle, y compris des règles de réécriture définies par l'utilisateur. (Par exemple, l'article Embedding Pure Type Systems in the lambda-Pi calculus modulo de Cousineau et Dowek précise comment traduire les PTS que j'ai présentés ici dans ce type de système.)
On peut aussi spécifier l'égalité définitionnelle par un système de déduction qui s'entremêle au typage plutôt que d'en être indépendant, ce qui peut permettre certaines extensions. C'est la « conversion typée », par opposition à la « conversion non-typée ». Cette réponse d'András Kovács sur StackExchange donne plus de détails.
Il faut avoir conscience que cette règle de conversion est essentiellement la seule source de complexité au sens calculatoire dans la vérification du typage. Si on retire la conversion de la définition des PTS ci-dessus, on constate qu'il n'y a qu'une règle qui peut s'appliquer à un terme, choisie en fonction de sa forme (sorte, variable, application, λ-abstraction ou produit dépendant). Le typage est alors décidable efficacement (en temps polynomial). Mais avec la règle de conversion, les choses sont toutes autres. Un exemple suffira :
Fixpoint fact (n : nat) := match n with 0 => 1 | S n' => (S n')*(fact n') end.
Check eq_refl : fact 101 = 101 * fact 100.
D'après les règles de typage de Coq, il devrait théoriquement accepter ce code, mais comme il est amené à calculer (en unaire !) pour décider l'égalité définitionnelle, il est probablement parti pour y mettre plus longtemps que l'âge de l'Univers.
En fait, on voit facilement que la complexité de la vérification du typage de Coq est minorée par n'importe quelle fonction définissable en Coq. En sachant que la force de Coq est comparable à celle de ZFC (probablement avec univers de Grothendieck, mais ne pinaillons pas entre le méga-giga-hyper-grand et le super-méga-giga-hyper-grand)… l'algorithme qui vérifie si un terme de Coq est à peu près imbattable dans la catégorie des algorithmes de complexité théorique inimaginable. Correction (4 décembre 2024) : En fait, la force de Coq est sans doute plus proche de la théorie des ensembles de Zermelo, mais c'est une question subtile, cf. les commentaires.
(Bien sûr, on peut aussi s'amuser à prouver en logique du premier ordre en calculant entièrement les deux côtés, simplement, cette fois, la longueur de la preuve devient proportionnelle à la longueur du calcul, donc on n'a pas cette explosion de complexité. En Coq, on peut aussi guider la réduction, en l'occurrence faire Definition fact_101_eq_fact_101 : fact 101 = 101 * fact 100. Proof. unfold fact. reflexivity. Defined.
)
Bref. Je digresse, mais je n'ai toujours pas donné un seul exemple concret de système de typage pur. L'exemple le plus connu de cette définition est une famille de huit systèmes qui forment le λ-cube de Barendregt. En partant du λ-calcul simplement typé, on peut rajouter trois extensions orthogonales, généralement résumées par : « termes dépendant de types », « types dépendant de termes », et « types dépendant de types ». Le nom « λ-cube » provient de la représentation graphique de ces extensions sous forme d'un cube dont chacun des huit λ-calculs est un sommet (figure ci-dessous prise sur Wikipédia).
Pour définir ces systèmes, on va poser , , et en considérant les huit possibilités pour
Intuitivement, va être la sorte des types de base (comme « entier » ou « booléen »), et va être la sorte des types eux-mêmes.
Commençons par le cas . Les seules λ-abstractions qu'on a le droit de former sont où et . Autrement dit, les fonctions ne peuvent que traiter des éléments des types de bases, par des types eux-mêmes.
On vérifie par des récurrences immédiates que si alors ne contient pas de produit dépendant () tandis que ne contient pas de λ-abstraction ni d'application, et que si le produit dépendant type, alors ne figure nulle part dans . Bref : les termes dans la sorte sont des λ-termes usuels, les termes dans le type (donc la sorte ) sont des types simples, avec seulement des types primitifs (on met dans le contexte) ou des types fonction non dépendants (), et on reconnaît le λ-calcul simplement typé et ses trois règles
Rajoutons maintenant les extensions annoncées. Je commence par les types dépendant de termes, qui correspondent bien à ce que l'on appelle « types dépendants ». On prend ici . On peut maintenant écrire où et (sous ) , et en particulier où et . Du point de vue logique, ceci correspond au passage de la logique propositionnelle à la logique du premier ordre. Par exemple, on peut se donner le contexte :
pour représenter les débuts de l'arithmétique de Peano, et l'axiome . Noter que l'on ne peut pas exprimer le schéma de récurrence, qui serait
car vit dans , donc on n'a pas le droit de quantifier dessus. Ce n'est pas une surprise au vu du fait qu'on ne peut pas non plus exprimer le schéma de récurrence par une unique formule du premier ordre, pour essentiellement la même raison.
Dans une autre direction, on peut rajouter les termes qui dépendent de types avec . On peut donc écrire où (sous ) . Par exemple, devient valide et habité par . Du point de vue logique, la quantification sur correspond à la logique du second ordre propositionnelle (l'exemple précédent est une preuve de ), et on retrouve le système F de Girard et Reynolds. (À nouveau, pour vérifier l'équivalence avec la présentation usuelle, il faut faire des tas de petites récurrences.)
La dernière extension, types dépendant de types, , n'est pas si intéressante pour elle-même. Elle permet de mettre dans le contexte des choses comme qui se comprennent comme des constructeurs de types paramétrés (comme list
). Elle devient un peu plus intéressante en combinaison avec les termes qui dépendent de types du système F (c'est le système Fω).
Enfin, en combinant tout, avec , on obtient le système appelé calcul des constructions — du moins l'une de ses variantes, parce qu'évidemment, ce ne serait pas drôle si tous étaient d'accord sur le sens de l'expression « calcul des constructions ».
Quelques propriétés qui sont ou ne sont pas vérifiées dans les PTS :
L'autoréduction est vérifiée : Si et alors . C'est une récurrence directe.
L'inverse n'est pas vrai : si et , alors on n'a pas forcément . Ceci est déjà faux pour le λ-calcul simplement typé, par exemple en prenant , mais la nouveauté par rapport au λ-calcul simplement typé est que même si est typable, ce n'est toujours pas vrai. Par exemple, prenons , où et sont des termes quelconques tels que , et . À condition de disposer d'un axiome , on a . Mais pour avoir , il faut typer dans , ce qui nécessite d'avoir une règle . Il est possible que cette règle soit absente, mais que l'on ait par contre une autre sorte avec un autre axiome et une règle , ce qui fait typer et ainsi que mais pas .
L'unicité des types n'est pas forcément vérifiée : il se peut que et avec non définitionnellement égaux. Par exemple, si contient les axiomes et avec , alors est à la fois de type et de type . Néanmoins, l'unicité des types est vérifiée pour les PTS qui sont fonctionnels, au sens où pour tout , il existe au plus un tel que , et pour tous , il existe au plus un tel que .
La normalisation forte est vraie pour les systèmes du λ-cube, mais en général, elle n'est pas toujours vérifiée… j'y reviendrai.
J'espère que cette courte introduction sera suffisante pour comprendre le futur billet sur le paradoxe de Girard.
Pour plus de renseignements, je peux renvoyer vers le livre de Barendregt Lambda Calculi with Types (1992, collection Handbook of Logic in Computer Science), qui commence par une introduction générale classique au λ-calcul (syntaxe, réduction, développements finis, confluence, réduction de tête, standardisation, arbres de Böhm, entiers de Church, …), et se termine par un chapitre détaillé sur les systèmes de typage pur. (Attention à ne pas le confondre avec Lambda Calculus with Types, ouvrage collectif dirigé entre autres par le même auteur, et qui n'a pas du tout le même contenu.)
Je termine sur une conjecture qui est, semble-t-il, le graal du domaine, et qu'il paraît difficile de ne pas mentionner :
Conjecture de Barendregt-Geuvers-Klop : Si un système de typage pur est faiblement normalisant, alors il est fortement normalisant.
Parce que, c'est bien connu, il n'y a que les informaticiens qui savent comment sont vraiment faites les preuves mathématiques, les mathématiciens en sont complètement ignorants. Je plaisante à peine : voyez le nombre de cours de logique pour matheux qui s'en tiennent à la déduction en style de Hilbert alors qu'on connaît infiniment mieux depuis que Gentzen a inventé la déduction naturelle il y a presque 100 ans. Fin du sarcasme. Pour être plus sérieux, il est vrai que pour étudier la théorie des modèles ou la théorie des ensembles, le système de déduction n'a aucune espèce d'importance.
# Commentaire de Gro-Tsen (3 décembre 2024 à 19:22)
« La force de Coq est comparable à celle de ZFC » → Alors, non, je ne crois vraiment pas. J'avais essayé de résumer les choses dans un vieux billet de mon blog, auquel je viens d'ailleurs d'ajouter un lien vers une réponse de Loïc Pujet sur le StackExchange des assistants de preuves qui répond à des questions analogues, et j'ajoute le disclaimer que tout ça est complètement confus et je m'y perds beaucoup (dans les résultats avec ou sans tiers exclu ou autre gimmick du même genre, sachant que le tiers exclu augmente beaucoup la force de certains systèmes de preuves mais pas de certains autres) et qu'en plus j'ai oublié des choses que j'avais comprises il y a 10 ans, mais de ce que je comprends, la force logique de Coq sans tiers exclu est plutôt comparable à diverses variations de la théorie des ensembles de Zermelo, et pas du tout de ZFC. Dans “Sets in Types, Types in Sets”, Werner obtient bien des choses comparables à ZFC, mais c'est en ajoutant des axiomes qui sont une version à peine déguisée de l'axiome de Remplacement.
Il faut bien se dire que l'axiome de Remplacement, c'est une sorte d'axiome de grand cardinal (qui, je ne sais pas pourquoi, est devenue standard) : en gros elle dit « la classe des ordinaux est un cardinal inaccessible », et c'est vraiment fort, en fait.
Je ne crois pas qu'on sache faire quoi que ce soit qui ressemble à ZFC en force logique (sans parler des différentes saveurs de grands cardinaux qu'on sait y ajouter) et qui ne soit pas essentiellement une transposition de ZFC dans des termes à peine déguisés. C'est un peu mystérieux : il n'y a que sur des fondements ensemblistes qu'on arrive à justifier des résultats arithmétiquement très forts (et qu'on pense vrais, évidemment). En tout cas, Coq est loin du compte (sauf s'il y a eu des développements que j'ignore).
# Commentaire de Jean Abou Samra (4 décembre 2024 à 01:51)
Tu as raison, je vais corriger ça.
Je suis beaucoup moins fort que je le voudrais en théorie des ensembles, et je n'ai que très rapidement survolé le papier, donc je dis possiblement des bêtises, mais où est-ce que tu vois des axiomes qui ressemblent au remplacement ? Je ne vois que et page 10, qui sont des variantes de l'axiome du choix, non ? (Il sont trivialement impliqués par l'axiome du choix global tel que défini au billet précédent.)
À noter que si la force logique de Coq avec tiers exclu ou carrément avec un avatar du choix est une question intéressante en soi, en l'occurrence ça ne va rien changer parce que je parlais uniquement de complexité de la normalisation, donc on se fiche des axiomes qui peuvent être ajoutés vu qu'ils ne viennent pas avec des règles de réduction (ils cassent la canonicité).
Et au passage, j'avoue que je partage ta perplexité sur l'axiome du remplacement. Pour être honnête, autant je crois fermement à l'axiome du choix, dans une vision platonicienne assumée de la hiérarchie cumulative (même si les maths sans l'axiome du choix m'intéressent, pour des raisons analogues à celles qui rendent les maths constructives intéressantes à mes yeux bien que je croie au tiers exclu), autant je ne suis pas parfaitement sûr à 100% de croire platoniquement à l'axiome du remplacement. Quant à la logique qu'implémente Coq, je n'ai pas les idées très claires là-dessus.
# Commentaire de Gro-Tsen (4 décembre 2024 à 15:43)
Ce n'est pas non plus clair pour moi pourquoi l'axiome TTDA implique Remplacement/Collection, mais Werner dit que c'est le cas (“the encoding of the following collection scheme can be proved in CIC, assuming TTDA” : comme CIC en soi n'est pas spécialement fort, c'est vraisemblablement que TTDA cache une forme de Remplacement de façon insidieuse sous le typage). Comme la preuve est renvoyée à un fichier Coq sans aucune explication supplémentaire, je n'ai pas vraiment envie de comprendre plus. Je suppose que c'est un peu comme Ensembles de Bourbaki, dont il y a une sorte de légende urbaine selon laquelle il omet l'axiome de Remplacement et est donc équivalent à la théorie des ensembles de Zermelo, alors qu'en fait le Replacement est insidieusement caché dans un des autres axiomes (Union, probablement).
Pour la force du Remplacement, notons quand même qu'IZF interprète ZF(C), donc il a la même force : si on veut bien considérer qu'IZF est constructif, la limitation n'est ainsi pas vraiment liée au problème d'être constructif ou pas mais plutôt d'être « ensembliste » ou pas. Mais c'est peut-être quand même aussi lié à la question de savoir si on peut définir correctement des ordinaux constructivement, et à ce que l'itération des ordinaux permet de faire (cf. cet article intéressant à ce sujet). Je n'ai pas les idées claires.
# Commentaire de Jean Abou Samra (4 décembre 2024 à 20:36)
Page 12 du papier, je vois :
où il explique que est censé se comprendre comme l'ensemble . Ensuite, il interprète les quantificateurs de ZFC par des
forall X : Set
etexists X : Set
. (C'est très « confusant » parce queSet
est normalement autre chose en Coq, mais ce ne l'était peut-être pas à l'époque, je ne sais pas.)On retrouve son code sur https://github.com/rocq-archive/zfc. C'est du Coq très vieux, mais ça m'a aidé à comprendre ce qu'il fait. Je me suis amusé à en refaire une partie de manière un peu différente :
Je définis le type des ensembles
V
comme lui, l'égalitéVeq
entre ensembles est l'égalité extensionnelle,Vin
modélise l'appartenance, et je prouve que l'égalité est une relation d'équivalence et que l'appartenance lui est compatible (toutes ces preuves sont triviales).La forme du schéma de remplacement que je prouve est :
Évidemment, comme c'est un schéma d'axiome, on ne peut pas l'encoder parfaitement en un seul théorème Coq, alors j'ai pris en hypothèse une fonction
phi : V -> V
: ça ne correspond à rien dans ZFC parce que l'univers est une classe propre, mais je pense que moralement, c'est bien ce qu'on cherche à modéliser. Si est une formule ensembliste telle que soit prouvable dans IZF (ou CZF ? je n'ai pas le temps de regarder les différences tout de suite), alorsforall x : V, exists! y : V, phi_rel x y
va être prouvable en Coq pour une traduction raisonnablephi_rel : V -> V -> Prop
de (parce que la traduction de chaque axiome est prouvable, je l'ai fait pour l'extensionnalité, je n'ai pas le courage de faire le reste), et il faut alors une variante du choix pour passer àphi : V -> V
. De plus, pourphi
obtenue de cette manière, l'hypothèsephi_respectful
va être prouvable grâce aux compatibilités que j'ai montrées. Tu noteras que le choix n'est nécessaire que pour passer dephi_rel
àphi
, et d'ailleurs il semblerait qu'on puisse en fait se contenter d'une variante du choix unique.Maintenant, dans la preuve de
replacement
, j'ai laissé au débutFail exists (sup V phi).
pour montrer, comme on peut s'y attendre, définir « » ne marche pas pour cause d'univers (carV
vit un univers au-dessus que l'argument de son constructeur). Sauf que comme l'ensembleA
est représenté par un type « support »X
et une fonctionf : X -> V
, on peut réutiliser ce supportX
en composant justef
parphi
, et le reste est trivial.Ma conclusion, c'est que je ne trouve pas que TTDA cache insidieusement une forme de remplacement, et j'ai plutôt l'impression que c'est la possibilité de définir ce type inductif
V
qui est puissante. Loïc Pujet dit que CCω se trouve strictement entre Z et ZF, mais ici on parle de CICω, et j'en déduis que CICω doit être nettement plus fort que CCω, whatever that means.# Commentaire de Jean Abou Samra (5 décembre 2024 à 02:25)
En fait, le HoTT Book fait précisément ce que j'ai fait ci-dessus, cf. théorème 10.5.8 (dans sa version courante à ce jour, first-edition-15-ge428abf).
# Commentaire de Jean Abou Samra (7 décembre 2024 à 14:35)
En vrac :
L'entrée de la Stanford Encyclopedia of Philosophy sur CZF et IZF mentionne aussi l'interprétation des ensembles en MLTT par un W-type, qui revient au même que ce type inductif en Coq (interprétation proposée par Aczel, cité par Werner). Ça me conforte dans l'idée que c'est vraiment cette possibilité de créer des W-types ou types inductifs qui est essentielle.
Je suis tombé aussi sur ce document. Pour le remplacement (page 15), il utilise manifestement une traduction qui transforme les de la théorie des ensembles en du côté théorie des types. À méditer…
# Commentaire de Jean Abou Samra (13 décembre 2024 à 17:31)
J'ai posé une question précise avec plein de détails sur https://proofassistants.stackexchange.com/questions/4532/does-cic%cf%89-prove-conzf.
Laisser un commentaire