L’époque tourne sur des machines qui apprennent, et pourtant l’apprentissage lui-même reste caché derrière une API. Le voici à découvert, chaque étape à l’écran et s’exécutant entièrement dans votre navigateur : un réseau de neurones traçant une frontière de décision en temps réel, un agent tombant par hasard sur une récompense, l’attention décidant quel mot regarder, le bruit se résolvant en structure sous un modèle de diffusion. Pas de cloud, pas de clés — juste des gradients, des politiques et des probabilités, dessinés à mesure qu’ils se produisent.
Un treillis de Kohonen qui se froisse, s’étire et se drape sur n’importe quelle distribution de données — la découverte de topologie rendue visible.
Observez un agent d’apprentissage par renforcement tabulaire bâtir de zéro une politique de navigation — trébuchant dans les pièges, découvrant la récompense et gravant des flèches optimales dans chaque case de la grille.
Observez le neurone de Rosenblatt de 1958 tracer une ligne de décision à travers vos données, une correction à la fois.
Observez un réseau de neurones fait maison courber sa frontière de décision en temps réel à mesure qu’il apprend à séparer des nuages de points 2D par rétropropagation.
L’ancêtre de GPT — prédisez le prochain jeton à partir des quelques précédents et regardez la cohérence émerger à mesure que l’ordre augmente.
Observez l’algorithme de Lloyd découper un nuage de points en territoires de Voronoï vivants, tandis que les centroïdes traquent leurs grappes en temps réel.
Observez un motif bruité ou à demi effacé se rétablir vers une mémoire stockée, tandis qu’un réseau de neurones dévale la pente jusque dans un attracteur.
Cinq optimiseurs à base de gradient dévalent simultanément le même paysage de perte, révélant pourquoi Adam domine le SGD classique en vitesse, en stabilité et en sortie des points-selles.
Parcourez un espace sémantique fait main où roi − homme + femme tombe exactement sur reine, et où des grappes de sens éclosent en couleurs néon.
Observez un classifieur CART découper vos données 2D en régions alignées sur les axes — une division maximisant l’information à la fois.
Regardez ε-greedy, UCB1 et l’échantillonnage de Thompson rivaliser pour trouver le meilleur bras de la machine à sous — le regret cumulé tracé en direct à mesure que les algorithmes explorent et exploitent.
Observez un transformeur décider ce qu’il doit regarder — softmax(QKᵀ/√d) rendu tangible par des cartes de chaleur en direct et des flux d’attention bipartites.