L’objectif collecte un éventail de rayons à partir de chaque point objet et image le faisceau de rayons au niveau du plan focal avant de l’oculaire. Les règles classiques du tracé des rayons s’appliquent à la formation de l’image. En l’absence d’aberration, les rayons géométriques forment une image ponctuelle de chaque point objet. En présence d’aberrations, chaque point objet est représenté par un point indistinct. L’oculaire est conçu pour former l’image des rayons vers un point focal situé à une distance convenable pour la visualisation de l’image. Dans ce système, la luminosité de l’image est déterminée par la taille des ouvertures des lentilles et par l’ouverture de la pupille de l’œil. La distance focale et le grossissement résultant de l’objectif doivent être choisis pour obtenir la résolution souhaitée de l’objet à une taille convenant à l’observation à travers l’oculaire. La formation de l’image dans le microscope est compliquée par la diffraction et l’interférence qui ont lieu dans le système d’imagerie et par l’obligation d’utiliser une source de lumière qui est imagée dans le plan focal.
La théorie moderne de la formation des images au microscope a été fondée en 1873 par le physicien allemand Ernst Abbe. Le point de départ de la théorie d’Abbe est que les objets dans le plan focal du microscope sont éclairés par une lumière convergente provenant d’un condenseur. La lumière convergente provenant de la source peut être considérée comme une collection de nombreuses ondes planes se propageant dans un ensemble spécifié de directions et superposées pour former l’éclairage incident. Chacune de ces ondes planes effectives est diffractée par les détails du plan de l’objet : plus la structure détaillée de l’objet est petite, plus l’angle de diffraction est grand.
La structure de l’objet peut être représentée comme une somme de composantes sinusoïdales. La rapidité de variation dans l’espace des composantes est définie par la période de chaque composante, ou la distance entre les pics adjacents de la fonction sinusoïdale. La fréquence spatiale est l’inverse de la période. Plus les détails sont fins, plus la fréquence spatiale requise des composantes qui représentent les détails de l’objet est élevée. Chaque composante de fréquence spatiale produit une diffraction à un angle spécifique dépendant de la longueur d’onde de la lumière. À titre d’exemple, les composantes de fréquence spatiale ayant une période de 1 μm auraient une fréquence spatiale de 1 000 lignes par millimètre. L’angle de diffraction d’une telle composante pour une lumière visible d’une longueur d’onde de 550 nanomètres (nm ; 1 nanomètre vaut 10-9 mètre) sera de 33,6°. L’objectif du microscope recueille ces ondes diffractées et les dirige vers un plan image, où l’interférence entre les ondes diffractées produit une image de l’objet.
Parce que l’ouverture de l’objectif est limitée, toutes les ondes diffractées de l’objet ne peuvent pas être transmises par l’objectif. Abbe a montré que plus le nombre d’ondes diffractées atteignant l’objectif est important, plus les détails pouvant être reconstitués dans l’image sont fins. Il a désigné le terme d’ouverture numérique (A.N.) comme la mesure de la capacité de l’objectif à collecter la lumière diffractée et donc aussi de son pouvoir de résolution des détails. Sur cette base, il est évident que plus le grossissement de l’objectif est important, plus l’ouverture numérique requise de l’objectif est grande. Le plus grand N.A. théoriquement possible dans l’air est 1,0, mais les contraintes de conception optique limitent le N.A. qui peut être atteint à environ 0,95 pour les objectifs secs.
Pour l’exemple ci-dessus d’un spécimen avec une fréquence spatiale de 1 000 lignes par millimètre, le N.A. requis pour collecter la lumière diffractée serait de 0,55. Ainsi, un objectif de 0,55 N.A. ou plus doit être utilisé pour observer et collecter des données utiles à partir d’un objet dont les détails sont espacés de 1 μm. Si l’objectif a un N.A. inférieur, les détails de l’objet ne seront pas résolus. Les tentatives d’agrandissement des détails de l’image par l’utilisation d’un oculaire de forte puissance ne produiront aucune augmentation de la résolution. Cette dernière condition est appelée grossissement à vide.
La longueur d’onde de la lumière est raccourcie lorsqu’elle se propage dans un milieu dense. Afin de résoudre les plus petits détails possibles, les objectifs à immersion sont capables de collecter la lumière diffractée par des détails plus fins que ne le peuvent les objectifs dans l’air. Le N.A. est multiplié par l’indice de réfraction du milieu, et des N.A. de travail de 1,4 sont possibles. Dans les meilleurs microscopes optiques, il est possible d’observer des structures dont la fréquence spatiale est aussi petite que 0,4 μm. Notons que les lentilles simples fabriquées par Leeuwenhoek se sont révélées capables de résoudre des fibrilles de seulement 0,7 μm d’épaisseur.