Obiectivul colectează un evantai de raze din fiecare punct obiect și imaginează mănunchiul de raze în planul focal frontal al ocularului. Regulile convenționale de trasare a razelor se aplică la formarea imaginii. În absența aberațiilor, razele geometrice formează o imagine punctiformă a fiecărui punct obiect. În prezența aberațiilor, fiecare punct obiect este reprezentat de un punct indistinct. Ocularul este proiectat pentru a crea o imagine a razelor într-un punct focal aflat la o distanță convenabilă pentru vizualizarea imaginii. În acest sistem, luminozitatea imaginii este determinată de dimensiunile deschiderilor lentilelor și de deschiderea pupilei ochiului. Distanța focală și mărirea rezultată a obiectivului trebuie să fie alese pentru a obține rezoluția dorită a obiectului la o dimensiune convenabilă pentru vizualizarea prin ocular. Formarea imaginii la microscop este complicată de difracția și interferența care au loc în sistemul de formare a imaginii și de cerința de a folosi o sursă de lumină care să fie imaginată în planul focal.
Teoria modernă a formării imaginii la microscop a fost fondată în 1873 de către fizicianul german Ernst Abbe. Punctul de plecare al teoriei lui Abbe este că obiectele din planul focal al microscopului sunt iluminate de lumina convergentă de la un condensator. Lumina convergentă de la sursă poate fi considerată ca o colecție de mai multe unde plane care se propagă într-un set specific de direcții și se suprapun pentru a forma iluminarea incidentă. Fiecare dintre aceste unde plane efective este difractată de detaliile din planul obiectului: cu cât structura detaliată a obiectului este mai mică, cu atât mai mare este unghiul de difracție.
Structura obiectului poate fi reprezentată ca o sumă de componente sinusoidale. Rapiditatea de variație în spațiu a componentelor este definită de perioada fiecărei componente, sau de distanța dintre vârfurile adiacente ale funcției sinusoidale. Frecvența spațială este reciproca perioadei. Cu cât detaliile sunt mai fine, cu atât mai mare este frecvența spațială necesară a componentelor care reprezintă detaliile obiectului. Fiecare componentă de frecvență spațială produce difracție la un unghi specific care depinde de lungimea de undă a luminii. Ca exemplu, componentele de frecvență spațială care au o perioadă de 1 μm ar avea o frecvență spațială de 1 000 de linii pe milimetru. Unghiul de difracție pentru o astfel de componentă pentru lumina vizibilă cu o lungime de undă de 550 nanometri (nm; 1 nanometru este 10-9 metru) va fi de 33,6°. Obiectivul microscopului colectează aceste unde difractate și le direcționează către un plan de imagine, unde interferența dintre undele difractate produce o imagine a obiectului.
Pentru că deschiderea obiectivului este limitată, nu toate undele difractate de la obiect pot fi transmise de obiectiv. Abbe a arătat că, cu cât numărul de unde difractate care ajung la obiectiv este mai mare, cu atât mai fine sunt detaliile care pot fi reconstruite în imagine. El a desemnat termenul de deschidere numerică (A.N.A.) ca măsură a capacității obiectivului de a colecta lumina difractată și, prin urmare, și a puterii sale de a rezolva detaliile. Pe această bază, este evident că, cu cât este mai mare mărirea obiectivului, cu atât este mai mare A.N. necesară a obiectivului. Cel mai mare N.A. teoretic posibil în aer este 1,0, dar constrângerile de proiectare optică limitează N.A. care poate fi obținut la aproximativ 0,95 pentru obiectivele uscate.
Pentru exemplul de mai sus al unui specimen cu o frecvență spațială de 1.000 de linii pe milimetru, N.A. necesar pentru a colecta lumina difractată ar fi de 0,55. Astfel, trebuie utilizat un obiectiv de 0,55 N.A. sau mai mare pentru a observa și colecta date utile de la un obiect cu detalii distanțate de 1 μm. În cazul în care obiectivul are un N.A. mai mic, detaliile obiectului nu vor fi rezolvate. Încercările de a mări detaliile imaginii prin utilizarea unui ocular de mare putere nu vor duce la o creștere a rezoluției. Această ultimă condiție se numește mărire în gol.
Lungimea de undă a luminii se scurtează atunci când aceasta se propagă printr-un mediu dens. Pentru a rezolva cele mai mici detalii posibile, obiectivele de imersie sunt capabile să colecteze lumina difractată de detalii mai fine decât o pot face obiectivele în aer. A.N.A. se înmulțește cu indicele de refracție al mediului și sunt posibile A.N.A. de lucru de 1,4. În cele mai bune microscoape optice, pot fi observate structuri cu o frecvență spațială de până la 0,4 μm. Rețineți că s-a demonstrat că lentilele simple realizate de Leeuwenhoek sunt capabile să rezolve fibrile cu o grosime de numai 0,7 μm.
.